【YOLO目标检测全栈实战】90 YOLO模型的知识蒸馏：用小模型学大模型的“暗知识”-港品优选

去年秋天，我在深圳一家做智慧零售的创业公司做技术顾问。老张是他们的算法负责人，一个干了五年视觉的老手。

他遇到一个棘手问题：在NVIDIA Jetson Xavier NX上，YOLOv8m跑实时检测，帧率只有18FPS，而客户要求至少30FPS。他试过换成YOLOv8n，帧率上去了（42FPS），但mAP从52.3%掉到了38.7%，客户直接拒绝了验收。

“我试过剪枝、量化，效果都不理想。”老张在电话里叹气，“要是能把大模型的知识‘教’给小模型就好了。”

我说：“老张，你听说过知识蒸馏吗？就像老师傅带徒弟，大模型当老师，小模型当学生，把暗知识传递过去。”

两个月后，老张用知识蒸馏把YOLOv8n的mAP从38.7%提升到了48.1%，只比YOLOv8m低了4.2个百分点，但帧率稳定在38FPS。项目顺利验收。

很多同学在做模型轻量化时，会陷入一个误区：认为小模型只要用同样的数据训练，就能达到接近大模型的效果。这是错误的。

反例代码：直接训练YOLOv8n

# 错误做法：直接用小模型从头训练fromultralyticsimportYOLO

企业官网建设流程全解析