【机器视觉×AI·系列#1】视频级小样本缺陷检测:SAM2 半自动标注 + YOLOv10 边缘实时化
栏目:机器视觉与AI · 作者:明扬资讯 · 适用:冲压/注塑/锻造/电子件外观 · 难度:中—高
一、为什么是“视频级小样本 + 边缘实时”
-
小样本刚需:外观缺陷类别多、分布稀疏,传统“先攒上万张再训练”的思路上线慢、换线更慢。
-
视频级标注效率:同一工位的视频连续性强,SAM2 支持点/框互动后沿时间传播分割,标注效率通常成倍提升。
-
端侧实时:线边相机+Jetson/工控机要在毫秒级给出结果,YOLOv10 这类端到端、免 NMS 的结构能显著压缩延迟。
一句话:用“更快的标注 + 更快的推理”打通数据闭环,把上线周期压到“天级”。
二、核心原理与整体流程
|
环节
|
做法
|
要点
|
|
采集
|
固定曝光与光源,采 3–5 段 20–60 秒视频;覆盖良品/疑难件/边界件。
|
优先稳定光学;缺陷更“像缺陷”,后续模型更省力。
|
|
半自动标注
|
在视频帧上用 SAM2 点/框互动,生成像素级掩膜并自动传播到相邻帧。
|
“人纠错、模型扩散”;一段视频只需少量交互。
|
|
标签转化
|
掩膜 → 检测框/实例分割双标签;合并到同一数据集。
|
兼顾检测速度与定位精度,后续替换更灵活。
|
|
模型训练
|
YOLOv10(n/s/m)做检测主线;必要时加一支轻量分割头。
|
小样本启用强数据增广与类别重加权;早停防过拟合。
|
|
边缘部署
|
导出 ONNX → TensorRT;INT8 量化(用少量代表性校准集)。
|
量化前后做 KPI 回归,ΔmAP 受控在可接受范围。
|
三、实例|汽车冲压件“擦伤/凹坑/拉伸纹”缺陷线边上线
背景:某冲压线换模频繁,历史样本少且分布变动;要求从导入到试运行 ≤ 5 天,并保持 ≥ 25 FPS。
数据与训练
-
视频采集:3 段各 40 秒,1080p@30fps;抽帧 + 连续段标注。
-
标注:SAM2 半自动分割,人工校正 300~500 帧,导出掩膜+框。
-
训练:YOLOv10-s 作为主干;增广含颜色扰动/镜头轻微偏摆;10~30 epoch 早停。
部署与指标(试点周)
吞吐
Jetson Orin NX(INT8)实测 30–40 FPS
检出率
对目标三类缺陷 mAP50≈0.85(试点口径)
误报控制
通过阈值+连帧一致性过滤降到可控水平
换模代价
补拍 200–400 张,增量微调半天内完成
线边策略:先用“检测框”上线保节拍;对关键工位再启用“实例分割”校核边界。
四、实施 SOP(可直接勾选)
-
光学固定化:统一相机角度、曝光与偏振;白底优先;避免随手调整焦距。
-
采集清单:良品≥60%,典型缺陷≥30%,边界件≥10%;每类至少 100 张或 20 秒视频片段。
-
半自动标注:先做 20% 样本的高质量掩膜,再在相邻帧传播与修正;形成标签审核清单。
-
训练对照:YOLOv10-n/s 双走线;设置早停;保留 10% 视频帧作验证集。
-
边缘量化:TensorRT FP16→INT8 两阶段;每次量化后用相同验证集回归 KPI。
-
上线验收:用“本周换模”作为压力测试,记录适配时长、检出率与误报率;保存“失败样本库”。
五、趋势判断与选型建议
-
数据工程优先级上移:视频级半自动标注将成为标配;数据治理能力比单模型精度更关键。
-
端到端与免 NMS:更少的后处理 = 更稳的延迟,适合线边实时;建议优先选这类结构。
-
检测+分割“双轨”并存:检测保节拍、分割保边界;两者标签一次生成、按需启用。
-
增量学习常态化:把“换线/换模”纳入周度微调计划,持续沉淀失败样本库与模板工程。
六、常见坑位与规避
|
问题
|
症状
|
处理
|
|
光学不稳定
|
同一缺陷忽明忽暗,召回忽高忽低
|
固定曝光/偏振;对高反光面做偏振片与补光角度优化
|
|
量化掉点
|
INT8 后小缺陷漏检
|
扩大校准集包含难样本;阈值下调 + 连帧一致性补偿
|
|
样本偏差
|
某类缺陷几乎不出现,模型忘记
|
周度补采;启用类别重加权/焦点损失,保证少数类被“看见”
|
|
过拟合
|
验证集 OK,上线后抖动大
|
拉长验证片段、增强光照/角度扰动;减少 epoch 或更强早停
|
七、交付物清单(建议)
-
《采集与标注规范.pdf》:相机/光学/曝光/标注操作指南。
-
《数据集结构与版本约定.md》:训练/验证/测试拆分、标签格式(检测+分割)。
-
《模型卡与量化回归表.xlsx》:FP16/INT8 指标对照、阈值与连帧参数。
-
《上线验收表.xlsx》:节拍、检出率、误报率、换模适配用时、失败样本链接。
© 明扬资讯 · 机器视觉×AI 系列|转载请注明来源
推荐阅读:
Photoneo 3D 视觉 + Kawasaki:重型刹车盘高负载箱拣三岛联动产线
多光谱 vs 高光谱:把“光谱指纹”搬上产线的选型路线图
案例|Delta 电子:用「数字孪生 + 合成数据 + 视觉 AI」重塑 AOI 与产线换型
案例|动力电池壳体激光焊缝的机器视觉+AI重构:把“抽检”变成“闭环控”
【机器视觉×AI·系列 】视频级小样本缺陷检测:SAM2 半自动标注 + YOLOv10 边缘实时化
【机器视觉与AI】AI驱动的智能视觉检测:赋能制造业高精度质检与自动化