在制造业的浪潮中,晨光圆珠笔以其年产量约50亿支的庞大规模,稳坐行业前列。然而,每一支笔的完美出品,背后都离不开严格的品质把控。在装盒包装之前,每一支笔都要接受细致的外观检查,以确保产品质量的无懈可击。但当前,这一品质检验环节还主要依赖人工完成,每条生产线都需要两名全检员轮班工作,这无疑增加了人力成本和管理复杂度。特别是在国内制造业面临用工紧张的背景下,生产成本的逐年上升已成为企业不得不面对的现实。
以国内第一支按动式中性笔晨光“K-35”为例,这款笔的年产量高达约数亿支,因此,品质检验的每一个环节都至关重要。面对如此大规模的生产需求和严苛的质量控制要求,如何有效降低人工成本、提升检验效率,同时保证产品质量,成为了晨光当前亟待解决的问题。
滑动查看更多图片
场景难点
目标复杂
目标小、频次低:要求检出的负样本目标占整图比例小、出现频次低,易造成误判和漏检;
相机成像不统一:现场生产环境复杂,多个相机成像效果无法做到完全一致,存在光学干扰因素;
样本不均衡
类别不均衡:类别数据分布不均衡,有些类别出现频次很高,另一些可能只有个位数;
类内差异大:即使是同一类别的目标也会有各式各样的形态;
推理速度要求高
NVIDIA Tesla T4机器上推理时间小于20ms,且在端测设备上可达到实时状态。
方案设计
该任务需要将晨光明星产品“K-35”揿动式中性笔的8类瑕疵位置定位并正确分类,非常适合选用目标检测模型作为解决方案。汇聚PaddleX优选的多个目标检测SOTA模型,星河零代码产线全新上线。本案例使用目标检测场景下的两条产线:通用目标检测和大模型半监督学习-目标检测,利用云端多卡V100算力,低成本零门槛解决了这一工业质检难题。
模型选型:PaddleX提供了3档6种SOTA检测模型,分别是高精度模型:RT-DETR-H;精度-效率均衡模型:RT-DETR-L、PP-YOLOE_plus-L;高效率模型:PP-YOLOE_plus-S、PicoDet-L、PicoDet-S,考虑到在该场景的模型部署在NVIDIA Tesla T4机器上,单模型推理时间要求是小于20ms,且在端侧部署可以达到实时状态,我们选择了PicoDet-L作为最终的模型方案。
零代码开发
数据校验
晨光提供的数据采用VOC标注格式,在零代码产线中支持将VOC格式数据集转换为COCO格式并做数据校验。经过数据校验我们可以得到如下结果,包含了数据集在训练集、验证集抽样的10个样本带标签可视化图,以及数据集的样本类别分布图。
模型训练
众所周知,超参数对模型精度的影响非常大,星河零代码产线将影响最大的一些超参数在前端展示了出来,方便用户调试。在目标检测任务上,当选择了合适的模型后,对精度影响最大的超参数是学习率和训练轮数,我们将这两个超参数作为了我们的调试选项。为了让我们的实验尽可能可靠准确,我们使用控制变量法进行了7组对比实验,并选定了合适的学习率(0.04)和训练轮数(100):
这样我们就得到了一个mAP@0.5为56.1%的中性笔的瑕疵检测模型。
性能调优
当前模型(mAP@0.5为56.1%)一定程度解决了业务的问题,但是一些较难的case(如目标较小或特征不明显)仍旧无法正确检出。为了让模型的精度进一步提升,我们采用大模型半监督学习-目标检测的方案。该方案可以利用大量无标注的数据,通过大小模型联合训练的方式学习更强的特征。为此,我们准备了3000张没有标注过的数据,将这些数据和之前有标注的数据按照数据格式要求重新组织后进行了调优训练。
我们选择高精度的大模型RT-DETR-H和先前迭代的小模型PicoDet-L,复用先前训练单模型的超参。经过8卡15个小时的训练,我们完成了大模型半监督学习-目标检测的训练,最终,大模型(RT-DETR-H)的mAP@0.5为81.2%,小模型(PicoDet-L)的精度为74.5%,小模型较之前提升18.4个百分点。
模型部署
星河零代码产线打通了模型部署流程,可以选择标记过的模型权重,一键部署为在线服务API,不仅可以在其他联网设备中调用API,也支持通过在线体验应用单图测试模型效果。
如需将模型部署到离线设备上,也可获取离线部署包。离线部署包中除了包括标记权重外,还包含了指定环境的示例代码,根据其中的示例文档即可在自己的设备上实现快速部署。
经实测中性笔瑕疵检测模型(PicoDet-L mAP@0.5为74.5%)的单模型推理时间可控制在10ms左右,在模型精度和速度方面都超出了场景要求。
如果想了解更详细方案细节,欢迎通过下方海报二维码预约4月18日场景范例直播课,手把手全流程教学等着你哦。
用户声音
不写一行代码就可以完成模型的全流程迭代和部署,而且这个过程竟然如此丝滑,完全超出了我们预期,更惊喜的是,竟然有大模型半监督学习这种神器,企业只需少量无标注的数据,精度竟然会有十几个点的提升,这相当于是直接省掉了我们很多提升模型精度的过程中各种繁杂的工作。未来将进一步在内部其他场景中使用和验证。
精彩课程预告
为了让小伙伴们更快速地了解应用范例教程,百度研发工程师将于4月18日(周四)19:00为大家深度解析从数据准备、数据校验、模型训练、性能调优到模型部署的开发全流程开发难点,从场景、产线、工具完成产业实操体验。赶快扫描下方海报二维码预约报名!
相关链接
云端体验地址:
https://aistudio.baidu.com/pipeline/mine
飞桨低代码开发工具交流频道链接:
https://aistudio.baidu.com/community/channel/610
官方文档:
https://ai.baidu.com/ai-doc/AISTUDIO/6lu57ycbb
文档场景信息抽取产线使用文档:
https://ai.baidu.com/ai-doc/AISTUDIO/Blu5jv0zm
通用目标检测产线使用文档:
https://ai.baidu.com/ai-doc/AISTUDIO/olu5jgrra
大模型半监督学习-目标检测产线使用文档:
https://ai.baidu.com/ai-doc/AISTUDIO/xlu5jtphu
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~