
本网讯(图/文 陈家乐)2026年5月12日,计算机与物联网学院智慧农业工程研究中心组织开展了线上科研研讨活动,主题为“基于Transformer的工业表面缺陷语义分割方法研究”。本次活动围绕工业视觉检测中的像素级缺陷定位问题展开,学院多位教师参加了交流。
活动中,汇报人陈家乐老师从工业质检场景出发,介绍了机器视觉在自动化生产线中的应用价值。针对人工检测速度慢、易疲劳、标准不一致和过程难追溯等问题,汇报指出,语义分割能够输出像素级缺陷mask,比分类和目标检测更适合裂纹、凹坑、刮纹等不规则缺陷的精细定位。随后,汇报结合DAGM2007、Kaggle和MT等数据集样例,分析了工业缺陷“小、淡、像、乱”的典型难点。
在技术分享环节,汇报人系统梳理了表面缺陷分割方法的发展脉络,介绍了从FCN、U-Net、DeepLab等CNN模型,到SETR、SegFormer、Swin、MaxViT等Transformer模型,再到Mask2Former、SAM及少标注学习方法的演进过程。汇报重点讲解了两类改进思路:一是通过CNN/FPN提取局部多尺度特征,结合MaxViT和动态稀疏注意力筛选关键token,增强弱缺陷响应并抑制背景噪声;二是采用分层多尺度特征融合与Cross Attention,对低层空间信息和高层语义信息进行对齐,提升真实缺陷识别和边缘完整性。
最后,与会教师围绕工业表面缺陷语义分割的发展趋势进行了交流讨论。大家认为,此次汇报内容层次清晰、案例具体,不仅加深了对CNN与Transformer互补关系、注意力机制和多尺度特征融合方法的理解,也为后续开展少标注学习、模型轻量化、跨产线泛化和工业检测系统集成等研究提供了有益参考。

官方微信
扫一扫