近日,在我院人工智能与机器视觉研究所张缓缓老师的指导下,课题组围绕人工智能核心技术——机器视觉方向持续开展探索性研究,并取得初步进展。相关工作陆续在国际权威期刊和高水平学术会议上发表,具体成果如下:
1. Song P(宋鹏生), Zhang H*(张缓缓), et al. DPANet: curve-like structure segmentation based on dual-path attention network. Expert Systems with Applications, 2025: 129030.(SCI中科院一区TOP,IF=7.5)
2. Liu M(刘明洋), Zhang H*(张缓缓), et al. DT-UNet: UNet empowered by dynamic snake convolution and transformer for printed fabrics defect segmentation. Measurement, 2025: 118984. (SCI中科院二区,IF=5.6)
3. Sun R(孙瑞), Zhang H*(张缓缓),et al. DSCA-YOLO: A Lightweight Wheat Head Detection Algorithm Based on Improved YOLOv7.(ICFTIC 2025国际会议)
上述成果的第一作者为我院2023级研究生宋鹏生、刘明洋与孙瑞。三位同学自加入科研团队以来,在张缓缓老师的指导下,参与到国家自然科学基金面上项目(No. 62573337)、陕西省科技计划项目(2024GX-YBXM-231)及陕西省教育厅重点项目(24JC036)的相关研究工作中。他们尝试从实际问题出发,聚焦机器视觉中的若干关键技术挑战,在算法设计、实验验证与模型优化等方面进行了初步探索,努力提升自身的科研思维与工程实践能力。
成果简要介绍如下:
论文1“DPANet: curve-like structure segmentation based on dual-path attention network” 针对曲线状结构在图像分割中易断裂、拓扑连通性差的问题,提出了一种基于双路径注意力机制的分割方法。该方法由全局多分支注意力机制、局部多层卷积和差分特征增强模块组成。全局多分支注意力机制通过三重注意力模块捕捉跨维度交互信息,并通过残差注意力保持图像原有信息,从而增强复杂场景中的分割精度。局部多层卷积模块通过残差注意力结合动态蛇卷积,有效捕捉局部细节,提升曲线图像的完整性和分割精度。差分特征增强模块通过逐层上采样和差分计算细化中间特征,增强细节和边界分割能力。

论文2“DT-UNet: UNet empowered by dynamic snake convolution and transformer for printed fabrics defect segmentation” 针对印花织物表面的低对比度瑕疵与复杂纹理背景下的细微缺陷检测困难的问题,提出一种混合架构DT-UNet。该方法首先设计了D-Bottleneck模块,集成动态卷积(DSConv),实现了动态路径规划与可变形核,显著增强了对细微缺陷局部几何特征的建模能力;其次,策略性地引入轻量化Transformer层,以弥补CNN的固有局部性,有效捕获长程依赖与全局上下文。形成“全局动态感知+局部动态增强”的混合架构机制,有机融合了Transformer的全局理解能力与增强CNN的局部细节提取能力,在抑制复杂纹理干扰的同时,精准定位并分割各类瑕疵。

论文3“DSCA-YOLO: A Lightweight Wheat Head Detection Algorithm Based on Improved YOLOv7” 针对密集小麦穗场景中存在的遮挡与漏检问题,在YOLOv7基础上引入注意力机制、密集目标感知模块及改进的多尺度融合策略,并辅以计数后处理,兼顾检测精度与边缘部署效率。该工作在ICFTIC 2025会议上进行了口头报告,会议由中国石油大学(华东)、山东省人工智能学会和山东计算机学会联合主办,吸引了包括北京大学等高校的专家学者参与交流。
该系列成果体现了米兰·(milan)中国在人工智能与机器视觉等领域应用方面的阶段性成效,彰显了学院科研创新与人才培养的综合能力。学院将持续完善科研平台建设,整合前沿技术资源,进一步加强对学生科研训练与工程能力的系统培养,为高水平人才培养和科研创新提供坚实支撑。