填补国内开源空白 明月湖正式官宣两项核心成果
9月10日,北理工重庆创新中心电弧认知制造技术研究所对外发布两项核心成果,即SWRD焊缝X射线数据集与RapidXAnnotator工业射线图像标注软件,并宣布两项核心成果正式开源。
研究所所长李琰表示,此次开源采用“数据+工具”的组合形式,面向真实工程场景与国标规范,填补了国内该领域高质量开源资源的关键空白,标志着中国工业焊缝射线检测AI化从“追赶者”走向“引领者”。
据介绍,国内工业焊缝检测行业普遍存在数据长期稀缺、工具不对路、标准不统一、工程化门槛高等痛点。譬如数据稀缺,目前国内公开、可复用、覆盖全场景且高精度标注的焊缝RT数据集几乎空白,研究者往往借助国外通用数据或小样本私有数据,导致模型泛化差、工程迁移难。
李琰指出,通用不等于工业,工具不对路的问题在行业内长期存在,LabelImg、CVAT等通用标注工具未针对射线图像(低对比度、噪声重、缺陷隐蔽)优化,导致标注“看不清、标不准和低效率”。
又如工程化门槛高,工业胶片幅面大、预处理复杂、格式割裂,研究到落地断层,成本高、周期长、复现难;标准不统一,缺陷定义与标注细则不一致,难以形成行业可复用基线与可比结果。
“行业要规模化用好AI,既要有‘好粮食’(数据),也要有‘好工具’(标注),两者缺一不可,而国内开源供给长期不足。”李琰说。
SWRD数据集给AI最好的“粮食”
据了解,系统化、可复用的开源数据集,有助于形成统一基线与公开评测,把中国的工程场景与标准转化为全球共享的研究与应用土壤。研究所打造的SWRD开源数据集具有标注精细、真实等优势,可以说是推动行业AI化、给AI投喂的最好的“粮食”。
真实且系统:收录3675张原始焊缝X射线图像,涵盖工业制造中最核心的“标准对接焊缝”(2420张)与“T型接头焊缝”(1255张),全部源自大型管道焊接真实场景,完美还原工业界常见的复杂灰度变化、高密度区域等真实特征,远超同类数据集的场景局限性。
精细标注:数据集严格依据标准,精准标注6类关键缺陷(气孔、夹杂、裂纹、咬边、未熔合、未焊透),采用多边形实例级标注,同时支持分类/检测/实例分割三大任务。
即拿即用:通过滑窗与预处理生成4930张可直接训练样本,减少清洗裁剪与反复试错,叠加对比度拉伸、去噪等预处理优化,让隐藏的细微缺陷清晰呈现,加速算法迭代与对比评测。
RapidXAnnotator让标注“看得清、标得快”
据了解,RapidXAnnotator把“通用工具不适配”的老问题一次性解决在源头,为工业标注建立更快、更准、更可追溯的新范式。
RapidXAnnotator是“为射线而生”,可以提供局部灰度拉伸、伪彩色、正负片转换等射线专属增强,使细微缺陷变得更加清晰。
“把‘重复劳动’交给机器,把‘关键判断’交给专家。”李琰介绍,RapidXAnnotator通过人机协同和集成YOLO等模型进行批量预标注。它集成YOLO无锚框检测模型,在SWRD数据集上可实现74.4%的平均精度(AP)与86.0%的召回率,展现了在复中杂工业射线图像依旧保持高准确率和强鲁棒性能力。
实验数据显示,借助预标注功能,可以使单框标注时间从22.74秒降至14.56秒,效率提升35.9%,同时误标率显著降低。
另外,RapidXAnnotator还有工程兼容优势,支持VOC/COCO/YOLO/掩膜等多格式;适配大幅面胶片的切片/回拼与几何校正,方便接入现有质控流程。
从“跟随”到“引领”这次发布为何是分水岭?
电弧认知制造技术研究所主要致力于以电弧制造为核心,深耕焊接、增材制造、无损检测领域,通过智能装备+先进工艺+AI算法的深度融合,在国内率先构建起覆盖焊接、检测、增材制造全流程的智能化解决方案。
李琰指出,从“跟随”到“引领”,此次开源发布是一次行业“分水岭”,两项开源成果突出“中国场景、中国标准、中国开源”,以国内典型工况和国标为锚,首次将系统化数据与专用工具成套开源,把“隐性经验”沉淀为显性的公共能力;突出“研究可复现、产业可复用”,公开数据+工具+流程,打通“实验室—产线”的最后一公里,让高校、研究所、企业能在同一基准上快速协同。
“此次开源完成了一次从借鉴到定义的重大跨越。”李琰表示,过去更多“借用国外通用资源”,如今以国产工程需求牵引方法与软件设计,可以反向输出中国方案,在国际上具有方法与场景双重话语权。下一步,团队将推动开源成果实现安全、质量与效率的“三重提升”:更稳的质量与安全,更贴近现场的数据与工具,提升缺陷识别的准确性与一致性,助力关键装备长寿命、少故障。更快的研发周期,数据准备与标注效率提升,缩短算法迭代与验证时间,节约成本。更强的生态共建,开源共享促进跨单位、跨行业的联合攻关与对标评测,推动形成可复制的中国工程实践。(孙建和)