【故障诊断】DSCNN-HA-TL:融合Swin窗口注意力和全局注意力机制的变工况轴承故障诊断(迁移学习/小样本)
2026/5/16 12:49:14 网站建设 项目流程

在工业旋转机械中,滚动轴承是最关键、也最容易发生故障的部件之一。然而,变工况、故障样本稀缺、跨域泛化能力差三大难题,长期制约着故障诊断模型的落地效果。

近期,来自河北工程大学、天津大学等机构的研究团队提出了一种全新的诊断框架 ——DSCNN-HA-TL,在 CWRU 公开数据集和自建实验平台上的跨工况迁移任务中,平均精度分别达到99.93%99.55%

本文带你一文读懂这项研究的技术路线与核心亮点。

一、研究背景:为什么变工况轴承诊断这么难?

在实际工业场景中,轴承往往在变转速、变负载条件下运行,振动信号分布差异显著。传统深度学习方法依赖“同分布”假设,一旦工况变化,诊断精度就会急剧下降。

更棘手的是:

  • 故障样本极少,难以训练复杂模型;

  • 跨设备、跨工况数据分布偏移严重;

  • 单一注意力机制难以兼顾局部与全局特征。

👉 这些正是当前深度学习故障诊断从“实验室”走向“工业现场”的核心障碍。

二、研究目的:构建一个“小样本 + 变工况”可用的轻量高精度模型

研究团队的目标非常明确:

设计一个融合迁移学习混合注意力机制的轻量化卷积网络,在仅使用少量目标域样本的情况下,实现对不同工况下轴承故障的高精度识别。

三、研究方法:DSCNN-HA-TL 框架全解析

整体流程(原文 Fig.4,第8-9页)

该框架包含四个关键阶段:

  1. 信号预处理
    使用连续小波变换(CWT)将一维振动信号转换为224×224的二维时频图(原文第10页)。

  2. 双分支特征提取

    • Swin窗口注意力:提取局部时频特征

    • GAM全局注意力:增强通道与空间维度的全局交互

  3. 特征融合
    将局部与全局特征拼接,通过自适应池化压缩为固定长度向量。

  4. 迁移学习诊断
    源域预训练 → 目标域少量样本微调 → 跨工况故障分类。

四、研究过程:两个数据集 + 七类对比模型

数据集

  • CWRU公开数据集:0/1/2 hp,7类故障(含正常、内圈、外圈、滚动体)

  • 自建实验平台:0/0.25/0.5 MPa,同样7类故障(原文第18-19页)

对比模型

DSCNN、Swin、DSCNN-GAM、VGG16、ResNet、CNN-SwinGAM

评估指标

准确率、损失率、损失曲线、混淆矩阵、t-SNE

五、研究重难点:模型设计中的三个关键挑战

难点1:如何兼顾轻量与表达能力?

解决方案:采用深度可分离卷积(DSC)替代标准卷积。

  • 参数量和计算量分别降至标准卷积的1/C_out + 1/K²(原文公式(5)(6))

  • 同时保持较强的特征表达能力

难点2:单一注意力机制难以捕捉多尺度特征

解决方案:提出窗口注意力(Swin)+ 全局注意力(GAM)的混合机制。

  • Swin:提取局部短时依赖

  • GAM:强化跨通道与空间维度的全局交互

难点3:跨工况下分布漂移严重

解决方案:引入迁移学习

  • 源域充分预训练

  • 目标域仅用40%样本微调,即可实现高精度迁移(原文第13页)

六、研究结论:精度、损失、可视化三重验证

1. 准确率全面领先

CWRU 单工况(原文 Table 3,第14页)
  • DSCNN-SwinGAM:100%(平均)

  • 对比模型:DSCNN(96.10%)、ResNet(99.30%)

CWRU 迁移任务(原文 Table 4,第14页)
  • 平均精度:99.93%

  • 6个迁移任务中多个达到100%

自建平台迁移任务(原文 Table 9,第21页)
  • 平均精度:99.55%

  • 比DSCNN高出12个百分点

2. 损失率显著更低(原文 Table 6、11)

  • CWRU迁移任务平均损失:0.0755(DSCNN为3.22)

  • 自建平台迁移任务平均损失:0.4119(DSCNN为12.14)

3. 收敛速度更快(原文 Fig.8、15)

  • DSCNN-SwinGAM 在训练早期即快速收敛

  • 最终损失值最低,表明拟合能力强、过拟合风险低

4. 特征聚类更清晰(原文 Fig.10、17)

  • 同类故障特征高度聚集

  • 不同故障类别之间边界明显

  • 对比模型存在明显混叠现象

七、未来展望:从实验室到工业现场的下一步

作者也明确指出了当前方法仍可改进的方向:

  1. 进一步提升训练效率,适应实时或在线诊断需求;

  2. 拓展到更复杂的工业场景

    • 变转速

    • 变温度

    • 跨设备(不同型号轴承)

  3. 构建端到端的在线故障诊断流水线,真正实现“边采边诊”。

写在最后:为什么这篇工作值得关注?

维度

亮点

🧠 方法创新

首次将Swin + GAM双注意力与DSC + 迁移学习融合

⚙️ 轻量高效

深度可分离卷积显著降低参数量

🎯 适用性强

专为小样本、变工况设计,贴近工业现实

📊 验证充分

双数据集、7类对比、多指标、消融实验齐全

如果你想在自己的轴承故障诊断任务中尝试该方法,建议优先复现其CWT时频图 + DSCNN-SwinGAM + 迁移学习的组合,这三点是精度提升的核心。

关注我们,获取更多工业智能诊断、深度学习前沿解读。

本文解读自论文:
*DSCNN-HA-TL: A Transfer Learning Framework with Hybrid Attention for Bearing Fault Diagnosis under Variable Operating Conditions (Struct Durab Health Monit, 2025)*

注:更多关于小样本齿轮箱故障诊断的前沿知识小编之前有推荐,可以详查置顶文章:【本周六开课】-数据驱动智能故障诊断技术应用与实践

如果您觉得文章不错,欢迎点赞、关注、收藏及转发~

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询