预测性维护算法实践：从振动分析到机器学习的工程路径-宝威科技股份有限公司

　　预测性维护（Predictive Maintenance, PdM）是工业大数据和人工智能的重要应用领域，通过分析设备运行数据预测故障发生时间，从而减少非计划停机、优化维修计划、降低运维成本。与事后维修（Reactive Maintenance）和预防性维修（Preventive Maintenance）不同，预测性维护通过数据驱动的算法模型，精准判断设备健康状态。本文系统阐述预测性维护算法的工程实现方法。

　　振动信号是旋转机械故障诊断最重要的数据源。加速度传感器采集的振动信号包含丰富的机械状态信息。传感器的选型直接影响信号质量：频率响应范围（根据设备类型选择，低速设备用低频传感器，高速设备用高频传感器）；灵敏度（mV/g，高灵敏度适合低速低幅设备）；量程（g，高量程用于高振动设备，但会降低灵敏度）。采集参数设定：采样频率（至少2.56倍目标最高频率，等角度采样时是2.56倍阶次）、采样时长（至少10个旋转周期，通常1-2秒）、采样间隔（定期采集，如每1小时采集一次）。

　　振动信号的时域分析是最基础的诊断方法。时域统计特征包括：峰值（Peak，反映振动信号的瞬时最大值）、峰峰值（Peak-to-Peak，反映振动信号的波动幅值）、均方根值（RMS，反映振动信号的有效能量水平，广泛应用于ISO 10816标准）、峰值因子（Crest Factor，峰值与RMS的比值，用于检测脉冲型故障）、峭度（Kurtosis，反映信号分布的尖锐程度，滚动轴承故障早期峭度值会升高）。时域分析简单直接，但对于复杂故障状态，仅靠这些特征难以区分故障类型。

　　振动信号的频域分析是主流的故障诊断方法。通过对振动信号进行快速傅里叶变换（FFT），得到频域信号，可以识别各种故障的频率特征。不同故障类型对应的频率特征：不平衡（1倍工频幅值突出）、不对中（1倍和2倍工频幅值突出）、轴承故障（特定频率的边带，故障频率根据轴承型号和转速计算）、齿轮故障（啮合频率及其边带）。FFT的频谱线数（分辨率）取决于采样时长和采样频率：频谱分辨率=采样频率/FFT点数。高分辨率可以区分相近的频率成分，但需要更长的采样时间和更多的计算资源。

　　时频分析（短时傅里叶变换STFT、小波变换Wavelet）可以分析非平稳信号。轴承和齿轮的故障信号往往是非平稳的（故障发生前后信号特征随转速和负载变化），单纯的频域分析难以捕捉时变特征。STFT通过滑动窗口对信号分段做FFT，得到时间-频率-幅值的三维图谱。小波变换可以同时提供时间和频率信息，对非平稳信号有更好的分析能力。小波基函数的选择：Daubechies小波（db4、db8）适合冲击型信号，Symlet小波适合对称型信号。小波尺度参数影响分析的分辨率：尺度大时频率分辨率高、时间分辨率低；尺度小时相反。

　　特征工程是预测性维护模型的关键环节。从振动信号中可以提取的特征分为维度：时域特征、频域特征、时频域特征、统计特征（最大值、最小值、均值、方差、峰峰值、RMS、歪度、峭度、峰值因子、脉冲因子等）；频域特征（各倍频幅值、各频带能量、重心频率、频率分散度等）；时频域特征（小波各层能量、小波系数统计值）。对电流信号还可以提取电流谐波（各次谐波含量、畸变率）、电流轨迹（Park矢量轨迹的形状特征）。

　　特征降维在特征维数较多时是必要的步骤。高维特征会导致模型复杂度增加、过拟合风险增大、计算效率降低。常用的降维方法：主成分分析（PCA，在保留主要信息的前提下降低维数，损失的信息通常在10%以内）；线性判别分析（LDA，利用类别标签信息寻找最佳分类方向，降维效果优于PCA但需要标签信息）；互信息选择（根据特征与目标变量的互信息量排序选择最优特征子集）。特征选择比特征变换更有优势：选择后的特征可以直接解释（知道是哪种故障特征），有利于现场工程师理解和接受。

　　多传感器融合可以提诊断的准确性和鲁棒性。单一传感器可能无法覆盖所有故障模式（如加速度传感器对低频故障不敏感，电流传感器对早期轴承故障不敏感）。多传感器融合的常用方法：数据层融合（将多个传感器的原始数据融合为一个矩阵，适合同类型传感器的信号融合）、特征层融合（将各传感器提取的特征拼接为一个特征向量，适合不同类型传感器的融合）、决策层融合（各传感器分别做诊断，用投票或贝叶斯方法组合诊断结果）。特征层融合是工业应用中最常用的方法，融合效果好，复杂度适中。

　　机器学习的分类算法适用于故障类型识别（是轴承失效还是不平衡？）。常用算法包括：支持向量机（SVM），在样本量少、特征维数高时表现好，但需要选择合适的核函数和惩罚参数；随机森林（Random Forest），对特征量纲不敏感、不容易过拟合、可以提供特征重要性排序，是工业领域最常用的分类算法之一；K最近邻（KNN），简单直观、不需要训练过程，但计算量大、对样本分布敏感；神经网络（NN），能处理复杂的非线性关系，但需要大量训练数据、易过拟合。工业应用建议先用随机森林建模，效果不理想再尝试更复杂的模型。

　　回归算法适用于剩余寿命预测。预测设备剩余寿命（RUL，Remaining Useful Life）需要知道设备的历史退化数据，建立退化趋势与剩余寿命之间的映射关系。常用回归模型：线性回归（最简单的RUL模型，假设退化与时间为线性关系）、指数回归（适用于退化加速的阶段）、支持向量回归（SVR，适合小样本的RUL预测）、神经网络回归（适合复杂非线性的RUL预测）。RUL模型的训练需要带标签的历史数据（记录设备从健康到故障的全过程和故障发生时间），这种数据的获取成本很高，通常依赖加速老化试验或仿真数据。

　　异常检测（Anomaly Detection）适用于缺少故障数据的场景。在很多工业场景中，设备故障数据很少（因为设备质量好、故障率低），但正常数据充足，异常检测可以在正常数据中建立基准模型，检测出偏离正常状态的数据点。常用的异常检测方法：单类SVM（One-Class SVM，在标准SVM基础上只使用正常数据进行训练）、孤立森林（Isolation Forest，基于决策树的异常检测算法，在大规模数据集上效率高）、自编码器（Autoencoder，训练时学习正常数据的压缩和重建，异常数据重建误差较大）。异常检测的优点是只需要正常数据，不需要故障数据；缺点是只能检测异常，无法判断故障类型。

　　边缘部署是预测性维护的存储模式。在设备侧部署分析模型，可以实时处理数据，延迟低（毫秒级），不依赖云端网络连接。边缘部署的方案包括：在边缘网关（如工业物联网关）上部署轻量级模型（ONNX、TensorFlow Lite、OpenVINO）；在边缘服务器（如工控机）上部署完整模型；在PLC/DCS中部署简单的阈值模型。对于需要大量训练的深度模型，可以采用云边协同架构：云端训练模型，边缘执行推理。

　　宝威体育官网

　　模型在工业现场的泛化能力需要评估。在实验室数据上表现优异的模型，在实际产线数据上可能表现很差，因为现场数据包含更多的噪声和干扰。提高模型泛化能力的方法：交叉验证（K-Fold交叉验证可以评估模型在不同数据子集上的表现）、域适应（Domain Adaptation，将实验室数据训练的模型适应到现场数据分布）、增量学习（在线学习，模型在运行过程中不断接收新数据，逐步调整参数适应新的数据分布）。

　　模型维护是投入生产后的持续工作。模型上线后，随着设备老化、工况变化、环境变化，模型的预测能力会逐渐下降（模型漂移，Model Drift）。模型维护包括：定期评估模型性能（计算准确率、召回率、F1分数，比较与基线值的偏差）；监控预测结果分布（如果分布发生显著偏移，说明数据分布可能已变化，需要重新训练或调整模型）；定期重新训练模型（使用新收集的数据更新模型参数）。模型版本管理要有规范的流程，记录每次模型更新的原因、效果和影响范围。

　　预测性维护项目的实施流程：1）选择关键设备（根据设备重要性和故障影响），确定监控参数（振动、温度、电流、压力等）；2）数据采集系统搭建（传感器、采集模块、网关的选型、安装、调试）；3）数据标注（标注历史数据的设备状态，如果没有故障数据可以先从异常检测开始）；4）特征开发和模型训练（从数据中提取特征，训练分类或回归模型）；5）模型部署验证（在实际设备上验证模型效果，调整参数阈值）；6）持续优化（收集更多数据，调整模型参数，优化部署架构）。

预测性维护算法实践：从振动分析到机器学习的工程路径(图1)

　　RFID是工业识别与追溯的核心技术之一。本文从标签选型、读写器配置、系统集成、应用场景四个方面，阐述工业RFID系统的设计与实施方法。

　　EtherCAT是高速运动控制领域的领先以太网协议。本文从通信原理、从站实现、多轴同步、工程调试四个方面，阐述EtherCAT运动控制系统的设计与实现。

　　功能安全是工业自动化不可或缺的组成部分。本文从风险评估、SIL分配、回路计算、验证测试四个核心环节，系统阐述功能安全系统的设计与实现方法。

　　IO-Link作为传感器/执行器层的智能化通信协议，正加速替代传统开关量接线。本文从协议原理、设备选型、系统集成、故障诊断四个方面，阐述IO-Link的工程应用方法。

　　边缘计算是工业物联网的核心使能技术。本文从边缘计算架构、应用场景、边缘网关选型、应用开发部署四个方面，阐述工业边缘计算的设计方法与工程实践。

　　伺服系统调试是运动控制项目的关键环节。本文从增益调整、反馈优化、共振抑制、高级应用四个方面，阐述伺服驱动系统调试的系统方法与工程实践。

宝威体育- (股份有限公司)中国·官方网站

预测性维护算法实践：从振动分析到机器学习的工程路径