基于深度学习的机器故障异常声音识别技术探讨

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:vicky 点击次数:
论文字数:27555 论文编号:sb2021102722180239186 日期:2021-11-06 来源:硕博论文网
本文是一篇软件工程论文,本文使用比赛数据集和比赛的评价标准,提出了有监督学习和无监督学习两种解决方案。任务中在训练阶段只提供正常的声音数据,在测试阶段提供少量的故障声音数据。基线系统通过训练自动编码器,尽可能降低正常声音数据的重构误差,而未被训练的异常数据重构误差较大,通过重构误差值来区分正常声音和故障声音。

第 1 章 绪论

1.1 研究背景及意义
从本世纪初开始,人工智能技术的应用使得人类的生产和生活发生了巨大的变化。在新一轮的技术革命发展中,人工智能技术的发展使得机器设备故障自动诊断和工业自动化的实现成为了可能。长期以来机器设备的异常检测[1]和故障诊断[2][3]都是备受工业界关注的问题。随着世界各国对智能制造重视程度的不断增加及相关政策的推出,中国也提出了《中国制造 2025》[4]。然而,智能制造的发展使得现代机器设备故障种类也在不断增加,当机器设备发生故障时,会导致工厂生产停滞并对工厂经济造成重大影响,其中重大故障的发生还可能严重影响到生命和财产的安全[5]。因此,研究机器设备智能故障诊断技术可以减少或尽可能避免工厂在生产过程中发生的重大事故[6],也是保障生命安全和降低财产损失的迫切需求。
在现代工业发展过程中,制造工艺不断提升,机器设备为了完成各项复杂功能需要更复杂的机器结构,同时不同机器设备之间需要协同各种工作,因此机器设备在发生故障时难以追溯和确定故障类型及原因。最初的故障诊断技术是基于声音信号,通过提取故障声音信号的特征,并根据特征参数对故障类型进行诊断,在此过程中,需要通过人工经验完成对故障机器声音信号的特征提取,并使用分类算法对故障声音信号特征进行分类以完成故障诊断。然而通过人工经验的方式提取声音信号特征的方法存在局限,提取的机器设备故障声音特征十分有限且难以达到全面,同时通过人工经验的方式也无法挖掘故障声音信号中更深层次的数据抽象特征。除此之外,机器设备所处环境中未知的干扰和噪声也会对机器设备的故障声音信号产生不同程度的影响。随着智能制造的不断发展,机器设备智能化程度不断提高的同时机器设备规模也在不断的扩大,采集到的机器设备数据形式变得越来越复杂,数据量也成倍的增加,而机器发生故障的几率较少,难以采集机器故障数据,因此对机器设备故障诊断及预测提出了高质量的需求。由于机器设备结构复杂,在真实环境中又包含各种信号干扰,再考虑到机器设备的耦合性强等特点,使得机器设备故障诊断及预测带来了困难。
.............................

1.2 国内外研究现状
1.2.1 机器故障诊断技术概述
在现代工业制造领域中,为完成越来越复杂的工业制造,机器设备的发展日趋大型化和智能化[12]。目前的机器设备故障诊断技术一般需要获得机器运行时的正常数据和异常数据作为样本数据对识别模型进行训练,然而,在机器设备运行过程中,可以通过多种不同的方式采集大量机器运行时的正常数据,但异常数据即发生故障时的数据难以在短时间内大量采集。使得目前机器设备故障诊断由于异常样本数据较少而变得异常困难。同时,在初期机器故障诊断发展过程中,专家和工程师通过自身经验知识对机器设备运行状态进行判断[13],但依靠人工经验的诊断方式在现代工业机器设备故障面前显得杯水车薪。由于机器设备运行时产生的声音信号蕴含丰富的数据特征信息,众多研究者采用获取故障信号中的声音数据特征,并以此为依据完成故障诊断,通过对故障诊断结果的分析,继而给出合理的解释与维修策略[14]。以上故障诊断方法中,数据的特征提取一般需要人类专家或工程技术人员人工提取,这在数据量小,数据种类少的情景下可以得到有益的结果,但此类方法依然依赖人工经验,对数据的深层特征学习十分有限,而在海量、多重复、低价值的数据面前,传统的机器设备故障诊断技术难以满足现实需求,深度学习的出现适逢其时。深度学习是机器学习中新发展出来的部分,通过神经网络对机器设备故障声音数据特征的深度学习,可以很好的表达数据更抽象的特征。深度学习不仅在数据的特征提取与特征选择上降低了对人工经验的依赖,还简化了整个机器设备故障诊断的过程。
1.2.2 基于深度学习的故障诊断研究现状
基于深度学习的机器设备故障诊断方法,其流程如图 1.1 所示。机器设备故障诊断共分为五个部分:故障类型定义、数据预处理、网络模型构建及训练、测试模型和判断故障类型及诊断评估[15]。在目前的机器学习算法中,均以数据作为模型的驱动,传统的机器设备故障诊断方法需要通过专家和工程师的人工经验选择数据特征,并依赖对数据特征的学习建立模型,因此数据特征对数据的描述至关重要。模型在未见数据上的性能受训练数据特征的影响,而深度学习可以不需要或简化专家和工程师的人工经验来完成数据特征的选择,并且深度学习在对数据特征提取的同时进行网络模型的训练,通过增加深度学习模型的深度可以学习到更抽象的数据深层特征信息,因此,深度学习又被称为端到端的学习模型。目前常见的深度学习用于故障诊断的神经网络模型有:自动编码器[16][17]、深度置信网络[18][19]、卷积神经网络[20][21]、循环神经网络[22][23]和生成式对抗网络[24][25]。
.............................

第 2 章 故障诊断相关深度学习理论基础

2.1 深度学习理论概述
人工智能技术的发展和普及,使其在人类的生产和生活中得到大量的应用。机器学习通过对数据特征的学习,使得难以解决的问题可以十分有效的被解决。深度学习是机器学习新的发展,深度学习的特点是不需要或者很少需要人工经验来完成数据的特征提取,并且在目前大数据的驱动下可以廉价高效的处理人工智能领域的相关任务。
通过深度学习方法对数据样本进行学习,使得模型了解数据中蕴含的样本分布规律及其有效表示,并通过这些分布规律和有效表示来完成人工智能相关任务。例如从声音、图像和文字样本数据中发现其数据特征,通过对数据特征规律的记忆形成的模型使得在未见的声音、图像和文字数据中得出相对应的识别结果。虽然这种实现方式不能使机器完全和人一样去思考和学习,但从单个任务上来说具有了和人类似的对特定问题分析、学习和处理的能力。由于深度学习算法相较于以往的机器学习算法拥有对数据更强大的学习和表示能力,因此在人工智能不同领域的问题上都产生了较好的效果,并推动相关领域技术快速发展。
在人工智能技术中,深度学习的应用十分的广泛,涉及视觉、听觉、翻译和推荐等众多领域。通过各类传感器可以采集到视觉、听觉和可感知的各类数据信息,许多复杂困难的模式识别问题因此变得十分容易,极大的推进了人工智能技术在各个领域的快速发展[45],目前的机器设备智能故障诊断技术中大量采用深度学习的方法。
图 2.2 简单的卷积神经网络
图 2.2 简单的卷积神经网络
.......................

2.2 深度学习模型
2.2.1 自动编码器
自动编码器网络模型由隐含层、输出层和输入层组成。在自动编码器的隐含层中学习输入数据的有效表示,可以用来对输入数据的数据特征进行学习,并提取有效特征进行数据降维,将这些数据特征作为数据重构的依据。在自动编码器中隐含层提取出输入数据的有效表示向量,并完成数据编码,而模型最终将编码的向量进行解码重构得到与输入相似的表示向量。因为自动编码器没有对数据标记的依赖,所以可以应用于无监督学习的问题和任务中,而编码的作用是将数据样本进行降维,在数据降维的问题中也可以用自动编码器来完成。同时,自动编码器最终会生成与原始输入数据差别较小的模拟数据,所以模型具有高效的特征学习表示能力,因此自动编码器同时也是一种特征检测器,并可以在神经网络预训练中发挥重要的作用。又因为自动编码器可以在输入数据中学习到数据特征并重构输入数据,因此自动编码器也是生成模型。
图 2.1 简单的自动编码器结构
图 2.1 简单的自动编码器结构
...................................

第 3 章 基于卷积自动编码器的机器故障异常声音识别方法................................18
3.1 卷积自动编码器设计...................................... 18
3.1.1 卷积自动编码器结构...................................18
3.1.2 卷积自动编码器工作过程........................19
第 4 章 基于残差网络的机器故障异常声音识别方法...............................29
4.1 残差网络设计..................................... 29
4.1.1 残差块设计...................................... 30
4.1.2 残差网络结构............................................ 31
第 5 章 总结与展望....................................... 39
5.1 总结................................................ 39
5.2 展望..................................................... 39

第 4 章 基于残差网络的机器故障异常声音识别方法

4.1 残差网络设计
在训练神经网络模型时,需要根据数据量和数据特征的规模选择合适的网络结构及其参数。然而随着现实需求的不断提升,可以采集到的数据量也逐渐增多,使得神经网络需要增加网络层数来扩大模型容量以适应更大的数据集。当模型达到一定层数时,模型的准确率将会在一定范围内有较小的浮动,但是得到的训练误差会不断增大,此时模型出现过拟合的问题。此外,在神经网络模型中除了输入层和输出层,每一层都将前一层的输出数据作为该层的输入数据,并将该层的输出数据作为下一层的输入数据。因此,在训练构建神经网络时,随着网络层数的不断增多,误差不断传递下去使得神经网络模型出现梯度消失和梯度爆炸的现象。使用数据量大和数据特征较多的数据集训练神经网络模型时,较少的网络层数无法满足数据特征提取的需求,导致模型出现欠拟合现象,此时需要更大的网络模型容量来解决该问题,但是通过简单的堆叠网络层数来提升网络模型容量的方法,无法满足日益增长的海量数据需求。
由于浅层的网络模型的模型容量较小,所能表示的数据十分有限。相应的深层网络模型的模型容量较大,所能表示的数据更加丰富。一般在相同数据量和类似的数据特征规模的情况下,可以选用相同容量的模型。因此,较小模型容量的浅层网络模型可以看做为较大模型容量的深层网络模型的一部分。在浅层网络的基础上增加层数变成深层网络,并训练恒等映射 f (x) x,使得深层网络模型不会因为层数的增加而改变了网络模型的表示空间。理论上通过不改变网络模型的表示空间的方法,使得浅层网络模型和深层网络模型具有相同的表示空间,深层网络的网络容量更大,可以获得更好的训练效果。但是网络层数的增加在扩大模型容量的同时使得模型过于复杂而出现退化,采用传统的约束方式无法改善退化。通过残差块的使用可以使得退化现象得到改善[55],本章将基于此思想设计并构建了基于残差网络的故障异常声音识别方法。
............................

第 5 章 总结与展望

5.1 总结
随着工业不断的发展,工业规模不断扩大,机器设备不断更新换代,使得机器设备拥有更多的层次,更高的复杂性等特点。因此对机器故障自动诊断技术的需求在质和量上提出了更高的要求。人工诊断机器故障需要培养具有经验的人员,培养有经验的人员代价高昂且所需学习的时间较长。传统的故障诊断技术虽然一定程度上减少了人工参与,但是依然需要通过人工经验提取特征进行识别,而人工经验提取的数据特征也十分有限,限制了传统方法的诊断效率和精准度。在大数据驱动的今天,传统的故障诊断技术已无法满足目前日益增长的需求,同时也无法体现大数据的优势,深度学习的出现对这些问题解决带来了曙光。深度学习通过对大量数据的学习,挖掘数据信息的深层抽象特征,大幅提升了机器故障诊断能力。
DCASE2020 挑战任务共有六项任务,其中任务二是机器状态监测中异常声音的无监督检测,任务中提供了相关数据集和基线系统。本文使用比赛数据集和比赛的评价标准,提出了有监督学习和无监督学习两种解决方案。任务中在训练阶段只提供正常的声音数据,在测试阶段提供少量的故障声音数据。基线系统通过训练自动编码器,尽可能降低正常声音数据的重构误差,而未被训练的异常数据重构误差较大,通过重构误差值来区分正常声音和故障声音。本文提出的无监督学习方案是在基线系统的基础上,引入卷积来提高数据特征挖掘,使得模型在训练时尽可能的学习得到更好的数据表示,并最终得到正常数据较小的重构误差,模型的正常数据重构误差越小在测试时就会有更好的判别效果。而通过重构误差值的大小为依据的判断使得正常与异常的决策边界较为模糊,模型的诊断性能难以进一步提升,而有监督学习方案可以使得正常与异常数据边界较为清晰,因此设计并构建了基于残差网络的有监督学习方案。有监督学习方案是先通过调整数据集,使机器状态监测变为一个二分类问题。由于训练时数据量大,需要更大的网络容量,因此对网络深度有了更高的要求,而较深的网络结构容易产生梯度爆炸或梯度消失的问题,因此使用残差网络来训练模型。最终将残差网络、卷积自动编码器、基线系统、GMM 和 CNN 模型进行实验,得出的结果进行对比分析。残差网络、卷积自动编码器、GMM 和 CNN 模型相比基线系统实验结果均有所提升,而基于残差网络的有监督学习方案是所有模型中效果最好的。
参考文献(略)