一种基于改进的Apriori算法的机床故障预测方法

Submitted by neurta on Mon, 01/20/2020 - 10:02
数据收集

技术领域

本发明涉及机床故障诊断技术领域,特别涉及一种基于改进的Apriori算法的机床故障预测方法

背景技术

随着工业4.0时代的到来,现代工业的科技水平也在不断提高,各种机电设备也逐步向着自动化、集中化、连续化和高速化等方向发展,这也导致了机电设备的故障率增加和诊断难度系数变高。特别是机床的损伤性故障或异常等,若检查不及时, 就可能造成整个系统的失效,也会造成一定的工业生产经济的损失。因此,对机床进行故障分析及预测就显得尤为重要了。

通过对机床故障的预测分析,可以在一定程度上降低或者避免因机床损失,而造成的工业生成中的经济损失。目前已有的预防技术有传统方法和在线监测方法两大类,其中传统技术是指由技术人员定期或不定期的对机床的噪音、温度、转速等状态因素进行判断,推测机床的健康状态;而在线检测方法主要通过相关系统实时监控主轴电流、扭矩、振动、声音和温度等机床状态,将采集到的数据进行分析判断,从而推断机床健康程度。传统方法存在技术人员的专业能力的主观因素,无法保证准确性,可靠性差且效率低;而在线监测方法,实时性要求高,随着机床数据的不断增加,传统的集中式数据库技术会给网络流量和服务器带来一定的压力。

内容

本发明的目的是克服上述背景技术中的不足,提供一种基于改进的Apriori算法的机床故障预测方法,基于大数据技术和关联数据挖掘技术,使用Hadoop分布式系统存储海量机床数据,并使用Apriori算法进行关联数据挖掘,使用Hadoop分布式系统存储海量机床数据,并使用Apriori算法进行关联数据挖掘,对机床数据进行分析,得出相应的预测结果。

为了达到上述的技术效果,具体技术方案:

A.搭建Hadoop系统,所述Hadoop系统包括:分布式文件系统hdfs、分布式非关系型数据库HBase(分布式文件系统hdfs用于存储机床数据,分布式非关系型数据库Hbase用于访问和读写处理文件系统中的机床数据),将采集到的海量机床数据存入分布式文件系统hdfs中:

B.对分布式文件系统hdfs中的数据进行数据清洗,得到预处理后的机床数据,生成相应的侯选集;

c.设置Apriori算法的最小支持度min_sup和最小置信度min_conf,并扫描数据库Hbase,根据改进的Apriori算法得到不同项数的频繁项集

d.通过频繁项集找出机床数据之间的关联规则以及对应的置信度大小;

e.将步骤d得出的结果与步骤c中的最小置信度对比,得到机床数据之间最终的强关联规则,即机床故障预测结果。

进一步地,所述步骤A中的Hadoop系统还包括:高效并行计算MapReduce架构,所述高效并行计算MapReduce架构用于并行计算Apriori算法的不同项数的频繁项集、关联规则以及对应置信度。

进一步地,所述步骤B中的数据清洗具体是将采集过程中不合理的数据进行处理,得到统一化的数据格式,并通过映射表建模抽象出对应的候选1项集。