神户制钢初轧厂设备状态监测与异常检测系统的构建

360影视 国产动漫 2025-09-16 11:06 1

摘要:为确保神户制钢加古川炼钢厂第二初轧厂的稳定运行,应用了一套数据采集装置,并开发了检测设备异常的系统。在作业条件和模式多样的第二初轧厂,为了准确检测出异常,选择从适合评估的区间提取数据进行学习和分析,从而提高模型通用性的方法,并开发了一个从数据预处理到建模均无需

为确保神户制钢加古川炼钢厂第二初轧厂的稳定运行,应用了一套数据采集装置,并开发了检测设备异常的系统。在作业条件和模式多样的第二初轧厂,为了准确检测出异常,选择从适合评估的区间提取数据进行学习和分析,从而提高模型通用性的方法,并开发了一个从数据预处理到建模均无需编程的系统【Mode Oriented Novel Anomaly Detector:面向模式的新型异常检测器(MONAD)】。通过从建模到利用MONAD的维护工作的流程进行标准化,建立了一个即使是没有掌握机器学习专业知识的运维技术人员,也能够运用的体系,并在生产车间加以利用的同时努力提高其精度。

前言

神户制钢加古川炼钢厂第二初轧厂(以下简称第二初轧厂)于1970年投产,主要生产用于棒钢产品轧制工厂的钢坯。2017年,由于上游工序的整合,开展了大规模升级改造工程,仅初轧厂的产能就达到了每月30万吨。棒钢产品所采用的钢坯几乎全部通过第二初轧厂供应,因此第二初轧厂稳定运行体系的建立是关系到整个棒钢产品稳定供应的重要环节。

传统的设备维护主要通过日常检查确定设备状态,并根据以往经验制定维护标准的TBM(Time-Based Maintenance,定期检修)和CBM(Condition-Based Maintenance,状态检修)为主。然而,在2017年升级改造后应用的设备中,有些地方不可避免地要将TBM和CBM定为临时维护标准,因此需要引入一种能够更确切有效地遏制设备突发故障的方法。在此背景下,一直在开发能够对第二初轧厂各类设备进行持续状态监控和异常检测的信息基础设施和系统,本文将对其进行详细介绍。

01

异常检测系统的开发计划

1.1该系统的理念

在利用机器学习检测异常时,通常假定数据中存在规律性,然后学习并检测出偏离规律的“与平时不同的”状态,即异常。特别是在持续运行的工厂等地,已有很多报告提到以工厂为单位批量进行多变量数据分析并检测“与平时不同的”行为的异常检测实例,由于它能够根据数据间意外存在的关联性发现人们在查看数据时往往不会注意到的异常,因此备受关注。

然而,在第二初轧厂中,不同设备的操作方法和设备驱动电机的负载会根据钢材种类和尺寸等生产条件而产生变化,此外,在某些情况下,现场作业人员可能会手动操作设备,从而导致操作条件和操作模式的变化多样。因此,不能保证所有运行数据都像持续运行的工厂那样具有规律性,机器学习最终捕捉到的“与平时不同的”状态不一定是真正要捕捉的异常,有可能出现了误报。

作为对策,可以针对每种操作条件和操作模式构建并学习模型,但所需模型数量庞大,因此并不现实。此外,这也会成为模型应用于新的操作条件与模式时的一个障碍。因此,本研究选择一种不依赖操作条件和操作模式,从适合评估的运动区间(如载荷恒定的区间)中提取数据并将其作为学习对象,从而提高模型通用性的方法。在确定数据提取条件时,除了要考虑作业条件和作业模式外,还必须考虑设备结构和自动化控制条件,运维技术人员的知识也不可或缺。此外,即使按照上述方法进行数据提取,也会有误报的特殊情况,因此很难在报告异常时无需人工干预直接采取关闭设备等统一的措施,最终必须由人工判断应当采取何种措施。

鉴于上述情况,为使没有掌握机器学习专业知识的运维技术人员和作业人员也能够牵头建模与运行,决定按照以下计划开发该系统:

1)以设备为单位构建优化模型,而不是对整个工厂的多变量数据进行批量分析;

2)应配备无需编程即可进行数据预处理以及模型构建的工具;

3)为直观地了解模型的行为以及数据与实际现象之间的对应关系,所采用的特征值应限制在两个变量以内。

1.2监测目标设备的确定

第二初轧厂的设备总数达数千台,因此要为所有设备建立异常检测模型并不现实。因此,本项目的目的为第二初轧厂的稳定运行,从这一角度出发,决定将重点放在预计会因故障使生产线突发停机24小时以上的设备上,并收集持续状态监控所需数据,建立异常检测模型。

用于设备持续状态监控的数据包括由传统控制网络采集的电机转速、电流值、控制信号等数据,通常利用这些数据生成用于异常检测的模型。

02

数据采集装置的应用

2.1对数据采集装置的要求

由于工厂扩建以及控制系统的多次局部更新,第二初轧厂的装置均来自不同制造商,因此控制系统非常复杂。各制造商的数据采集装置也有所不同,有些信号本来就无法采集,所以一直无法同步并统一采集所有数据。然而,异常检测要监测各种数据的相关性,以判断“与平常不同的”数据,因此数据的同步与统一采集必不可少。

在此基础上,为开发并构建一个异常检测系统,为数据收集装置设定了以下五项要求。

1)为便于横向推广到公司的其他工厂,该系统应能够与国内主要PLC(Programmable Logic Controller,控制装置)制造商的控制网络连接;

2)在1)中,应能够实现数据同步与统一采集;

3)为实现通用数据输出,数据应能够以文本文件形式传递;

4)收集到的数据应能够通过公司网络在任意终端查看,便于利用;

5)考虑到发展潜力及可扩展性,该装置应易于扩展规模与增加功能。

为满足这些要求,选用iba AG公司(以下简称iba公司)的数据采集装置(ibaPDA)。

2.2 iba公司的数据采集装置特征

iba的数据采集装置可与大部分PLC制造商的网络进行连接(要求1)),并能够实现数据同步与统一采集(要求2))。此外,与上层系统的数据连接方法多样,同时数据可以成套,因此能够以文本文件形式传递(要求3))。如果安装了分析软件,则可通过公司网络从任意终端查看并利用所采集的数据(要求4))。能够轻松添加振动分析和图像处理等功能,可扩展性高(要求5))。本项目的优点是可利用该分析软件对各种信号进行处理,并使关联关系可视化(图1),便于建模的初步研究。

2.3 iba公司的数据采集装置应用方法

引进该系统时,由于无法保证与日本制造商的网络处于连接状态,因此进行了小规模的实际验证试验,以确认数据统一收集的稳定性。

此外,为了便于将收集到的数据与本公司其他系统互联并加以利用,每台设备都采用了统一的ID作为通用密钥,并进行了标记。针对重要数据还添加了变量名和工程单位,便于数据利用。

此外,为使今后在其他工厂部署该系统时也能够维持相同的设计质量,还根据第二初轧厂的应用实例,对设计规范进行了标准化改进。

03

建模方法的确定

3.1异常检测建模流程

在该行动中,由于运维技术人员将根据上述理念牵头制作每个设备的优化模型,因此确定了能够避免不同模型在质量和开发效率方面差异的标准作业流程。

由于设备的异常检测往往很少或完全没有能够用作机器学习训练数据的异常数据,因此有必要制作允许一定程度误报的模型,并在实装后通过试错将误报发生率改良至可接受的水平。因此,参照“混合型标准学习生命周期流程概念图”,创建了图2所示的作业流程。在这一流程中,建模过程分为预处理阶段和实装阶段,并采用在每个阶段都进行数据检查循环的敏捷开发(一种在开发过程中预先假定更改和补充的开发方法)概念。其中,预处理阶段涉及特征选择和数据提取,是提高模型精度的重要流程,下文将利用实例进行详细说明。

3.2利用实例解释建模步骤

下文将以图3所示传送设备作为实例解释建模步骤。该设备采用与偏心轮相连的活动框架提升钢坯并向前移动的结构。接下来将以该设备可能出现的故障之一,即偏心轮旋转故障为例进行建模。

1)检测对象的特征研究

首先,根据开发理念最多可选择两个特征量作为首道流程来检测“旋转故障”。由于偏心轮旋转不良会导致电机输出扭矩增加,第一个特征量可设置为电机电流值。由于需要反复驱动和停止设备,在运行过程中电流值会随着加速和减速而不断变化,因此将电机转速设为第二个特征值。如果传送设备无负载,则假设这两个特征量保持恒定关系,但在提升钢坯时,由于电机电流值会随钢坯总重量等因素而改变,因此这两个特征量之间的关系也会发生变化。由于钢坯总重量等作业条件引起的变化可能会导致误报,因此应事先研究设备图纸和控制计划后再针对仅提取空载状态下数据区间的条件展开探讨。通过图3可以假定在本设备中“偏心轮角度在0°至90°或270°至360°区间”时为空载。

2)利用分析软件进行特性研究

下一步需基于1)的研究内容,利用分析软件确定实际数据分布,并检查两个特征值之间是否存在相关性。显示出两个选定的特征量和作为数据提取条件的偏心轮角度的时间序列数据,从而掌握数据的特征(图4(a))。在这种情况下,除了假定的“负载”区间外,在开始驱动后和停止前会出现可重复性较低的尖峰,因此除了“负载”角度条件外,这些尖峰出现的角度范围也被排除在数据提取范围之外。利用分析软件中的功能,可以显示出在偏心轮角度条件下提取的两个特征的散点图(图4(b))。如果数据密集,由于能够提取可重复性较高的数据,则可以建模;如果数据零散,则数据可重复性较低,无法建模,在后一种情况下,要重新审查数据提取区间。上述一系列流程是建模时最重要的过程,必须系统地保存这一思路和试验结果。

3)模型设计书的制作

数据验证结束后,迄今为止的研究内容将以模型设计书的形式记录下来。因此,即使不是建模者,也可以验证相关模型的设计理念和合理性,并有助于应用于长期模型管理和维护活动。

模型设计书采用Airtable(Formagrid Inc.的商标)这一网络服务。该服务能够将模型信息(设计信息、设备构成、运行计划、信号信息、相关性研究结果、模型评估结果等)以文本和图像的形式进行存储,还可以存储注释并修订历史,便于记录建模过程和修改历史。

04

异常检测系统的开发

根据“3建模方法的确定”中标准化的设计步骤,开发了在图2所示的Model deployment中无需编程即可简易建模并实装的“MONAD(Mode Oriented Novel Anomaly Detector:面向模式的新型异常检测器)”系统(图5)。

MONAD的特点包括:1)通过将异常检测所需的特征控制至最多两个变量,即使是没有掌握机器学习的运维工程师也能通过观察散点图和趋势图了解模型行为,并利用设备知识设计出实用的异常检测逻辑;2)配有丰富的预处理选项列表,可轻松地按照用户意图对两个选定变量进行数据处理。下文将介绍MONAD的模式提取和异常检测逻辑构建功能。

4.1模式提取功能

在MONAD中,根据作业条件和作业模式而变化的数据规律性被称为“模式”。要从数据中提取所需的模式,首先要选择作为异常检测对象的数据项(最多2个变量)以及用于模式提取的ON/OFF信号和指令值等辅助信号。除了通过指定辅助信号的取值范围作为模式提取方法之外,该功能还提供基于时间序列数据变化规律进行分割的方法以及直接在散点图上指定提取范围的方法。结合这些功能,用户可以根据设备知识提取恒定负载运行等各种时刻想要评估的数据(图6)。

4.2异常检测逻辑构建功能

MONAD可对模式提取后的数据进行LOF(Local Outlier Factor:局部异常因子)等异常检测模型训练,另外可使用训练后的模型计算评估期间的异常得分并作图。通过在散点图上绘制异常分数等高线图,可以检查模型是否符合用户预期。

实际的异常判断是在部署(将开发的软件或应用程序应用于实际运行环境)后,通过批处理(一种根据预定的数据量进行分批处理的方法)进行的,如果异常得分的阈值频率超过容许频率,就会报告异常。

除LOF外,系统的异常检测逻辑还包括通过评估时间序列趋势的单调递增或递减趋势以及数据分布和波形的变化从而检测异常的功能。上述异常检测逻辑可由用户选择,并将根据用户要求以及对新异常实例的分析进行适当扩展。

05

在维护行动中的应用

为利用在MONAD中实装的各设备模型,并将其作为检测异常(预测性维护)的工具应用于维护活动,有必要将其部署到生产现场的运行中,并努力提高模型精度。

为了推进生产现场的应用,在发布了有关异常检测的信息后,首先研究了数据确认和实物确认的最佳工作流程(图7)。然后,为在每个步骤中向维护作业人员提供必要的信息,利用MONAD设计了必要的系统画面。

如果MONAD判定设备为异常状态,则会自动以邮件方式通知维护作业人员。维护作业人员通过数据确认异常评分的趋势以及发生异常时的状态,然后对该设备进行外观检查(包括检查异常振动和噪音)。如果在外观检查中出现疑似异常的情况,则决定停止设备并进行详细检查。此外,检查结果和处理内容等信息由维护作业人员输入至监控画面,以便与包括模型设计人员在内的相关人员共享信息。

建立上述运行机制后,系统于2023年在生产现场投入运行。在按照流程运行该系统的同时,也在努力验证和提高各模型的精度,然而目前已经出现了检测出钢坯传送设备轴承润滑故障初期症状的实例,因此该系统有望在未来有效发挥作用。另一方面,对于减速机等由大量传动部件构成的装置,有必要在继续验证模型精度的同时根据每台设备的特点探索合理的状态监测方法。

结语

本文介绍了在第二初轧厂收集设备数据并将其应用至异常检测系统的方法。本文介绍的MONAD开发理念和建模步骤的特点在于,即使是没有掌握机器学习专业知识的运维技术人员也能针对每台设备敏捷地建模,为具有不同作业条件和作业模式的工厂提供了一种新的异常检测方法。此外,如果MONAD本身能够恰当选择监测设施的数据,就可以成为一个在其他工厂也能便捷部署的通用系统,除在第二初轧厂验证该系统的有效性之外,预计未来将系统推广到公司的其他工厂。

《世界金属导报》

2025年第34期 B06、B07

来源:世界金属导报

相关推荐