logo
专注油气领域
与独立思考者同行

预测性方法 保障油气开采生命线

预测性方法 保障油气生产生命线

稳定高效的油气开采可离不开压缩机这个关键设备!

来自 | JPT
编译 | TOM 惊蛰

压缩机系统在油气生产中地位非常重要,大部分石油石化设备都离不开气体压缩机,该技术也被成为油气开采的生命线,如何保持其高效平稳运行是行业关注的重点。利用先进的机器学习方法,可以确定异常情况,预测潜在的压缩机跳机及原因,并提出足够的警告,以便进行干预。这种预测性维护方法有可能减少旋转设备故障造成的停机时间。

利用机器学习系统首当其冲就是训练模型,以识别正常与异常的条件。然后,利用该模型将设备的实时数据进行分类,指出设备性能何时偏离了确定的稳定状态。识别异常的能力是该方法与传统监测工具的主要区别。随着数字技术的进步,可以在几分钟内实现对比与警告,使工程师在收到故障警告时采取适当的预防措施。

研究人员根据某地区2016年的历史数据,分析了该系统在预测故障时的效率。还处于概念验证阶段的系统在一年内正确地预测了11次事故,而在这段时间内共发生了23次故障,成功预测率将近50%。更重要的发现之一是,机器学习模型提前数小时预测了故障。其中一次,提前了36小时。其他8个预测中,通知时间也平均提前了约7小时。

本文中将支持向量机(SVM)作为检测机器异常状态的分类器。利用SVMs进行二类分类。一些学者认为,与线性判别分析和反向传播神经网络等技术相比,SVM分类器具有更好的分类效果。

SVM的一个特性是它们可以通过非线性函数,将数据投影到更高维度的空间,来创建非线性决策边界。单类SVM可创建一个二进制函数,捕获输入空间中存在大部分数据的区域。由此形成的函数,对于由训练数据点定义的区域返回+1,而在其他区域返回-1。

低压压缩机是一个关键生产设备,当工程师发现异常时,通常会选择绕过或手动关闭。这是数据集中不含有实际跳机,但包括许多手动停机的主要原因。例如, 2017年数据的分析显示,31个记录的延期,4个是手动停机,7个是流程待机,19个被归类为故障。在这19次故障中,只有6次是由低压压缩机(LPC)的某些故障引起的,其余13次是由LPC上游子系统的问题引起的。无法区分LPC的所有失效模式与LPC的重复失效模式。因此,选择单类SVM作为模拟LPC正常工作的合适策略。无论故障模式如何,这都可以识别任何异常事件。

为了训练用于LPC以及其作业流程的SVM,确定了大约300个模拟标签。模拟标签比数字标签少,但数据点是连续的而不是离散的。这300个标签分为两个模型,LPC以及作业流程。LPC模型由近230个输入标签组成,流程模型由近70个输入标签组成。流程模型还包括许多子系统。两种模型的所有标签在被送入相应的SVM模型之前,都经过了一定的预处理步骤。

为了确定LPC的正常工作状态,研究人员主要关注了两种策略:

  • 事件日志。LPC上的每个事件都被记录为错误,然后归类为故障或其他类型的延迟。
  • 流程稳定状态。这是根据关键阀门的位置来决定的,这些阀门可表明LPC是否在线并处于生产状态。此外,还可及时为LPC与流程模型创建确定的边界。对于LPC模型,发生延迟2小时之前与2小时之后的数据点被认为是异常的。对于流程模型,采用了6小时的边界余量。

表现最好的单类模型是基于流程稳态来定义机器的正常工作状态,并且滚动窗口上的数据聚类作为延迟来计算变化率,计算值可被用于训练LPC与流程的SVM模型。每10分钟输入一次测试数据流,并执行用于训练模型的相同预处理步骤。1周的滚动窗口被确定为平滑数据以及计算当前观测到的变化率的最佳措施。模型输出包含一个简化的标记列表,LPC模型大约200个标记,流程模型大约30个标记。通过删除低方差标记以及删除警告的预处理步骤,来解释标记数量减少的原因。SVM模型的输出本质上是布尔值,表示数据点是正常的还是异常的。这种连续的输出流几乎可以实时地显示LPC及其流程的状态。

当单类SVM模型从正常翻转变为异常(从真变为假)时,它就被认为是LPC状态的警告或变化。每当发生上述翻转时,所有标签的所有值都按降序排列,并选择与报告前10个标记。根本原因识别是一种派生机制,它将SVM输出视为唯一输入。

LPC的性能数据存储在基于时间的数据库中。可在商业软件中构建工作流程,以执行端到端提取/变换/加载以及数据处理任务。该工作流程部署在服务器上,每10分钟运行一次。每次运行工作流程时,软件程序会以1分钟的频率为大约300个选定的压缩机以及流程变量输入前10分钟的数据。这些数据通过各种模块传递,以进行筛选、转换与验证。然后,数据通过工作流程中嵌入的模块进行传递;利用标准库,结合SVM算法,将压缩机数据生成二进制的异常值分类。再之,软件将结果输出到结构化查询语言数据库,结果只是表示故障预测的布尔值true或false。当结果从true变为false并保持false超过10分钟时,系统会发送一封电子邮件来警告出现了故障预测。

该方法还可精确识别故障发生的根本原因,并且在遇到类似故障时,可清晰显示出故障模式。例如,反馈臂松动,无法正确控制流量,而导致跳机。在这种情况下,算法将“LPC标准流速”识别为最主要的根本原因。在一个案例中,警报几乎提前12个小时发出,而在另一个案例中,只有几分钟。这归因于手动干预失败并导致跳机。在大多数情况下,工程师需要有足够的警告时间来采取预防措施。

For English, Please click here (展开/收缩)

未经允许,不得转载本站任何文章: