logo
专注油气领域
与独立思考者同行

石油行业工程师如何对大数据建立认知?

www.oilsns.com

成千上万条死鱼堆积在一起,是死鱼堆;没有灵魂的数据孤岛集成在一起,是体量更大的数据孤岛。

作者 | 中国海油数字化先锋营

建设数字化油田的进程正在加速,石油人对大数据重要性的认识,也正在飞速提升。

中国石油大学(北京)先后建立了“油气数据工程实验室”“石油数据挖掘北京市重点实验室”,在十余年的发展历程中,他们共完成涉及大数据、数据挖掘的二十余项课题。人工智能连续三年写入政府工作报告,这让一直从事石油数据工程的中国石油大学(北京)教授李洪奇感到,大数据的重要性应在石油行业提升至前所未有的高度——

大数据不仅仅是科研,也不仅仅是项目,而是一个产业形态。就数据科学而言,应该有岗位,有规范,有队伍,把数据的重要性提到这个位置上,数据才能发挥作用。

大数据是智慧油田的基础

什么是大数据?大是个相对的概念,大数据就是数据量相对比较大的数据。大到什么程度?大到给常规的数据获取、存储、处理、应用技术带来困难的程度。正是这种困难引发了人们对大数据的重视,进而形成了大数据获取技术、存储技术、处理技术的科学。

人工智能是让计算机系统干原本只有人才能干的高级智力活动。近年来由于成本低廉的大规模并行计算、大数据、深度学习、人脑芯片4大催化剂的出现,让人工智能蓬勃发展。

人工智能的来源,一是数据,二是算法。如今广为探讨的智慧油田,是基于数据产生的。也就是说,大数据是智慧油田的基础,没有大数据就没有智慧油田。把石油行业的数据资产变现,让它为石油勘探开发、油田生产服务,是我们在石油行业建设数字化的目标。

www.oilsns.com

数字化油田需要什么样的大数据?

在与大数据公司、大数据实验室合作的过程中,许多油田的生产技术人员误将生产数据等同于数字油田要采集的大数据。其实,普通的生产数据是无法进行挖掘分析,更无从获取有用价值。生产数据是对实际生产过程的描述,例如一口井的生产数据,由于加压、换泵等在实际生产过程中遇到的各种情况,不可能是连续性的,这样的数据是无法被计算机挖掘分析的。现实生产数据和大数据分析所需要的数据,完全不是一个概念。

比如做钻井故障预期的大数据分析。大数据实验室的工作人员发现,在录井数据中,钻井过程中所有的故障都没有记录,而很多故障数据是被记录在完井过程中的。因为录井和完井在生产作业中是两个程序,两套人马。当数据实验室工作人员手拿录井数据想了解卡钻情况时,大费周章之后才能从完井报告中获知一二。

www.oilsns.com

原始地震数据切片和大数据体沿层切片所反映的信息不同

现实生产过程中产生的数据信息,与大数据分析所需要的数据,存在严重不匹配,是油田形成“数据孤岛”一个非常重要的现实原因。数据分析师们将其形象地比喻为“死鱼”——成千上万条死鱼堆积在一起,是死鱼堆;没有灵魂的数据孤岛集成在一起,是体量更大的数据孤岛!

解决石油行业的“数据孤岛”问题,不是简单地集成一个平台,将四面八方的数据录入就行,而是要建立一个健康的数据生态环境,给每一个数据标注业务内涵,让数据与数据之间形成业务关联,这样的大数据才能释放价值。

新型大数据管理平台

石油数据工程专家认为,新型大数据管理平台的理念,是要通过管理业务来管理数据,为数据赋予业务灵魂。每个岗位需要哪些数据、用到哪些数据、产生哪些数据,把这些数据收集后,全局做标准化,生成数据模型。今天的数据库不需要人来建设,每个岗位的人员只需要描述业务,只要描述准确,生成的业务模型就准确。有了这样的模型,既可以做生产流程的优化,也可以做数据流图和数据模型。

www.oilsns.com

新型大数据管理平台就是数据模型、业务模型和组织模型三位一体的数据智能建设与管理技术。新型油田数据库,针对业务模型和组织模型构建数据模型。这样的数据才具有业务灵魂。

未经允许,不得转载本站任何文章: