logo
专注油气领域
与独立思考者同行

大数据分析在油气勘探中的应用探讨

www.oilsns.com
机遇与挑战并存

作者 | 许自强 卞爱飞

根据咨询机构Transparency market Research发布的一份市场报告显示,随着油气行业逐步推进数字化,到2026年,“全球油气市场大数据”的价值预计将达到109.35亿美元。

石油行业正面临着数字化浪潮带来的大变革,而油气勘探行业历来是新兴科技的试验场与磨刀石,积极利用新兴科技,同时也进一步推动了高新科技的发展与成熟。那么,在大数据时代,当石油勘探遇上大数据,会发生什么呢?石油勘探面临哪些机遇和挑战呢?

油气地震勘探大数据特征

www.oilsns.com地震数据及其衍生的属性

目前国内外对大数据的定义尚未严格统一,通常是指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合,具有数据容量大、种类多、处理速度快、价值密度低、真实性等特征,其数据规模通常达到PB(1024TB)或EB(1024PB)级,数据类型可能包括各类流式信息、图像、日志文件等。

油气地震勘探数据具有明显的大数据特征。油气地震勘探涉及数据种类包括地震波形数据、地形数据(或者海底)、解释层位、模型数据、人文地理信息数据、班报日志、 海况信息等大类,每一大类数据又可进行细分,例如波形数据可包括原始数据、叠前叠后数据等等,同时可进一步在这类数据基础上生成大量衍生属性数据体。数据格式既有流式数据,也有非流式数据,既有结构化数据,例如SEGY格式的地震数据、也有半结构化和完全非结构化数据。

油气地震勘探数据量庞大,并且随时间推移其衍生数据呈持续增长的趋势。以地震波形数据为例,自二战结束以来,油气地震勘探方式由早期的数十道规模的二维、单分量、单次覆盖资料采集,发展到今天三维、连片、宽频、宽方位、多分量、高密度、高效、万道甚至百万道地震仪、上百次至上千次覆盖次数的数据采集。油气地震勘探数据存储与传输由原始的少量磁带、架库式管理,到现在的高速磁盘阵列、全自动磁带库、高速光纤网与无线网传输。借助于高性能并行计算平台、交互显示系统与海量数据管理数据库,目前已具备海量地震波形数据的高速并行化后台高速处理能力。

油气地震勘探大数据分析需求

www.oilsns.com
油气地震勘探数据不完全等同于传统意义上的大数据。油气地震勘探数据单体价值低,由于构造、沉积、成岩等背景因素影响,相近地域内数据单体通常不是孤立的,而是存在较强的内在关联性。油气地震勘探数据保存与利用通常要求完整、规则、密集,由此才能形成规模与集群效应,由大数据揭示油气的真实分布。另外,油气地震勘探中的大数据通常受各类噪声影响严重,直接从未去噪的原始记录进行数据分析与信息挖掘时通常效率低下,需要通过严格的预处理与质量监控手段形成半成品数据,以保证符合真实性的要求。

随着油气勘探开发一体化进程的不断深化,我国油气勘探工作的重心逐渐转向复杂构造与岩性油气藏、非常规油气、中深层油气藏、致密油气藏。如何有效降低勘探开发的难度与风险,提高油气采收率,控制开发成本,是当前及今后一段时期内行业急需攻关解决的课题。

对于特定的地质研究目标,通常会同时存在多种观测手段与多种分析方法的组合,由此分析形成的地质结论与认识将会存在一定偏差。一体化研究通常需要利用多种分析手段进行多源信息的有机整合,对各类分析结果去伪存真,进一步提高分析精度,降低问题的多解性。这对专业分析人员的综合素质、学科背景以及多源数据共享与开放性都提出了较高要求。

因此总体看来,油气地震勘探数据符合大数据的特征。海量油气地震勘探数据的丰富积累为为大数据分析奠定了基础,在此基础上需要进行数据深度挖掘,提取更有效价值。

面临的挑战

www.oilsns.com
就实际情况而言,油气勘探大数据技术发展仍相对滞后,面临很多困难和挑战,主要包括如下几方面原因:

一、缺乏熟练掌握地质地球物理语言的大数据分析人才。油气勘探行业技术门槛较高,有较为严密细致的学科及行业内部分工,对从业人员的专业素质、综合分析能力要求较高。海量数据及大数据处理与传统油气勘探数据分析存在差别,特别需要既有长期从事油气勘探的地质或物探经验的技术人员,同时又要求这些技术人员对大数据分析及IT领域要有较高的造诣,而这些都需要油气工程师长期大数据分析工作经验的积累。

当前石油行业的人才往往是地质、物探、IT等方面各自发展,没有交集,缺少跨界的人才。人才培养需要一定周期,短期内油气大数据人才缺乏的困境无法从根本上改观。

二、数据的收集、存储传输、标准化及并行运算还算在许多困难。首先是数据收集困难。数字化是这个时代显著标志,几乎任何机器都有电脑的存在,加上互联网,每天都产生海量的数据。数字化的数据收集相对较容易,而非数字化的图片、图纸、档案等等,要数字化就比较困难。另外,在数据收集方面,有些尽管是数字化的,但分块存储在独立的存储介质上,无法联网使用,例如,很多多维度地球物理资料就是分开存储于线下,如何实现线下数据线上化,是一个难题。

其次,数据存储与传输困难。数据量大了,存储和检索极其困难。早期磁盘取代磁带成为海量存储设备,缩短了数据访问时间,但是随机存储和访问仍受限制。近年来的半导体固态存储器SSD容量增加、成本下降,才缓解了这一个问题,但后续海量的地震数据导致数据存储的压力将越来越大,必须要有相应的存储解决方案。今后地震数据要做大数据分析,一定要到云端。数据传输问题,现阶段主要光缆和移动互联网,现阶段4G有效传输2MB-10MB,包括Wi-Fi覆盖率也提高了,使得数据产生后能迅速传到服务器上,但随着信息数据越来越大,对信道宽度肯定要求越来越高,未来随着5G的到来,或将解决这一传输难题。

再次,技术上数据格式的标准化难题。大数据时代,多维度数据只有标准化了,才能共享和分析,寻找相关性。然而事实上,即使同一维度的数据,不同公司数据格式也不一样,更何况多维度的数据。石油勘探涉及到地球物理、地球化学、地质学等等,地球物理下面又分重、磁、电、震以及测井,地震勘探中的又有各种属性等等,这些数据很多都是互不相认的,同一属性数据,各个公司也不一样,各个专业的数据都是独立的,无法用统一数据格式表达。为此要做一个多种数据格式的标准通讯接口,才能利用多维度数据。谷歌已经做了一个开源的Protocol Buffer数据格式,旨在便于全世界能够共享数据,能否适用于油气行业的海量数据,还未有这方面的成功案例。

最后,并行计算的难题。多维度的大数据,肯定需要巨大的运算量,但并非无限制的增加GPU或CPU个数能解决问题的。究其原因,首先,任何一个问题总有一部分计算是无法并行的。在一个任务序列中,哪怕非并行计算只占5%,那么无论如何改善并行计算速度,也无法把整个任务提高20倍。以地震资料处理为例,正常处理流程中,只有偏移这步是需要并行计算的,它占了20%的工作量,即使把并行计算时间压缩到接近于0,总体时间也才压缩20%。其次,并非每个并行处理的小任务都均速等时完成,最终的计算速度取决于最后完成的那个子任务,这就像木桶原理。做地震资料处理的时,有时慢的节点用时会是快节点的2-3倍。摩尔定律还没失效,但已经走向黄昏,晶体管芯片线路小于10纳米,量子效应出现,无限制的缩小线路间距不可持续下去。要想计算能力有大幅提高,需要借助如量子计算技术的发展及云计算的开展。

三、国际油气寡头、油服寡头对油气商业软件、数据及专利技术垄断。油气勘探行业大数据分析是个系统工程,需要将各类常规工具分析数据进行进一步整合,进行大数据分析。然而,目前行业内使用的油气商业分析软件主要由几家国际油气公司控制,相应的商业软件生态、数据格式及标准都相对封闭,不利于国内企业直接参与竞争,甚至不利于整个行业大数据发展。以下图主流的地震勘探软件为例,这类软件以井区、工区或靶区为基本研究单元,不同区域的研究经验无法有机融合,造成实际使用的数据量、数据类型及信息挖掘的深度及广度均大打折扣;同时各个油公司对各自数据的保密,也限制了大数据分析的应用。这一形势短期内将阻碍国内油气公司进行多源数据的集成与大数据分析。国内应进行行业资源整合,形成行业及国家级的油气大数据应用的标准及规范,在油气勘探大数据分析专利方面谋划布局抢占制高点。

www.oilsns.com

四、对关键基础平台的长期投入不足。常规的小型数据处理中心的计算处理能力难以满足TB及PB级别数据实时处理的需要。海量数据的管理与授权单靠几个人或简单的数据库系统也不现实。高可靠性、容错性的分布式通用大数据管理平台,目前尚在发展中。面向油气行业的开放的大数据管理平台建设,是油气行业大数据分析的不可回避的问题。另外涉及到的数据多样性问题,如油公司对各自掌握的油气勘探开发油气数据保密,大数据分析涉及到方方面面的数据,不是某个处理中心能统筹完成的,正如中海油服公司董事长、党委书记齐美胜所说,需要进行“进行顶层设计”,可能需要由集团公司层面来牵头做,比如中石油、中海油等总公司层面负责。

五、不同类型问题对数据样本量大小需求不同,已有数据量能否支撑大数据分析还存疑。大数据分析必然涉及到机器学习及深度学习,有的数据类型样本不够大,数据的完备性可能不支持进行大数据分析。比如海上测井资料少,几千口测井资料能否覆盖各种情况,样本不完备可能用大数据分析得到统计规律可信度存疑。如果全世界的石油公司都能共享自己的石油数据库,应该会大大提高大数据分析的可靠性,但这几乎是不可能的。

另外,不同区块间油气生储盖圈运保规律可能也不一致,利用人工智能的原理看上去很美,如果基础条件不满足的话,可能影响实际效果,数据量大小的需求与问题有关,我们行业有两种不同类型的应用,一类期望训练出通用型模型到处可以应用,一类不具有通用性,这类模型对数据量要求低一些,两者的区分,需要进一步研究。另外智能化算法应用没有形成学习和知识积累的过程,没有形成不断进化并适合于不同地区不同项目应用的智能模型。

带来的机遇

www.oilsns.com
大数据时代的步伐不可阻挡,结合人工智能(AI),将更好地促进油气勘探开发行业的发展。当前的油气勘探数据虽尚未实现真正的大数据技术应用,但仍然可以从大数据发展需求的角度,对现有的勘探资料采集、处理、解释及一体化平台建设提供借鉴,具体包括如下几方面:

1.资料采集方面,应加强网络化、准实时、可灵活流动的自动化、立体化智能观测网络的建设与技术配套。传统地震资料采集通常是在有限时间、固定观测面上进行波形数据采集,能持续采集、重复观测的概率极小。使用新型智能仪器进行采集可以降低人员劳动强度,进行远程实时监控与方案调整,从多个角度、多个期次聚焦不同目的层段的研究需求。例如采用OBN节点采集,可以为海上地震勘探开发提供不间断的多方位高密度多分量的数据。

2.资料处理方面,应加强基于大数据、海量数据的初至拾取、信号增强、保幅去噪及速度建模与优化等自动化分析工作。不同地区、不同工区及不同时期的地震数据均可作为样本,进行人工智能分析与机器学习,进一步提高资料的利用效率。大数据分析与AI的发展,期望得到的结果是处理过程自动化处理,例如机器进行处理流程及参数试验、批量处理、噪音多次波的自动识别及衰减、速度分析,各向异性参数求取。这方面可以借鉴IT公司的信息技术,比如图像识别技术等,就可用在地震信号处理方面。

3.资料反演解释方面,应重视多源数据的整合与自动化分析,在构造、断层、裂缝解释及岩性与流体预测方面进行人工智能应用探索。随着大数据与人工智能的热炒,几乎每个行业都在声称要与之结合,石油行业也不例外。石油行业的确也存在一些人工智能发展的基因。十多年前就开始利用神经网络方法训练地下含油气储层与地震数据的映射模型,利用映射模型进行油气检测的技术已经相当完备成熟,人工智能领域发展的大量非线性优化技术,如基因算法、模拟退化算法、马尔科夫链蒙特卡洛方法等,也应用到我们的地球物理反演技术上。而在图形处理领域的边缘检测技术和群体智能的蚂蚁追踪法,在解释软件中也得到应用,比如自动追踪层位或是断层,使得地震解释的自动化成为了可能。地震反演就是一个利用地震多属性信息进行数据分析的过程。过去是由人进行分析判断,对个种属性进行分类、排列组合、交汇,进而分析判断含油气性,如今可借助大数据分析及机器学习简化这一流程。

4. 数据一体化平台建设对油气勘探开发自动化的推动。油气行业海量的数据分析,涉及各类数据,需要建设一体化的数据平台。平台建起来以后,基于各类油田勘探开发大数据整合分析,类比将不再是难事,勘探开发油藏储集规律可迅速找到类比油藏,公司内部各类研究成果实现共享,避免重复工作。数据一体化平台的建设不仅是大数据分析的需要,同时也是数据分析自动化的需要。大数据分析发展的结果必然是自动化、智能化。

大数据分析及人工智能与石油行业的结合是必然趋势,国外很多石油公司开始与IT公司合作了。如在中海油方面,试点的A2项目,到2015年有限湛江分公司建成了统一的勘探开发数据存储体系和数据服务平台,实现了数据的科学保存和一体化应用。2017年南海东部石油管理局也启动南海东部白云凹陷的智能勘探样板工程,这标志着海油智能化勘探首先在南海东部启动。该局总地质师认为“真正实现勘探智能化,就是要为将来的油藏智能勘探决策服务。这不是一蹴而就的,海油也必须坚持分步走的战略。”(中国海洋石油报)。2018年11月27日,中石油发布勘探开发梦想云平台,这一平台主要包括勘探开发统一数据湖、统一技术平台和通用应用环境,以期实现上游业务数据集中统一、互联互通,并能够支持跨专业、跨机构和地域共享,实现勘探开发、生产管理、协同研究等等,具体成果还未见相关文献刊出。油公司及服务公司应该根据石油行业特点和自身实际来做大数据分析、AI与石油的结合发展,逐步推进,不能跟风炒概念,首先要找到大数据分析及AI的大型应用点、应用场景,这方面进行业务分析并提出智能问题最关键也最困难。

www.oilsns.com
海上地震采集与海底图

大数据思维是一种全新的思维方式,它的本质就是利用信息消除不确定性。大数据思维并非与注重因果关系的机械思维对立,而是互为补充,如果知道因果关系当然很好,无法确定时,就要考虑利用数据得出的强相关性了。对于勘探地震数据,我们可以再扩展一下思路,以海上地震数据为例,包涵导航、水深、潮汐、振幅、频带、大地吸收等多维度信息,我们如果把它们做一下数据深度挖掘,可能会发现更有价值的信息。这些地震信息,不仅可以用作油气勘探,相信对于国防、经济、海事、航运等等方面,都有比较大的价值。

大数据分析在油气勘探开发领域,既是刚起步,又是充满了挑战,也孕育着希望和机遇,海上勘探数据适宜做大数据分析,也存在困难,机遇与挑战并存。石油行业数字化转型下一步怎么走,在油气勘探方面,以下几点或将成为突破点:
1.油气勘探(地震)数据,是海量的、多维度的数据,由基础数据由可衍生多种属性数据,结果深度挖掘,可以产生价值,满足大数据分析要求。
2.数据的标准化、存储传输、线上化和并行计算问题解决后更能有利于大数据分析。
3.统筹建设一体化的油气勘探综合数据平台。
4.油气大数据分析,需要从集团公司层面进行立项,整合各方面的资源。
5.着力培养油气勘探和IT数据分析的跨界人才。
6.油气公司必须引进人工智能公司,进行战略合作,自身技术和认知局限注定难以单独做大数据分析。

未经允许,不得转载本站任何文章: