来源:Intelligent Petroleum Engineering[J]. Engineering,2022,18(11):27-32.
编者按
近年来,在新一代信息技能快速渗透和带动下,石油和天然气行业正迅速向数字化网络化智能化方向转型,人们越来越方向于将数据驱动建模和机器学习(ML)算法运用于应对各种石油工程寻衅。
中国工程院外籍院士陈掌星等在中国工程院院刊《Engineering》2022年第11期揭橥《智能石油工程》一文。文章指出ML已广泛运用于石油工业的不同领域,包括地球科学、油藏工程、生产工程和钻井工程,但将ML算法运用于石油工程问题仍旧须要战胜各种寻衅,此外ML的潜力在石油工业油藏仿照和文本挖掘这两个领域尚未得到充分利用。
一、弁言
人工智能(AI)试图模拟人类的决策。被称为机器学习(ML)的AI技能子集使打算机能够通过利用外部数据,学习如何在其编程行为的限定之外采纳行动。ML已彻底改变无数行业和研究领域,从股票市场剖析到自动驾驶汽车行业,其运用范围极其广泛。随着物联网(IoT)设备和大数据(高速天生大量、不同种类的数据)的涌现,ML是确保从大数据中获取可实行信息的最主要技能之一。
在石油和天然气行业,模型类型分为三大类:物理模型、数学模型和履历模型。物理模型是工具的按比例缩小或放大版本,开拓物理模型是为了简化对物理工具或场景的外不雅观或操作办法的认识。这些模型具有开拓本钱高、耗时长的缺陷,并且在某些情形下可能不足准确。根据实验建立了履历模型,履历模型会涌现各种偏差,如人为偏差和丈量偏差,并且无法归纳。数学模型对物理定律进行编码,以仿照根本物理学;然而,它们须要许多假设和简化。为了应对这三种模型所面临的寻衅、获取信息,并及时做出明智的决策,须要一种更有前景的技能。这便是ML可以运用之处,一是由于该技能能够从弘大数据集中获取信息并对该信息采纳行动,而这些信息永久无法通过纯编程程序进行处理;二是由于数据与从数据中获取的信息之间的关系非常繁芜。
石油和天然气行业正在迅速向油田数字化转型,人们越来越方向于将数据驱动建模和ML算法运用于应对各种石油工程寻衅。数据驱动建模利用从数据剖析中导出的数学方程,而不是知识驱动建模。在知识驱动建模中,逻辑是用于表示理论的紧张工具。虽然可能有不从数据中学习的数据驱动算法(因此不能称为ML),但ML是数据驱动方法的一个子集,该方法展示了AI的一种形式。图1总结了不同类型的ML算法。
图1 不同类型的ML算法。DBSCAN:基于密度的噪声运用空间聚类;HDBSCAN:基于层次密度的噪声运用空间聚类。
ML已广泛运用于石油工业的不同领域,包括地球科学、油藏工程、生产工程和钻井工程。接下来的4节将对ML在这些领域的运用进行批驳性的回顾和展望。
(一)智能地球科学
早在20世纪60年代,地球科学已经开始利用决策树、马尔可夫链和K均值聚类等算法。马尔可夫链已用于沉积学、水文学和测井剖析。Preston和Henderson利用K均值聚类来阐明泥沙沉积的周期性。决策树的早期运用可以在经济地质学和透视映命中查到。由于多种成分,包括缺少打算能力和该领域的不成熟,采取ML未能完备知足最初的期望;因此,AI在20世纪70年代险些没有得到发展。Zhao和Mendel在20世纪80年代采取递归神经网络(NN)进行地震反褶积,至此,人们对AI的兴趣又重新兴起。ML从知识驱动转变为数据驱动发生在20世纪90年代,当时揭橥了地球物理中关于NN的首篇综述。McCormack的综述探索了模式识别,并总结了过去30年来NN的运用,以及地震道编辑和自动测井剖析的运用样本。深度学习(DL)和卷积神经网络(CNN)在21世纪10年代得到复兴,当时Waldeland和Solberg将小型CNN运用于地震数据以进行盐识别。断层阐明、层位选取和岩相分类是CNN在地球科学中的其他运用。Mosser等运用了天生式对抗网络(GAN),即ML模型,个中两个NN竞争性地协同事情,以在地球科学早期进行更准确的预测,从而对三维(3D)多孔介质进行孔隙尺度建模。GAN还用于地震记录天生和地质统计反演。
地震活动是地球科学中的另一个主要领域,ML在个中得到了广泛运用。Mousavi等利用ML算法,根据地面吸收器上记录的波形特色,区分深部微地震事宜和浅部微地震事宜。He等利用ML算法来改进诱发地震事宜的风险管理。他们提出的模型是一组大略的闭式表达式,具有透明度高、实行速率快的优点,为操作员供应了最大的成功可能性。采矿、油气田枯竭、废水注入和地热作业等工业活动会诱发地震。在加拿大西部,水力压裂(HF)引发的地震活动受到了"大众和学术界的关注。由于强烈耦合的地质力学、地球物理和地质行为带来的繁芜性,研究诱发地震活动与HF之间的干系性一贯是一项极具寻衅性的事情。因此,ML在地震活动中的运用仍存在很大的探索空间。
(二)智能油藏工程
ML算法常用于油藏工程的各个领域,特殊是在油藏表征和压力、体积和温度(PVT)打算方面。Gharbi和Elsharkawy开拓了一个双层NN,用于估计油层的泡点压力和地层体积系数。在另一项研究中,采取径向基函数和多层感知器NN来估计地层体积系数、等温压缩性和盐水含盐量。Wang等在组成油藏仿照中利用人工神经网络(ANN)进行相平衡打算,包括相稳定性测试和相分裂打算。将两种方法,即支持向量机(SVM)和模糊逻辑相结合,利用实际测井作为输入,预测渗透率和孔隙度。Patel和Chatterjee利用分类算法进行快速准确的岩石分类(即根据相似性将储油岩分为不同种别)。在随机噪声存在的情形下,探索了具有单个隐蔽层的ANN的性能,以建立预测低速层厚度的模型。该方法还被用于加拿大阿尔伯塔省北部的一个油田,以构建孔隙度净产层厚度分布图。据该分布图,钻了四口井,油田产量增加了近20%。Jamialahmadi和Javadpour利用径向基函数NN,利用深度丈量和岩心数据的孔隙度作为输入,估算伊拉克共和国南部全体油田的渗透率。Wang等开拓了一个集成ML模型(即随机森林算法),以利用构造繁芜且高度断裂的海上油田的实际生产和注入数据作为紧张输入,预测井位的延时饱和度剖面。通过引入极限学习机(ELM),开拓了一个用于预测多个储层参数(即孔隙度、饱和度、岩相和页岩含量)的新框架,这是最前辈的ML技能之一。与范例的单层前馈NN方法比较,该方法在不捐躯精度的情形下,须要的打算资源和演习韶光更少。
(三)智能生产工程
生产预测/优化和HF是能源行业中ML日益盛行的其余两个领域。生产预测和优化必须考虑许多参数,包括采油工艺、支撑剂类型、井距、处理速率和压裂阶段数。只管操作参数优化可以节省数百万美元,并显著提高非常规油藏产量,但传统的油藏仿照打算本钱高昂,在考虑油藏特色的不同变革的情形下,打算本钱会增加。因此,产量预测和优化是AI运用的良好候选领域,如最近开拓和剖析的用于各种开采工艺(如水和化学剂驱油以及蒸汽注入)的ML算法所示。Dang等利用NN对相对渗透率进行多维插值,以战胜稠浊开采过程中不同参数(即聚合物、表面活性剂和盐度)的影响。利用地质、岩心和测井数据对不同储层中的井进行产量预测,是ML算法广泛用于该领域的运用。Tadjer等利用DeepAR和Prophet(韶光序列ML算法)作为短期油气井预测递减曲线剖析的替代方案。利用NN预测垂直井的井底压力(生产举动步伐设计的关键参数)是ML在该领域的另一个运用。利用是非期影象(LSTM)模型和特色选择方法预测加拿大Duvernay页岩气井的日产量。Popa和Connel通过将模糊逻辑和NN相结合进行地层性能评估,研究了水平井位优化。
在过去20年中,HF事情的数量不断增加,产生了大量可用于构建ML预测模型的丈量数据。进行了一项利用模糊逻辑聚类剖析绘制Utica页岩天然裂痕网络的研究。He等利用AI和模糊逻辑剖析,开拓了一种优化页岩气储层HF设计的模型。利用SVM开拓了一种用于确定粗糙岩石水力开度的新模型。Yang等建立了一种数据剖析方法,该方法将由声波测井得出的设计参数与压裂后剖析得出的设计参数相结合,用于优化压裂处理设计。通过利用生产测井仪数据和沿Marcellus页岩储层水平井的深剪切波成像,验证了所得到的压裂优化算法。Wang和Sun提出了一种将ML、储层仿照和HF相结合的综合方法,用于优化二叠纪页岩中的井距,并考虑了该大区域每个代表性区域的范例井。Bangi和Kwon运用强化学习算法达到了沿裂隙的均匀支撑剂浓度,从而提高HF生产率;研究职员将降维与迁移学习相结合,以加快学习过程。Duplyakov等提出了一种基于升压算法和岭回归组合的模型,用于预测多级压裂完井的累积产油量。对加拿大阿尔伯塔省Montney地层的74口HF井进行了案例研究,以井间距、岩石力学特性和完井参数作为输入特色,预测5年内的累积产量剖面。利用基于产量、完井和HF数据的深度NN作为输入特色,开拓了一个用于预测页岩储层累积天然气产量的代理模型;利用Montney地层中1239口水平井的现场数据验证了该模型。
(四)智能钻探工程
考虑钻井作业期间每天都会产生大量的实时数据,钻井工程也从ML的运用中受益匪浅。由于近年来油价不稳定,人们一贯在寻求如何在各种价格方案中确保良好的经济性。为了实现这一目标,ML已经变得越来越普遍,以及时缓解钻井寻衅。钻井作业优化和卡钻预测是钻井工程中最关键的两个领域,人们常常利用AI进行研究。Mohaghgh利用ANN及时识别钻井非常及其干系非生产韶光(NPT)。Unrau等开拓了ML模型,用来确定实时报警阈值,以便在钻井作业期间检测流速和泥浆体积数据的非常。该模型有助于早期检测井漏,并最大程度地减少缺点报警。Pollock等运用强化学习算法,基于二叠纪和阿巴拉契亚盆地的14口水平井,改进预演习NN。改进后的模型将弯曲度和操持轨迹偏差降至最低,偏差小于3%。Zhao等运用ML算法得出不同钻井参数的趋势,用于识别非常事宜并提出相应的补救方法。已考试测验利用钻压、流速和每分钟转数等钻井特色,将ML算法运用于优化钻速(ROP)。Goebel等通过对钻速、管道旋转、倾斜角度和流速等各种参数进行监测和研究,开拓了一种ML模型来预测未来的卡钻管柱。一年后,Dursun等提出了钻井期间的实时风险预测。将ML算法与数据挖掘和自然措辞处理(NLP)技能相结合,在极短的韶光内调查中东地区两个陆上油田的逐日钻井报告(DDR),以便对生产和NPT进行分类,并创造NPT的关键影响成分。
二、寻衅和机遇
ML算法可以非常有效地用来办理三种紧张类型的问题:为已理解的问题构建替代模型,以降落打算本钱;为须要人为干预和知识剖析的问题建立ML模型;为以前无法办理的繁芜问题建立ML模型。在环境大略、数据随意马虎获取且决策本钱不昂贵的领域,ML能够最快地取获胜利。只管石油工业中利用ML的大多数情形不符合这几类问题中的任何一个,但通过有效利用ML投资格久收益可以供应大量代价,不过须要周密的设计,并与领域专家高度互助。
将ML算法运用于石油工程问题须要战胜各种寻衅。一项寻衅是,数据量每每很大(即大量数据),数据种类(即许多不同的数据格式)和真实性(即数据不一致、不准确)繁多,且速率快(即数据流入率高)。石油工业操作设备上安装的井下和地面传感器每天都会产生大量的数据。该行业利用构造化和非构造化数据来跟踪生产、安全和掩护。获取石油行业的准确数据常日很困难或不可能,而且可能很昂贵。因此,获取足足数目标高质量数据用于培训和验证ML模型是石油行业面临的普遍寻衅,这会导致演习数据涌现不愿定性和噪声。反过来,这些问题会危害ML模型的通用性和准确性。此外,原始数据常日不适宜ML算法,须要进行预处理和洗濯。地下不愿定性和数据处理韶光耽误也是主要的考虑成分。此外,此类数据常日存在于各部门的小数据库中,由于保密问题和竞争上风,相应的模型要么没有,要么不向其他人开放。这一问题在学术环境中尤为普遍。此外,模型的可阐明性对地球科学很主要,由于知道导致结果的缘故原由与知道结果本身同样主要。
或许由于上述寻衅,ML在地球科学领域的运用并没有像在许多其他领域那样得到迅速发展。只管ML是一种很有出息的技能,可以利用大数据创造输入-输出关系并得出信息,但ML的性能可能会因数据的高维性而受到影响。这可能导致误导性的干系性以及不切实际和不可靠的聚类。值得把稳的是,数据在其初始状态下常日是模棱两可的,因此,须要不同的预处理技能来识别显著特色并使ML模型能够学习系统的行为。存在一个风险,即短缺数据和缺少系统稳定性可能会将偏差引入ML模型中,使模型难以从数据中提取有益知识。此外,应考虑利用不同来源数据的问题和寻衅。与数据干系的隐私、安全和道德也是须要考虑的非常主要的方面。稠浊建模集成了ML算法与基于物理的方法,可以被认为是缓解上述问题的一种方法。此外,迁移学习是一种相对较新的ML技能,在地球科学领域具有良好前景。个中利用预演习模型作为出发点,然后通过考虑自己的演习数据在预演习模型上进行模型演习。
三、展望
ML的潜力在石油工业油藏仿照和文本挖掘这两个领域尚未得到充分利用。油藏仿照涉及可充分解释物理性子随韶光和空间而变革的微分方程(DE),因此有助于描述自然界中的物理征象。科学和工程中有许多问题,须要办理繁芜的DE。然而,DE非常难办理,其干系仿照极其繁芜且打算量大。这种繁芜程度哀求利用巨型打算机进行仿照,并也解释这一领域研究职员对AI的兴趣是合理的。DL包含具有多个隐蔽层的NN,利用DL是一种很有出息的技能,可以加快DE的求解速率,节省科学家和工程师大量的韶光和精力。加利福尼亚理工学院(Caltech)的研究职员引入了一种新的DL技能来求解DE,该技能比传统DL算法更准确、更通用,并且速率快1000倍。这种新方法基于在傅里叶空间而不是传统DL中的欧几里得空间中定义输入和输出。这一进步不仅减少了对超级打算机的依赖,还将提高打算能力,以有效地仿照更繁芜的问题。
石油行业刚刚开始利用ML的技能进行智能报告并从文本中提取信息。逐日钻井和完井报告是行业中两种紧张的文本文件,这些文件包含主要文本以及各种其他类型的数据,如深度、套管尺寸、井眼尺寸和射孔深度。NLP和DL算法可用来开拓用于作业自动化质量掌握和性能改进的模型,可供应更有效率的方法,远超依赖专家专业知识的传统方法。一些研究调查了石油行业中的文本处理,重点关注了风险管理和问题预测用运算数据的文本挖掘、基于报告的高下文剖析的生产指标和模式识别,以及报告分类等主题。只管文献中包含了利用文本挖掘技能缓解行业中基于文本的寻衅等研究,但ML在这一领域仍有巨大潜力,必须对ML进行进一步探索。
四、结论
数据驱动的方法和AI算法有足够的前景,有朝一日它们可能比基于物理的方法更可靠。它们的紧张来源是数据,这是每个场景的基本要素。这些算法可学习数据并揭示看不见的模式。在石油行业内,人们对利用这项技能从每秒天生的大量数据中获取信息非常感兴趣。许多研究探索了AI在该行业各个分支学科的适用性;然而,明显缺少两个紧张特色。也便是说,关于这一主题的大多数研究要么不足实用,不适用于实际领域的寻衅,要么仅限于特定问题,不可推广。必须把稳数据本身以及数据的分类和存储办法。只管有大量的由不同学科产生的数据,但它们仍旧存在于部门的小数据库中,其他职员无法访问。为了从数据中获取尽可能多的信息,数据必须存储在一个集中的数据库中,不同的运用程序可以从中方便地利用数据。在数据采集后以及在利用AI和ML技能之前,必须对数据进行处理,以便有效地提取特色并确保数据能够有效地支持算法。只管AI和ML技能在石油和油藏工程领域越来越主要,但它们只是整体系统的一部分。为了确保该系统能够供应代价,将算法运用于这一具有寻衅性的领域还须要仔细考虑,并且必须供应精确类型、质量和数量的数据,然后对数据进行有效处理,以取得预期结果。因此,只管AI是有效管理天下地下资源的关键工具,但数据是充分利用这些可能性的关键。
注:本文内容呈现略有调度,若需可查看原文。
改编原文:
Mohammad Ali Mirza, Mahtab Ghoroori, Zhangxin Chen. Intelligent Petroleum Engineering[J]. Engineering,2022,18(11):27-32.
注:论文反响的是研究成果进展,不代表《中国工程科学》杂志社的不雅观点。