关键词:
石油地质大数据
机器学习
三维地质建模
知识本体
孔隙度预测
海洋油气资源综合评价
摘要:
石油地质大数据中隐含了丰富的石油地质知识,石油地质大数据分析已经成为石油勘探开发与地质科学研究的重要课题之一。机器学习通过计算机模拟人类的学习行为,自动地发现大数据中隐含的模式、结构和关系,是石油地质大数据挖掘与知识发现的有利工具。然而,运用机器学习方法对石油地质大数据进行分析时,面临两个关键问题:(1)如何对多源异构、多尺度石油地质大数据进行融合与组织,(2)如何在机器学习中充分融入已知的地质信息和地质地球物理专家知识。本文针对这两个问题进行了系统的研究,形成了一套石油地质大数据机器学习方法体系,为实现智能油田、智能地质提供方法支持。本文主要工作概括如下:(1)针对石油地质大数据存储分散、多源异构等问题,设计了基于数据湖技术架构和元数据的石油地质大数据关系融合策略。该策略允许石油地质大数据以各种模式和结构存储于数据湖技术架构下,从元数据出发,梳理数据源元数据和业务元数据的标识符,建立其关联关系,实现石油地质大数据的关系融合。(2)设计了面向机器学习的三维地质模型和知识本体构建方法。将三维地质模型作为机器学习的直接数据源,开展基于三维地质建模的石油地质大数据组织方法研究,以面元为数据组织单元、不规则三角网(Triangulated Irregular Network,TIN)为数据组织模型,制定三维表层模型建模策略;以体元为组织单元、八叉树为数据组织模式,设计三维地质体建模策略;建模实例表明,基于三维地质建模能够实现多源多尺度石油地质大数据的组织与可视化表达。为了机器学习所需业务知识的组织与复用,定义知识本体的五个基本要素,包括业务主题下的概念、属性、内容、关系以及在三维地质模型上的操作,在此基础上,研究知识本体构建方法,通过知识本体从三维地质模型上提取业务知识和业务数据。(3)为了利用地质变量之间的映射关系预测目标变量,研究了面向预测的机器学习方法。综合机器学习预测方法存在的关键问题与地质露头孔隙度定量预测的需求,提出了基于机器学习的地质露头孔隙度预测方法。区别于传统方法,该方法以三维露头表层模型为数据源,利用光谱数据预测孔隙度,以此为目标对地质露头知识本体实例化,探讨孔隙度光谱响应特征与预测可行性,采用机器学习方法构建地质露头孔隙度预测模型。将该方法应用于陕西省延长组砂岩露头孔隙度预测的结果表明,该方法能够定量预测砂岩孔隙度,为地质露头孔隙度定量反演提供了基础。基于此,设计了面向预测的机器学习方法应用策略。(4)为了深入挖掘小样本的多元地质信息以获得可靠的综合评价结果,研究了面向小样本多指标综合评价的机器学习方法。针对评价指标权重确定问题,在权重计算过程中引入专家知识并降低其主观性和不确定性,研发了知识驱动的模糊层次分析-灰色关联分析评价方法(Fuzzy AHP-GRA)。提出了基于机器学习的油气资源评价方法,相对于传统方法,该方法以三维地质模型为数据源,根据知识本体确定评价指标体系并从三维地质模型中提取评价指标数据,利用机器学习方法进行海洋油气资源综合评价。在南黄海盆地崂山隆起开展方法应用研究,经与已知地质信息对比,证实本文方法评价结果较好。以此为基础,形成了面向小样本多指标综合评价的机器学习方法应用策略。