中国海油副总裁孙福街:中国海油勘探开发数据治理探索与实践!

中国海油副总裁孙福街:中国海油勘探开发数据治理探索与实践!


中国海油勘探开发数据治理探索与实践

引用
孙福街.中国海油勘探开发数据治理探索与实践[J].中国海上油气,2024,36(6):169-176. 
SUN Fujie.Exploration and practice of data governance for exploration and production of CNOOC[J].China Offshore Oil and Gas,2024,36(6):169-176.
作者信息

孙福街1,2

(1. 中国海洋石油集团有限公司 北京 100010; 2. 海洋油气高效开发全国重点实验室 北京 102209)

第一作者介: 孙福街,男,教授级高级工程师,主要从事海上油气田开发、提高采收率、数智化等方面的管理与研究工作。地址:北京市东城区朝阳门北大街25号(邮编:100010)。E-mail:sunfj@cnooc.com.cn。

摘要 
油气企业在勘探开发主营业务领域的数智化转型是培育新质生产力、实现高质量发展的重要途径,而数据治理工作,又是实现数智化转型的基础。通过分析国内外油气企业数据治理现状,指出中国海油在油气勘探开发数据治理工作中面临的业务链条长、技术要求高和管理难度大三方面挑战; 围绕具有中国海油特色的“组织推动、基础治理、平台支撑”三大基础能力、“数据整合、应用整合”两项核心任务、一系列“价值场景”的勘探开发数据治理体系整体思路,提出七项数据治理主要措施,即构建组织体系、建立数据资产目录、制定数据标准、提升数据质量、保障数据安全、构建数据平台及推进数据整合与应用整合。中国海油数据治理的典型成效已初步体现,在现场作业方面能够全面支撑“秦皇岛32-6”“深海一号”等智能油气田建设,在研究设计方面可为勘探开发一体化协同研究平台提供全专业数据支撑,在管理决策方面可为业财一体化平台提供便捷数据服务。中国海油在勘探开发数据治理工作中的探索与实践,能够为其他油气企业提供有益的经验借鉴与启示。
关键词:数智化转型;数据治理;中国海油;勘探开发;数据质量;数据平台
引言

在数字化快速发展的时代背景下,数据治理对油气勘探开发领域的决策制定、风险管理及运营效率提升具有重大意义,并且是企业提升核心竞争力、实现高质量发展的必然选择[1-5]。国内外大型油公司紧跟数字化技术发展趋势,在数字化建井[6]、数字盆地[7]及智能油田[8]等多方面同时发力,其中斯伦贝谢公司与谷歌云合作的DELFI数字平台[9]、中国石油化工集团有限公司“石化智云”工业互联网平台[10-11]、中国石油天然气集团有限公司“梦想云”平台[12]为典型代表。

油气勘探开发数据具有广泛性、专业性和动态性,广泛覆盖地质结构、流体性质及生产活动等多维度信息[13],横跨勘探、开发、生产等多个专业领域及环节。中国油气企业在长期的油气田运营中,积累了规模庞大、复杂性高、种类繁多的数据资源[14],数据治理工作挑战很大。本文以中国海油勘探开发领域数字化转型为背景,提出适合海上油气勘探开发的数据治理体系和主要措施,以期为油气行业的数据治理工作提供参考。

1 国内外油气企业数据治理现状及面临挑战

1.1 油气行业整体数据治理现状

国外油气行业数据治理起步于20世纪80年代末,在国际数据管理协会(Data Management Association,DAMA)的影响和推动下,以石油技术开放标准联盟(Petrotechnical Open Standards Consortium,POSC)和公共石油数据模型协会(Public Petroleum Data Model Association,PPDM)的先后成立为标志[15-17]。自1990年至今,很多国际知名石油公司的数据治理工作也随之开始,显著提升了各大油气企业数据管理效率和标准化水平,有力支撑了早期数字油田、智能油田建设工作。例如:1994年,挪威建立了世界上第一个石油中央数据仓库; 2013年,BP、道达尔等石油公司相继建立公司级数据中心。物联网、大数据、云计算等新一代信息技术兴起之后,国外油气企业数据治理和数字化转型工作成效显著。例如:壳牌、斯伦贝谢、哈里伯顿等国际石油公司,于2018年成立了OSDU论坛[18],并于2021年发布了以该论坛名称命名的数据管理平台——OSDU数据管理平台,目前该平台已发展成为国外油气企业开展数据治理,消除数据孤岛,打通能源企业、云服务商、专业软件数据壁垒的主流数据生态系统; 雪佛龙公司于2017年与微软合作建设物联网与数据治理,优化勘探、油藏管理、生产操作、中游的物流和营销业务,极大提升了企业的生产力和决策能力[19]; 2016年,BP公司通过实施“五年数字化转型路线”搭建了数据平台Project Plant,实现了源头质量控制,最终实现全球关键业务数据可见、可联、可共享[20]

相比于国外油气公司,中国油气行业的数据治理工作起步稍晚,研究内容以数据模型的建立及应用为主[21]。1989—1991年,中国石油天然气股份有限公司(以下简称中国石油)制定了涵盖钻探、物探、测井、分析化验等9大类数据的统一标准,其下属油气田基于此开展了专业数据库建设工作,此后经过多轮发展迭代,逐步形成了中国石油统一的石油勘探开发数据模型(EPDM模型)[22]。2016年中国石油“共享中国石油”战略[23]提出后,新一轮的数据治理工作也随之开启,逐步形成了以数据“共享共治”理念为引领,以数据架构管理、质量管理、安全管理、服务管理为主体,以数据治理平台为依托,以组织、制度、流程为保障的综合数据治理体系[24],构建了独具特色的数据连环湖生态格局[25]。2002年左右,中国石化成立了数据标准管理组织,伴随其信息系统和数据中心建设,发布了包含编码规范、源头数据采集、业务数据模型等在内的50余项标准[26]

1.2 中国海油数据治理现状及面临挑战

中国海油的数字化工作于2010年初开始。在之后10年的信息化建设工作中,构建了包括业务决策、流程管控、基础网络在内的信息化支撑体系,同时取得了一系列阶段性成果,例如开发生产平台、油藏类比系统等。进入2020年,随着信息化工作的不断加深,“数据孤岛”和“烟囱”式系统等问题得以显现,勘探开发数据治理工作也成为了中国海油实施数字化转型的必由之路。

然而,数据治理工作是一项复杂的系统工程和基础性工作,数据治理工作能否发挥作用将影响业务是否健康发展,关乎科学快速的决策部署,对今后中国海油勘探开发业务的共享与创新,都将产生重要作用; 数据治理也是现代企业管理中的重要环节,但大数据时代数据量的爆炸性增长,使数据的高效处理、存储、分析和应用,成为数据治理工作中的难题; 数据治理要实现跨部门、跨系统的数据整合与共享,需克服组织内部的信息孤岛难题; 数据治理需确保数据安全,如何加强数据安全防护,确保数据合规使用,成为数据治理工作中企业亟待解决的问题。

因此在勘探开发领域,中国海油的数据治理工作主要包括以下3方面挑战。

1)业务链条长。海洋油气上游勘探开发包含勘探、开发、生产、海洋工程、钻完井、储量6大专业,细分业务活动上千项。由于业务逻辑交错复杂,仅仅对单一专业进行数据治理难以取得成效。因此,如何有效协调6大专业间冗长的业务链条串联起来,成为油气勘探开发数据治理治理的挑战之一。

2)技术要求高。油气勘探开发数据治理相比其他行业,面临着复杂的业务对象关系和数据类型。随着不同阶段的发展需求,有限公司范围内存在分散应用系统200余个,历史数据6亿余条。各版本的数据库类型不同且个数较多,导致数据来源众多,从而对大数据的处理、存储、共享带来了极大挑战。

3)管理难度大。油气勘探开发数据治理范围点多、面广,治理工作面临巨大的组织协调难度。要推进治理进程,就必须改变以往的单一专业业务习惯,打破固有的线下割裂业务流程,突破部门组织间的权责界限,并充分调动广大员工的积极性,这一过程对企业的组织协调带来了又一挑战。

2 中国海油数据治理整体思路及主要措施

2.1 治理体系建立整体思路

2021—2023年,中国海油在汲取国内外油气公司数据治理体系先进经验的基础上,将DAMA的成熟方法论与海油实际相结合,形成具有中国海油特色的“1 2 3”勘探开发数据治理体系(图1),即提升“组织推动、基础治理、平台支撑”三大基础能力,推动“数据整合、应用整合”两项核心任务,开展一系列“价值场景”。基于业务驱动、统一管控、价值导向、以用促治、采用分离、源头治理原则,通过构建“五位一体”的组织,建立全面的数据资产目录,制定六大专业数据标准,开展数据质量管理工作,保障数据安全,并打造数据湖平台,实现了数据治理能力的综合提升。

中国海油副总裁孙福街:中国海油勘探开发数据治理探索与实践!

图 1 中国海油勘探开发数据治理体系

2.2 数据治理主要措施

2.2.1 构建组织体系

数据治理组织模式描述组织各组成部分间的关系,可靠的组织模式有助于建立问责机制,确保组织内部的正确职能得到体现。常见的数据管理组织模式包括分散、网络、混合、联邦和集中模式等,其中联邦模式提供了具有分赛执行的集中策略,通过设置不通过的层次来协调数据管理组织、业务线及IT三者关系,更适用于大型企业以及复杂业务场景。

针对油气企业体量庞大、业务复杂,难以形成合力集中统一开展数据治理工作等难题,中国海油考虑到自身组织和领域的复杂性、成熟度,采用联邦组织模式,形成由数据治理领导组统筹协调、总部各专业部门业务驱动、各分子公司具体落实、研究中心总体技术支持、各内部服务单位重点支持的“五位一体”管理组织(图2)。

中国海油副总裁孙福街:中国海油勘探开发数据治理探索与实践!

图 2 中国海油勘探开发数据治理组织体系

2.2.2 建立数据目录

数据资源目录可对信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用以描述各个信息资源的特征,以便于对信息资源的检索、定位与获取。通过深入调研华为等企业数据的树形五层资产目录构建方法,从中国海油集团公司业务线出发,发布《集团公司数据资产目录方法论》,形成树形五层资产目录结构。通过对数据资产进行规范化、系统化的归并、整理、分类等操作,编制了企业级勘探开发数据资产目录,充分厘清数据情况,全面盘点了从L1(主题域分组)到L5级(属性级)的勘探开发数据资产清单,梳理核心端到端流程,构建6大业务域5级数据资产目录,覆盖了勘探开发所有核心业务环节,逐步形成了数据资产视图、统计指标报表和安全分类分级等多个数据资产应用。

2.2.3 制定数据标准

数据标准作为数据治理的基石,对确保数据质量、促进数据共享与整合至关重要。中国海油先后发布了涵盖勘探、开发、储量、生产、钻完井、海洋工程6大专业的40余册数据标准,建立了上游勘探开发统一数据标准体系,实现了从数据源到数据应用的全面标准化管理。这些标准不仅规范了数据的定义、格式等基础属性,还明确了数据的采集规范、管理责任及质量控制要求,为数据质量的提升提供了有力保障。在数据标准制定过程中,采用知识图谱一致性判别技术和业务活动五维度描述方法,实现了多专业融合的标准一致性检查,建立了中国海油全专业贯通一致的数据标准,形成9000多个数据集的关联互通。在数据建模方面,借鉴POSC标准建模方法,基于多对象关系提取数据属性,创新维度建模和关系建模的融合优化技术,有效提升了数据模型的一致性和易用性。

2.2.4 提升数据质量

数据质量保证了数据能够正确、完整、真实反映事务本质,确保数据符合标准要求。主流数据质量评估模型主要包括《数据质量评估框架》(data quality assessment framework,DQAF)与GB/T 36344—2018《信息技术数据质量评价指标》。依据以上2项标准,从“规范性、完整性、准确性、一致性、及时性、可用性”6个性能的评估维度,采用对象追踪和属性匹配方法,建立全专业准确性和及时性规则,基于多对象全流程业务逻辑关系,建立覆盖全专业的数据完整性质量规则。围绕源头数据、数据入湖和湖内数据,开展质量检查工作,形成“问题发现、问题分析、问题整改、重点监控”闭环管理机制。通过数据治理平台,智能配置质量稽核模型,主动预警潜在问题,定期自动化生成详尽质量报告,通过数据质量闭环管理机制,实现数据质量持续提升。

2.2.5 保障数据安全

参考GB/T 37988—2019 《数据安全能力成熟度模型》构建上游数据安全体系,具体包括制度建设、分类分级、工具建设、数据权限管控4部分。在制度建设方面,编制并发布了《勘探开发数据安全管理办法》《勘探开发数据分类分级管理细则》《勘探开发数据权限管理办法》等一系列管理制度; 在分类分级方面,依据《中华人民共和国数据安全法》、工业和信息化部《工业数据分类分级指南(试行)》《中国海油商业数据分级保护目录》《中国海油工作事项清单》等权威文件,对勘探开发数据湖内存储的各类数据进行了分类分级,并将其纳入数据标准管理体系,实现“业务定义安全”; 在工具建设方面,通过定制化开发数据安全管理模块,实现了敏感数据识别、分类分级管理、数据脱敏加密、安全策略配置、数据审计等功能,全方位保障数据资产安全; 在权限管控方面,面向个人和应用系统两大类用户数据访问需求,综合基于角色的访问控制(role based access control,RBAC)和基于属性的访问控制(attribute based access control,ABAC)两种权限管理模型的优点,搭建了具有中国海油特色的数据权限管理体系,在油气勘探开发领域首次实现了对行级数据的加密和动态脱敏。

2.2.6 打造数据平台

数据管理平台是开展数据治理工作的重要工具支撑。中国海油于2020年启动勘探开发数据湖平台建设(图3)。建设过程中,通过创新性设立“赛马”机制,结合勘探开发数据特点对各项基础工具和技术能力进行充分验证,优选出最佳技术方案,有力保障了平台建设质量。

中国海油副总裁孙福街:中国海油勘探开发数据治理探索与实践!

图 3 中国海油勘探开发数据湖总体架构

经过4年持续迭代,勘探开发数据湖平台已被打造成为中国海油首个全自主可控的大数据管理平台。在数据接入方面,平台采用高性能同步引擎、云原生大数据平台、多源异构统一存储等技术,可实现数据的秒级接入汇聚。在数据管理方面,平台采用模型一致性检验、模型自动化安全投影、海量实体关系(ER)图渲染、全链路血缘支撑变更影响分析等多项先进技术,有力保障了平台数据的有序管理,且各数据管理工具实时联动。在数据服务方面,已为50余套上游业务应用系统提供高效、多类型的数据服务,全面满足勘探开发业务数据应用需求。

2.2.7 推进数据整合与应用整合

数据整合主要通过历史数据清洗迁移,使得数据资源得以整合,数据质量得到提升。中国海油通过“源头采集”“节点审查把控”,确保新增数据常态化“全、准、新”入湖。其中,“源头采集”主要是依托数据标准,由各专业定制化开发了10余套符合专业自身特点的采集工具,实现了数据“采用分离”,即一次性采集,多专业共享。经过持续不断的迭代优化,目前源头采集专业覆盖率和采集自动化率均已达到80%以上。“节点审查把控”是指在探井部署、储量评审、区域可研/基设、工程安装、区块投产等重大项目节点论证前,均要以其前置业务节点产生的数据成果是否入湖为必选检查科目,进而确保了源头数据采集的及时性、完整性,是中国海油在解决数据采集管理“缺位”、一线采集责任落实不到位的开创性举措。

在应用整合方面,中国海油坚持“业务驱动、IT引领”的建设原则,组织勘探开发各专业对长期以来建成的“烟囱式”散小系统进行全面摸排梳理,采用统一方法论和技术路线对其进行功能整合与流程再造[27],先后共梳理出待整合系统70余套,涉及功能模块6000余个,并最终将其整合为5大专业系统。新系统所需数据均来自于勘探开发数据湖,相比于过去,新系统的上线运行使得业务流转更加高效,数据汇总更加便捷,分析决策更加科学。与此同时,积极开展老旧系统关停并转工作,并在节省运维费用、云计算资源等方面产生了正向收益。

3 中国海油数据治理实践及成效

1)现场作业方面,全面支撑“秦皇岛32-6”“深海一号”智能油气田建设。

实现数智化转型是中国海油数据治理工作的目标,而建成智能油气田,是数智化转型成功的重要标志之一。得益于数据治理在统一数据标准和数据模型、提升数据质量、高效数据服务等方面的全面支撑,以“秦皇岛32-6”智能油田、“深海一号”智能气田为代表的一批智能油气田应用系统顺利上线。秦皇岛32-6油田在其智能化建设过程中,引用标准数据表近千张,完成海上9万余点位实时数据回传陆地、秒级入湖,依托数据湖高效数据服务,在综合报表、指标分析、AI分析等方面实现功能模块快速搭建。秦皇岛32-6油田系统上线后,2023年1月至今累计推荐调控30余井组,减缓自然递减率1.7%,累计增油超6000m3。“深海一号”智能气田依托数据湖数据,通过智能化的气藏管理,实现开发指标最优化,延缓气井见水周期,预期提高采收率0.5%。通过少人化的遥控模式改造,预期一年平均减少6天台风导致的停产,减少海上作业人工天数10%,具备在台风期间远程遥控,保持连续安全稳定生产能力。

2)研究设计方面,为勘探开发一体化协同研究平台提供全专业数据支撑。

通过开展数据治理,实现了勘探开发多个细分专业数据的有效汇聚。在此基础上,为勘探开发一体化协同研究平台的建设提供了全面数据支撑。通过600余个标准数据集,500余个数据服务,累计5200余万数据的全方位支持,多场景、多岗位协同研究工作模式得以实现。相比于过去传统方式,新平台可减少近90%科研数据收集时间,综合研究效率提高近30%。以地震解释工作为例,原来需要对测井解释成果、历史地震资料等大量数据进行手工收集、整理、导入、导出等复杂工序耗费4~5天才能完成的工作,现在可“一键”完成。

3)管理决策方面,为业财一体化平台提供便捷数据服务。

在管理决策方面,数据湖平台为业财一体化平台提供了来自勘探、开发等6大专业系统,包括井、油气田评估基本数据表、油气田参数表、调整井产量规划表等30余张底表的数据服务,实现了勘探类、生产类、工程类等多个专业财务指标的自动获取。其中,可采储量、单储系数(油)等30余个重要指标的整体差异率对比过去人工方式保持在5%以内。目前,财务部门可通过业财一体化平台直接了解经营管理情况,且收入、成本、利润、产量等指标在系统上可追溯,资本支出流向分析、供应商分布情况分析等更加精细化,为高层决策提供了有力的数智化保障。

4 结束语

通过深入开展油气勘探开发数据治理探索与实践,中国海油走出了一条符合自身发展和业务实际的数智化转型道路,逐步探索形成了基于勘探开发数据特点的数据治理体系,建成了技术先进、自主可控的大型数据管理平台,有力支撑了秦皇岛32-6智能油田、协同研究平台、业财一体化等典型场景应用,取得了初步应用成效。随着大数据、人工智能、大模型等技术的不断成熟与应用,数据治理工作将更加重要,油气勘探开发数据治理发展的未来,需要进一步优化其治理体系,强化数据质量监控与评估机制,深化数据挖掘与分析能力,以更加精准的数据洞察支持勘探开发决策,推动数据价值最大化。

发表于《中国海上油气》2024年第36卷第6期

———END———

发布者:cubeoil,转转请注明出处://www.mirrorballz.com/archives/98241

(0)
上一篇 2025年1月20日 上午9:05
下一篇 2025年1月20日 上午9:06

相关推荐

发表评论

您的电子邮箱地址不会被公开。