文必龙 计秉玉
(中国石化石油勘探开发钻研院消息技术钻研所,北京 )
摘 要 以后的各种IT布局方法和软件工程方法在指点石油企业启动数据资源布局时,旦伍纯须要联合石油勘探开发数据资源治理的特点启动详细化。
本文剖析了石油勘探开发数据资源治理方面的现状及特点,提出了基于业务驱动的石油勘探开发数据资源布局方法,给出了构建勘探开发业务模型、数据资源目录的方法,以及数据中心的总体架构,为石油勘探开发数据资源布局提供了完整的方法论。
关键词 数据资源 业务驱动 业务模型 数据中心
Research on Method of Petroleum Exploration and Production
Data Resource Planning Based on Business-driven
WEN Bilong,JI Bingyu
( Information Technology,Exploration and Production Research
Institute,SINOPEC,Beijing ,China)
Abstract To guide data resource planning,the IT planning methods and software engineering theory need to be specified according the features of petroleum data resource features in petroleum exploration and production data resource management are analyzed,and a method of data resource planning based on business-driven is put forward,that presents the approaches how to build petroleum exploration and production business model and data resource catalogs,and architecture of data provide a complete methodology to plan petroleum exploration and production data resource.
Key words data resource;business-driven;business model;data centre
在油气勘探开发综合钻研环节中,须要从海外外油田搜集少量的数据,同时综合钻研成绩中蕴含了少量的数据,如各种图表、报告。
为了治理和运行这些数据,各钻研部门纷繁展开了与名目钻研相关的数据资料治理系统的树立,但由于缺少一致的布局,在数据资源的树立和治理中存在以下疑问:数据库树立 “小、散、杂”,难以治理;数据扩散存储,数据之间的逻辑关联度低,不能集成共享;数据搜集艰巨;缺少专门的数据服务机制,数据运行艰巨。
因此,有必要对油气勘探开发综合钻研的勘探开发数据资源启动一致布局,即展开数据治理与运行需求剖析,从总体上设计数据中心树立打算。
数据资源布局(Data Resource Planning,DRP)的方法关键是基于软件工程实践和IT策略布局的各种方法论。目前少数国内出名的IT咨询公司均驳回企业架构(Enterprise Architecture,EA)这一先进实践方法,例如TOGAF企业架构框架,制订具有自身特点的IT布局编制方法论,并在企业布局咨询名目中运行,取得了良好效果。针对数据资源,高复先在消息工程方法论的基础上,总结出了一套消息资源布局(Information Resource Planning,IRP)方法。IRP方法以面向主题数据库的总体数据布局方法为基础,依照必定的方法橘歼步骤、遵照相关规范规范、应用有效的软件允许工具启动各职能域的消息需求和数据流剖析,制订消息资源治理基础规范,树立全域和各职能域的消息系统框架——配置模型、数据模型和系统体系结构模型。
本文依据EA实践和IRP方法,联合油气勘探开发综模咐合钻研的特点,提出了一套基于业务驱动的勘探开发数据资源布局方法。
1 数据布局的基本思维
数据资源布局是驳回迷信正当的方法,对企业消费运营环节中发生和经常使用的数据的相关内容、规范、技术、软件、人员、撑持条件等启动片面梳理、优化和设计,提出片面的数据资源采集、传输、存储、运行、治理的处置打算,以便企业提高数据的共享水平,降落数据采集、治理、运行的老本,施展数据资源的最大价值。
数据资源布局的目的是优化企业数据治理品质。
这包括提高数据共享水平,降落数据采集、治理、运行的老本,优化数据资源的价值等。
其中,首先要向企业不同层级提供相关的消息。
对决策层,提供的消息包括:有哪些数据资产,还要投资树立哪些,数据投资效果如何,能否有重复树立;对治理层,提供的消息包括:数据保管在哪里,谁在治理,哪些人在经常使用,数据品质如何;对口头层,提供的消息包括:有什么数据,数据在哪里,如何失掉数据,如何提交成绩;对消息服务部门,提供的消息包括:业务部门须要什么数据,如何经常使用这些数据。
数据资源布局的指标是提出一个数据资源树立处置打算。
经过实施打算,可以树立企业数据中心及配套的树立和治理体系,到达数据资源布局的目的。
数据资源布局的内容包括梳理数据需求,即数据内容;设计数据相关规范,包括数据元规范、数据采集规范、数据治理规范、数据代码规范等等;设计数据树立和治理的技术打算;数据治理和服务的软件体系架构;数据树立的组织架构和配套制度等。
数据资源布局的环节如图1所示。
假设把数据中心的树立作为一个完整的软件工程名目,数据资源布局位于需求剖析阶段和概要设计阶段。
在名目实施中,还须要进一步依据布局的各项打算启动详细设计、系统开发、系统测试和运转保养。
在数据资源需求剖析阶段,经过调研,梳理以后勘探开发综合钻研的业务范围、钻研优惠、曾经树立的数据库及数据内容、运行软件及部署状况。
依据调用状况树立业务模型,用规范化的方式形容各项钻研优惠及每项优惠的数据需求,并对数据流启动剖析,构成一致的数据资源目录。
需求剖析阶段最终成绩是需求剖析报告,外围内容由一组规范组成,包括业务模型、数据资源目录、数据元目录、数据流规范。
概要设计阶段关键义务是依据数据需求启动打算设计,构成数据资源树立打算,详细包括:综合数据库树立打算、综合钻研数据服务与治理平台树立打算、数据中心运维体系。
构成数据模型、数据服务配置、数据治理配置、数据汇交治理流程、数据治理与服务组织架构等总体架构,并构成数据中心树立的名目框架。
经过数据资源树立打算明白了数据如何存储,如何控制数据品质,数据如何树立,数据如何治理,数据如何失掉、提交、运行等疑问。
图1 数据资源布局环节
图2 数据资源布局的成绩及其之间的相关
在名目实施阶段,还须要依据数据资源树立打算,对每一个名目启动详细设计和开发。
数据资源布局的成绩包括数据资源需求剖析报告和数据中心树立打算。
需求剖析报告中,蕴含了业务模型、数据资源目录和数据元目录,数据中心树立打算包括数据库和数据模型在内的数据库树立打算、数据服务与治理平台、数据中心运转保养体系。
图2给出了这些成绩及其之间的相关。
业务模型中的每一个业务优惠经常使用和发生的每一类数据都应在数据资源目录中启动注册,数据资源目录中的每一类数据都要用一个或多个数据元启动形容。
数据库中的数据实例应该归类到数据资源目录中,数据元与数据模型之间要树立映射相关。
依据上述相关,运行软件或用户可以依据业务优惠应用数据服务与治理平台十分繁难地从数据中心失掉须要的数据。
2 基于6W的业务模型
业务模型(Business Model)是一种经过定义组成优惠及优惠之间逻辑相关来形容企业运营消费环节的模型。
勘探开发业务建模就是要将石油勘探开出现命周期中触及的业务形象为一个完整的业务配置结构,树立勘探开发业务模型。
树立此模型,在系统地、实质地、概括地掌握勘探开发配置结构的同时,还要树立勘探开发业的数据模型、常识模型、软件模型等与配置相关的消息模型。
业务剖析与建模环节从方式上可分为4个阶段:一是业务畛域划分;二是分业务畛域建模;三是业务模型集成;四是业务模型规范化。
业务模型驳回 “业务域-业务分类-业务优惠” 3层结构。
将石油勘探开发触及的一切业务划分为多个业务域,每个业务域树立多级业务分类,每个分类中定义一个或多项最基本的业务优惠。
业务域(Business Domain)是对企业中的一些关键业务优惠畛域的形象,而不是现无机构部门的照搬。
对油田业务域的划分可以依据某一主题启动。
业务畛域的划分准则是:(1)依据专业划分业务畛域;(2)依据油气田勘探、开出现命周期划分业务畛域;(3)依据油气田勘探、开发治理阶段划分治理业务域。
业务畛域的划分参照以上3种准则启动划分,尽量合乎油气田勘探、开发治理商定俗成的治理习气,做到不同业务域间的业务不重复,并保障能笼罩一切的勘探、开发业务。
依据以上准则,油气勘探开发业务畛域可划分为“物化探”、“井筒工程”、“剖析化验”、“综合钻研”、“油气消费”、“低空工程” 等六大业务畛域。
业务是由一系列业务优惠组成的,对业务优惠的形容依照 “6W” 的形式启动,即优惠是由谁(Who)动员的、在什么时期(When)动员的、在哪里(Where)动员的、为什么(Why)要动员这个优惠、在这个优惠中都触及了哪些(Which)对象、这些对象的个性是什么(What)。驳回业务单元定义了介入业务优惠的基本元素以及元素之间的相关。一个业务单元包括以下8类元素:1个业务优惠,该优惠作用的1个业务对象,实施该优惠的组织机构,1组结果对象(输入),1组介入对象(输入),业务规定,相关对象的个性,对象之间的相关。业务单元的结构如图3所示。
业务单元中,“个性” 定义了业务优惠须要的数据、业务优惠相关的常识,是数据布局中梳理的重点;“介入对象” 包括各种人员、软件、数据、设备、资料、方法等;“作用对象” 包括区块、油藏、井、层位、油田、企业等;“结果对象” 可以是油井等油田实物对象,也可以是文档、方法、钻研成绩等技术性对象。
基于6W的业务模型的建模经过在一致的业务域分类架构下对繁多业务优惠的业务单元启动形容,没有启动专门的业务流程梳理,但由于业务单位中形容了业务优惠介入对象与结果对象,即定义了优惠的输入与输入,以这些对象为中介,因此很容易智能构成业务流、数据流、常识流等各种流程。
业务优惠与数据之间的相关可以用 “CUR” 矩阵形容。
矩阵中,行对应业务优惠,列对应数据元。
假设业务优惠中创立了某一项数据则行列对应的值标识为 “C”(Create),假设业务优惠对数据启动了更新则标识为 “U”(Update),假设业务优惠援用了某一项数据则标识为 “R”(Read)。
经过CUR矩阵,可以审核某一数据能否有惟一的创立源头,保障数据源头的惟一性。
依据CUR相关,可以智能构成数据流。
图3 业务单元的结构
3 勘探开发数据资源目录
勘探开发数据资源目录是对油田企业、勘探开发钻研院或中国石化全体已有和须要数据的分类与组织方式形容。
数据资源目录形容了企业须要什么数据、有什么数据、数据在哪里、谁在治理数据、哪些人在经常使用、哪些运行软件在经常使用等消息。
数据资源目录既是一个数据树立单位的数据分类与数据组织规范,也是数据中心启动数据治理与服务平台的外围元数据,同时也是用户树立和经常使用数据的依据。
数据资源目录的分类形式是多维的,可以从不同角度启动分类。罕用的维度包括:
(1)按业务对象组织。
包括区块、油藏、井、层位、油田、企业等,除对象自身的基础数据(如井基础消息)即通常所说的静态数据外,还包括该对象的各种灵活数据(如井的日报数据)。
(2)按业务优惠组织。
依据业务模型的 “业务域-业务分类-业务优惠” 3层结构启动分类,每一个业务都有一组按 “CUR” 标识的数据。
(3)按个性组织。
按数据或常识自身的个性启动分类,如长度、密度、浸透率等。
(4)按名目组织。
一个名目经常使用和发生的数据有哪些。
(5)按单位组织。
一个部门经常使用、发生、治理的数据有哪些。
数据资源目录的各个维度是相互关联的,对象、优惠、个性、名目、单位之间的相关如图4所示。
除树立分类目录外,数据资源目录还包括数据实例,因此须要将数据分类与数据库中的实例关联起来,明白标识出每一类包括哪些实例。分类与实例关联的方式关键驳回数据集启动定义,经过数据实例的标识符、标识条件确定数据集中的实例。数据资源分类在数据需求剖析阶段成功,分类与数据实例的关联在数据中心运转时期构成。
数据资源目录中数据分为两级:逻辑数据实体和属性。从技术角度,逻辑数据实体的实质就是数据视图,一个数据视图是一个虚数据表,每一个数据视图由多个属性组成,其中至少包括一个关键字。实体的属性用数据元启动形容。数据元是不用要再分的基本数据单元。以后可间接参照中国石化石油勘探开发数据元字典。
4 数据中心的总体架构
不同企业数据中心的架构会有所不同。本文以中国石化石油勘探开发钻研院的数据中心为例,说明数据中心树立打算。数据中心包括综合钻研勘探开发数据库、数据服务与治理平台、数据中心运维体系,如图5所示。
图4 数据资源分类维度之间的相关
图5 综合钻研勘探开发数据中心
勘探开发数据库包括元数据和专业数据。
元数据是以数据资源目录为外围,形容了专业的分类、目录、结构、经常使用灵活等消息。
外购数据库、天文消息数据库由于起源于外部,自带有成熟的治理软件,属于公共数据,独立于详细的名目钻研。
由于地震数据和测井数据有专门的格局,由专门的软件启动治理,但要与名目数据启动关联。
名目资料与成绩关键以文件方式保管,对共享水平较高的数据须要从半结构化的文件方式转换为结构化数据,数据之间相互关联,成功数据的集成。
综合钻研运行软件有自己外部的名目数据库,经过数据桥技术可以实如今线数据访问。
数据通道用于成功石油勘探开发钻研院数据中心与中国石化各级数据中心的互联。
综合钻研数据服务与治理平台的关键配置包括:GIS钻研指标查问、地震剖面显示、测井曲线显示、资料查问、资料搜查、资料提交、资料下载、系统治理、数据颁布等。
数据中心运维体系包括运维治理组织机构、数据资料上交治理、数据服务治理3个局部。
运维治理队伍的职能包括数据库系统治理、数据服务允许、数据品质控制等。
数据资料上交治理依照数据流和数据生命周期,对各环节启动规范治理,包括:外部数据放开、数据采集、原始资料上交、团体/名目组资料治理、成绩上交、数据流程调整(数据资料目录注册与注销)、安保与权限、审核与验收等外容。
数据服务治理经过数据服务治理制度,规范数据服务行为,树立数据服务技术规范,经过数据运行服务接口规范,为运行系统提供规范的服务接口。
5 论断
数据资源布局方法提出了一套适宜石油勘探开发畛域展开数据资源树立的方法论。
从勘探开发业务需求登程,经过梳理业务流程,树立业务模型,并梳理与业务相关的数据,树立数据资源目录,在此基础上提出成功的数据中心树立打算,从人员组织、数据树立、服务平台构建及运维治理启动布局。
数据资源布局方法成功运行于中国石化油气勘探开发数据模型规范树立,开发了中国石化业务模型(Sinopec Business Model,SPBM),定义了物化探、井筒工程、剖析化验、综合钻研、开发消费、低空工程六大业务域,包括1237个业务优惠,对每一个与业务优惠相关的数据项启动了梳理。
进一步的钻研上班将把数据资源布局方法运行于中国石化石油勘探开发钻研院数据资源树立,经过钻研院业务启动调研,联合SPBM,树立综合钻研数据资源目录,设计数据中心树立打算。
针对中国石化石油勘探开发钻研院综合钻研的数据资源布局成绩可进一步推行运行于石油行业各石油公司的综合钻研数据资源树立。
参考文献
[1]金涛,郑树泉,李名敏,等.企业架构驱动的IT布局方法钻研[J].计算机运行与软件,2009,26(12):164~166.
[2]高复先.消息资源布局——消息化树立基础工程[M].北京:清华大学出版社,2002.
[3]肖波,景帅,吴建军,马承杰.模型驱动技术在油田企业数据中心中的运行钻研[J].大庆石油学院学报,2012,36(1):78~82.
[4]时贵英,文必龙.基于数据元的数据集成技术钻研[J].迷信技术与工程,2011,11(18):4223 ~4227.
[5]Wen Bilong,Zhang semantics for data element with semantic tree[C] of 2008 International Symposium on Information Science and Engineering,2008.12:524~527.
[6]文必龙,肖波,陈新荣.石油勘探开发数据元治理技术[J].大庆石油学院学报,2012,36(1):83~87.
[7]李剑峰,肖波,段鸿杰.中国石化油田企业数据中心总体框架设计[J].大庆石油学院学报,2012,36(1):73~76.
英特尔高水平数据中心的治理 随着企业的开展和革新,其业务的运转以及翻新关于数据中心的要求变得越来越高。
英特尔的技术能够处置数据中心所面临的关键疑问,降落设备治理压力,控制老本激增,提高系统全体安保性,放慢照应速度,协助企业树立高水平大型数据中心。
DataCenter设计/评价英特尔在数据中心设计和评价方面有弱小实力和丰盛阅历,以专业的英特尔数据中心设计方法论和建造流程,驳回业界上游的数据中心生命周期实践,在世界范围内曾经设计和建造过250个数据中心,对高密度数据中心的热力学模型、设计、建造和运维都有十分丰盛的阅历。
英特尔经常使用计算流体力学模型工具模拟高架地板上、下的空气能源状况,并自己结构一些工具验证和优化计算流体力学模型软件的性能。
英特尔介入计算流体力学模型软件的设计是由于英特尔是惟一在高密度数据中心散热畛域做翻新和钻研的公司。
为了验证、优化这些模型的效果以及能源、散热设计假定,英特尔实践建造了局部数据中心。
最新成功建造的T3级、7000平方米的数据中心曾经具有可以允许超越5KW/平方米耗能的才干。
VT(VirtualizationTechnology)虚构化技术关于很多企业来说,虚构化技术对IT基础架构的树立和保养十分关键,IT基础架构的更新曾经不再是为了处置临时的业务保养疑问,而是放眼未来的袜衫翻新大计的保障。
英特尔的虚构化技术(IntelVT),从IT系统的最基础层面协助IT治理者成功虚构化,特意适宜于数据中心级别的数据整合和迁徙。
英特尔多核64位处置器的推出,为虚构化技术在宽广的x86主机运行环节中施展作用提供了英雄用武之地。
或许说,虚构化技术之所以在近一年来的时期失掉了越来越多用户的认可,与英特尔推出了以四核为代表的多核处置器毫不相关。
这是由于,多核是运转多个操作系统和运行的虚构化服芦尺务器的现实选用。
同时,驳回英特尔虚构化技术的VMM所允许的操作系统范围,将比目前纯软件VMM处置打算愈加宽泛。
另外,CPU的虚构化技术是一种配件打算,允许操作系统间接在下面运转,从而无需启动二进制转换,缩小了相关的性能开支,极大简化了VMM设计,进而使VMM能够按通用规范启动编写,性能愈增弱小。
关于那些曾经在运用虚构化软件工具的用户来说,不用参与任何额外老本,就可以借助内置在英特尔处置器中的虚构化技术,来优化虚构化软件工具的性能。
英特尔虚构化技术的关键个性和长处:l专为虚构机监督器(VMM)提供的全新特权空间,可允许未经修正的操作系统和运行在专门为它们设计的环境中运转,从而简化配件调用;l经过配件底层指令集来允许虚构机监督器(VMM)与已装置的GuestOS(虚构机上的操作系统)之间的切换,使得虚构化技术愈加繁难、高效、牢靠;l 虚构机监督器(VMM)和已装置的GuestOS的处置器形态消息保管在公用内存地址空间中,这样可以缩短各个操作系统访问配件之间的距离时期,同时提高了各个虚构机上的操作系统之间的安保;随着英特尔四核至强处置器平台和双核安腾平台的进一步遍及,越来越多的用户将享遭到内置在其中的英特尔虚构化技术的好处。
EEP(EnergyEfficientPerformance) 高能效体现针对企业数据中心对系统高效劳的谋求,英特尔的多核运行以及45纳米技术都为系统高效劳做出了奉献。
与英特尔65纳米技术相比,英特尔45纳米技术的密度参与了一倍,它在相反的芯片空间中归入了近两倍数量的晶体管。
这样,双核处置器就领有了超越4亿个晶体管,而四核处置器中的晶体管数量则超越了8亿。
因此咱们可以毫不夸张地说,英特尔45纳米技术将带来计算性能的渺小飞跃,使二级高速缓存参与50%,并成功更高水平的打破性能效体现。
有效撑持分支机构少量分支机构的存在给企业带来了IT撑持和治理的渺小上班量,营业网点数量泛滥在某些状况会成为银行的累赘,为了有效地处置这些疑问,英特尔协助企业成功网点转型,降落IT撑持和治理老本,促成渠道整合。
vPro博锐技术英特尔博锐处置器技术能够极大地降落电脑治理的相关老本。
这要仰仗英特尔博锐处置器技术的两大关键组件:英特尔被动治理技术(英特尔AMT)和英特尔虚构化技术(英特尔VT)。
实践上,这两项技术自身也具有降落或消弭所有电脑IT允许老本的后劲。
其长处在于:告哗腔改良远程资产治理-无论电脑能否开机,驳回英特尔博锐处置器技术的电脑都能够更轻松地启动识别。
这就可以降落库存失误和审核失误。
识别失误形成的净老本-依据钻研标明装置允许英特尔博锐处置器技术的电脑之后,弥补措施方面的上班可节俭68% 至 91%。
微软斥资1.3亿元投资树立数据中心。
本文地址:http://www.hyyidc.com/article/32798.html
上一篇:数据核心是干什么的...
下一篇:云计算数据核心是什么...