在当今数据驱动的时代,数据中心存储性能已成为企业成功的关键因素。随着数据量的不断激增,组织需要采取策略性措施来优化其存储基础设施,以满足当前和未来的需求。
选择合适的存储类型对于实现最佳性能至关重要。对于高性能计算 (HPC) 和人工智能 (AI) 等要求苛刻的应用程序,固态硬盘 (SSD) 是理想的选择,而对于容错和低延迟应用程序,硬盘驱动器 (HDD) 可能访问频率和性能要求进行优化。这有助于提高整体性能和成本效率。
缓存机制存储经常访问的数据,从而减少对基础存储的访问次数并提高性能。考虑使用固态缓存或内存缓存解决方案。
对于虚拟化环境,遵循虚拟机存储最佳实践非常重要。这些包括优化虚拟机磁盘配置、使用虚拟卷管理程序 (VMM) 的存储功能以及精简配置存储。
持续监控和分析存储性能至关重要,以识别瓶颈并采取预防措施。使用性能监控工具来跟踪指标,并定期检查存储使用情况和容量。
执行定期维护任务,例如碎片整理和健康检查,可以帮助保持存储系统的高性能并延长其使用寿命。
优化数据中心存储性能是一项持续的旅程,需要持续的规划、实施和监控。通过采用全面的方法,组织可以释放其存储基础设施的全部潜力,并为数字化转型奠定坚实的基础。
云计算中可用的服务种类是很多的,不过主要可以分为以下几类:
这种类型的公有云在互联网上通过浏览器对应用程序进行交付。最受欢迎的商务级SaaS应用程序有谷歌的GSuite和微软的Office365;而在企业级应用中,Salesforce独占鳌头。但是几乎所有的企业级应用,包括从Oracle到SAP的ERP套件,都采用SaaS模型。通常,SaaS应用可提供广泛的配置选项以及开发环境,使客户能够自己对代码进行修改和添加。?IaaS(asaservice,基础设施即服务)
在基础层面上,IaaS公有云供应商提供存储和计算服务。但所有主要公有云供应商提供的服务都是惊人的:高可伸缩数据库、虚拟专用网络、大数据分析、开发工具、机器学习、应用程序监控等等。AWS是第一个IaaS供应商,且目前仍是领袖,紧随其后的是微软Azure、谷歌云平台和IBMCloud.
PaaS所提供的服务和工作流专门针对开发人员,他们可以使用共享工具、流程和API来加速开发、测试和部署应用程序。Saleforce的Salesforce的Heroku和Force是非常受欢迎的公共云PaaS产品;Pivotal的CloudFoundry和红帽的OpenShift可以在本地部署或通过一些主要的公有云来访问。对于企业来说,PaaS可以确保开发人员对已就绪的资源的访问,遵循一定的流程和只使用一个特定的系列服务,运营商则维护底层基础设施。
值得一提的是,专为移动端开发人员使用的各种PaaS一般被称作MBaaS(移动后端即服务),或者只是BaaS(后端即服务)。
FaaS,无服务器计算的云实例化,为PaaS增加了另一个抽象层,以便开发人员在堆栈中完全隔绝一切优先级低于他们代码的东西。不是去搞虚拟服务器、容器和应用运行时间,而是上传功能代码块,让它们被某个事件触发(例如表单提交或上传文件)。所有主要云都会在IaaS之上提供应用的一个特殊的好处是,在事件发生之前不会使用IaaS资源,可通过降低资源使用率来减少费用。
1、云计算数据中心的构成
云计算数据中心本质上由云计算平台和云计算服务构成。云计算服务包括通过各种通信手段提供给用户的应用、软件、工具以及计算资源服务等;云计算
平台包括用来支撑这些服务的安全可靠和高效运营的软硬件平台。通过云计算平台将一个或多个数据中心的软硬件整合起来,形成一种分层的虚拟计算资源池,并提
供可动态调配和平滑扩展的计算、存储和网络通信能力,用以支撑云计算服务的实现。
云计算平台是云计算中心的内部支撑,处于云计算技术体系的核心。它以数据为中心,以虚拟化和调度技术为手段,通过建立物理的、可缩放的、可调配
的、可绑定的计算资源池,整合分布在网络上的服务器集群、存储群等,结合可动态分配和平滑扩展资源的能力,提供安全可靠的各种应用数据服务。
2、云计算数据中心的实施过程
云计算数据中心的实施不是一个简单的软硬件集成项目,在实施之前需要谨慎评估和整体规划,充分考虑云计算数据中心的管理模式,并将未来的运营模式纳入到整体规划中,这样才可以充分发挥云计算平台作用。
结合对云计算中心用户需求的调研和国外的实施经验,目前云计算数据中心基础架构实施主要分为以下5个阶段:
1)规划阶段:要将云计算中心建设作为战略问题来对待,管理高层要给予极大的重视和支持,并明确每一阶段所要实现的目标,从业务创新和IT服务转型的高度进行规划和部署。
2)准备阶段:根据本行业特性,充分了解用户采用云计算数据中心想要获得的服务与应用需求,并对云计算平台进行充分的评估,选择合适的技术架构。同时充分考虑系统扩展和迁移的可操作性,保证基础设施平台技术的连续性和核心业务的连续性。
3)实施阶段:资源虚拟化是云计算中心的基础,通过构建支持异构平台的虚拟化平台,可以满足安全性、可靠性、扩展性和灵活性等各方面的服务要求。
4)深化阶段:在实现平台架构虚拟化的基础上,还要实现各种资源调度和分配的自动化,为全面管理和自助服务打好基础。
5)应用和管理阶段:云计算的基本特征是开放性,云计算平台应能提供标准的API实现与现有应用兼容。所有的应用移植是渐进过程,云计算基础架构要很好的支撑核心应用,而并不仅仅是新增的需求。同时,云计算平台建设是个闭环的过程,需要进行不断地改进。
3、云计算数据中心的关键技术
云计算数据中心的建设融合了很多新的技术,主要包括以下几个方面。
1)虚拟化技术
虚拟化技术的应用领域涉及服务器、存储、网络、应用和桌面等多个方面,不同类型的虚拟化技术从不同角度解决不同的系统性能问题。
服务器虚拟化对服务器资源进行快速划分和动态部署,从而降低了系统的复杂度,消除了设备无序蔓延,并达到减少运营成本、提高资产利用率的目的。
存储虚拟化将存储资源集中到一个大容量的资源池并进行统一管理,实现无需中断应用即可改变存储系统和数据迁移,提高了整个系统的动态适应能力。
网络虚拟化通过将一个物理网络节点虚拟成多个节点以及将多台交换机整合成一台虚拟的交换机来增加连接数量并降低网络复杂度,实现网络的容量优化。
应用虚拟化通过将资源动态分配到最需要的地方来帮助改进服务交付能力,并提高了应用的可用性和性能。
云计算数据中心基于上述虚拟化技术实现了跨越IT架构的全系统虚拟化,对所有资源进行统一管理、调配和监控,在无需扩展重要物理资源的前提下,
简单而有效地将大量分散的、没有得到充分利用的物理资源整合成单一的大型虚拟资源,并使其能长时间高效运行,从而能源效率和资源利用率达到最大化。
2)弹性伸缩和动态调配
弹性伸缩可以从纵向和横向两个方面考虑。纵向伸缩性是指在同一个逻辑单元内增加资源来提高处理能力,如:在现有服务器上增加CPU或在现有的RAID/SAN存储中增加硬盘等;横向伸缩性是指增加更多逻辑单元的资源,并整合成如同一个单元在工作。
动态调配是根据需求的变化,对计算资源自动地进行分配和管理,实现高度“弹性”的缩放和优化使用,而使用者不介入具体操作流程。
3)高效、可靠的数据传输交换和事件处理
数据传输交换和事件处理系统是云计算中心的消息和数据传输交换枢纽,不能仅采用组播协议来追求速度,也不能仅采用TCP来追求可靠性,而需要结
合多种协议的优势,有效控制分布在网络上的众多组件之间的数据流向,保证数据通道的畅通性、信息交换的可靠性和安全性。同时,为了满足系统应用的多样性和
业务实时性要求,设计中也要考虑点对点、点对多点、多点对多点等多种连接方式。
云计算数据中心建设的关注点主要有:高可用性、安全性、弹性扩展、高效能、成本效益。 在云计算数据中心的建设中,高可用性是一个核心关注点。 数据中心需要保证24/7不间断的服务,任何宕机或故障都可能导致重大损失。 因此,建设时需考虑冗余设计,包括电源、网络、存储等各方面的冗余,确保单个组件的故障不会影响整体服务。 安全性也是重中之重。 数据中心存储和处理大量敏感数据,必须严防未经授权的访问和数据泄露。 这涉及到物理安全(如门禁系统、监控摄像头)和网络安全(如防火墙、入侵检测系统)等多个层面。 同时,定期的安全审计和漏洞修补也是必不可少的。 弹性扩展能力对于应对业务增长和突发流量至关重要。 云计算的一大优势就是可以根据需求快速调整资源。 数据中心建设时应采用模块化设计,方便后续扩展。 此外,与多个云服务提供商合作,可以实现资源的灵活调配,满足不同场景下的需求。 高效能则意味着数据中心需要以更低的能耗和更高的计算效率来运行。 这可以通过采用高效的服务器硬件、优化软件算法以及实施绿色节能技术来实现。 例如,使用虚拟化技术可以提高服务器利用率,减少闲置资源;而采用液冷等先进散热技术则可以降低能耗。 最后,成本效益是任何建设项目都需要考虑的因素。 云计算数据中心的建设和运营涉及大量投资,因此需要进行全面的成本效益分析。 这包括评估硬件和软件的成本、人力资源投入、能源消耗以及潜在的风险和回报等因素。 通过合理的规划和优化,可以实现成本效益的最大化。
统筹围绕国家重大区域发展战略,根据能源结构、产业布局、市场发展、气候环境等,在京津冀、长三角、粤港澳大湾区、成渝等重点区域,以及部分能源丰富、气候适宜的地区布局大数据中心国家枢纽节点。 节点内部优化网络、能源等配套资源,引导数据中心集群化发展。 汇聚联通政府和社会化算力资源,构建一体化算力服务体系。 完善数据流通共性支撑平台,优化数据要素流通环境。 加强全国一体化大数据中心顶层设计。 优化数据中心基础设施建设布局,加快实现数据中心集约化、规模化、绿色化发展,形成“数网”体系。 加快建立完善云资源接入和一体化调度机制,降低算力使用成本和门槛,形成“数纽”体系。 加强跨部门、跨区域、跨层级的数据流通与治理,打造数字供应链,形成“数链”体系。 深化大数据在社会治理与公共服务、金融、能源、交通、商贸、工业制造、教育、医疗、文化旅游、农业、科研、空间、生物等领域协同创新,繁荣各行业数据智能应用,形成“数脑”体系。 加快提升大数据安全水平,强化对算力和数据资源的安全防护,形成“数盾”体系。
继西电东送、南水北调后,中国又一次国土资源跨区域大规模调配行动正式开启——东数西算。 国家发展改革委等部门2月17日正式发布消息,同意京津冀、长三角、粤港澳大湾区、成渝等地启动建设全国一体化算力网络国家枢纽节点,“东数西算”工程正式全面启动。 这意味着全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。 2月18日,A股数据中心板块掀涨停潮,首都在线等个股20%涨停。 证券时报·e公司从多方渠道了解到,目前国内华为、中兴通讯、腾讯、海兰信、首都在线、优刻得、首都在线、南凌 科技 、中青宝、吴通控股、常山北明、省广集团、先进数通等 科技 巨头或上市公司已参与或布局“东数西算”相关业务,且部分企业已明确表态,未来将抢抓这一 历史 性发展机遇,加快数据中心相关业务发展。 我国算力东西部不平衡 “东数西算”中,“数”指数据,“算”指算力,即对数据的处理能力。 “东数西算”指通过构建数据中心、云计算、大数据一体化得新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。 据了解,和水、电一样,中国算力的供给同样存在不均衡的状况,目前我国数据中心大多分布在东部地区,由于土地、能源等资源日趋紧张,在东部大规模发展数据中心难以为继。 而我国西部地区资源充裕,特别是可再生能源丰富,具备发展数据中心、承接东部算力需求的潜力。 “为此,要充分发挥我国体制机制优势,从全国角度一体化布局,优化资源配置,提升资源使用效率。 ”国家发展改革委相关负责人表示,实施“东数西算”工程,对于推动数据中心合理布局、优化供需、绿色集约和互联互通等意义重大。 上述人士表示,“东数西算”工程的实施,一是有利于提升国家整体算力水平,通过全国一体化的数据中心布局建设,扩大算力设施规模,提高算力使用效率,实现全国算力规模化集约化发展。 二是有利于促进绿色发展,加大数据中心在西部布局,将大幅提升绿色能源使用比例,就近消纳西部绿色能源,同时通过技术创新、以大换小、低碳发展等措施,持续优化数据中心能源使用效率。 三是有利于扩大有效投资,数据中心产业链条长、投资规模大、带动效应强。 通过算力枢纽和数据中心集群建设,将有力带动产业上下游投资。 四是有利于推动区域协调发展,通过算力设施由东向西布局,将带动相关产业有效转移,促进东西部数据流通、价值传递,延展东部发展空间,推进西部大开发形成新格局。 国家发改委相关负责人指出,新一轮 科技 革命和产业变革正在重塑全球经济结构。 算力作为数字经济的核心生产力,成为全球战略竞争的新焦点。 上市公司纷纷表态将抢抓机遇 受“东数西算”工程正式启动消息提振,2月18日,A股数据中心板块上演涨停潮。 截至收盘,东方财富Choice数据中心概念板块21只个股涨停,其中依米康、亚康股份、首都在线均20%涨停,奥飞数据、优刻得、立昂技术、南凌 科技 、东方国信、光环新网等个股则涨超10%。 与此同时,当日,多家上市公司通过互动易平台、微信公众号等表态将抢抓这一 历史 性发展机遇。 首都在线主营云计算服务、IDC托管及IT增值、IT外包、通信集成等信息技术服务,公司在互动平台回复投资者提问时表示,公司在全球23个城市设有节点,51个可用区,帮助企业拓展全球业务;在国家推出数字经济和“东数西算”战略的重大 历史 机遇下,作为数字经济的重要底座,公司IDC及云计算业务高速发展。 海兰信聚焦航海智能化和海洋信息化两大业务领域,公司表示,其海底数据中心(UDC)正是提供了大幅降低“热数据”能耗的解决方案,目前测试机的PUE能耗值仅为1.078,完全满足“东数西算”国家战略中规定的PUE不得高于1.25的要求,公司目前的海南示范项目已经在海油工程开工建设,接下来将积极抓住 历史 机遇期,在大湾区、长三角、京津冀等多个地区加快推进并落地海底数据中心项目,为国家“东数西算”战略项目贡献力量。 优刻得表示,将依托两大自建云计算中心,打造一批“东数西算”典型示范场景和应用,满足企业数字化高质量发展需要,其上海青浦云计算中心、乌兰察布云计算中心分别位于全国一体化算力网络国家枢纽节点的长三角和内蒙古节点。 其中,上海青浦云计算中心是公司在一线城市自建的第一个大型数据中心,总体建筑面积约5.54万平方米,打造长三角生态绿色一体化发展示范工程,预计投产时间为2022年。 乌兰察布云计算中心位于内蒙古自治区算力网络国家枢纽节点的集宁大数据产业园。 南凌 科技 表示,公司作为数字化基础设施——信息传输网络服务的提供者,提供的专用网络服务,包括虚拟专用网服务、企业级互联网接入服务,是数据传输中的重要环节。 公司已在全国36个城市设有60多个业务节点,帮助企业修建专业的“信息高速公路”。 “东数西算”战略的大力推进,将对公司产生积极的影响。 吴通控股表示,其子公司吴通光电智联 科技 (武汉)有限公司主要生产面向数据中心场景的光互联产品,包括10G到100G多模光模块与有源光缆(AOC),目前已实现一定的销量,但占公司总体营业收入的比重很小。 此外,中青宝表示,旗下公司宝腾互联主要运营深圳观澜云数据中心、乐山未来城云数据中心;常山北明透露,公司目前云数据中心一期工程已运营,准备投资建设二期工程;省广集团表示,公司数据中心业务旨在为客户提供营销云服务;先进数通表示,公司并不直接从事数据中心运营业务,公司面向大中型金融、互联网企业提供数据中心IT基础设施建设及运维服务。 华为、腾讯、中兴等 科技 巨头已率先布局 有关“东数西算”工程,华为、腾讯等 科技 巨头早已巨资布局。 “华为云积极参与东数西算工程,是东数西算工程的重要参与者和践行者,华为云自2017年起就在逐步加大在西部枢纽节点的数据中心布局,每年的投资额都在数十亿左右。 ”华为方面人士表示,华为公司于2017年就提出了南贵北乌的云数据中心布局,在贵安新区和乌兰察布大数据产业园均规划建设超大型数据中心基地,远期服务器均达到100万台以上,目前均已投产使用,未来60%-80%的数据中心将布局西部,积极践行东数西算。 作为企业,企业将如何受益于“东数西算”工程?华为认为,“东数西算”工程有利于华为云就近服务客户、避免重复建设,节约成本、提升服务质量,同时可助力公司就近使用可再生能源,提升可再生能源利用率,助力企业实现双碳目标。 另据了解,2018年5月29日,腾讯贵安七星数据中心正式开启一期试运行。 2018年6月,腾讯西部云计算数据中心(位于重庆)一期已投用,可容纳10万台服务器,是腾讯继天津、上海、深汕合作区三地之后的第四个自建大型数据中心集群,已经成为腾讯在西南地区重要的数据中心和网络中心。 2020年4月,腾讯西部云计算数据中心二期项目正式开工建设,占地107亩,建筑面积7.4万平方米,计划打造西南地区腾讯公司的第一个Tbase园区,整体建成后将具备20万台服务器的运算存储能力,成为中国西部最大的单体数据中心。 哪些板块将受益? 投资者将如何把握“东数西算”工程实施投资机遇? 国家发展改革委高技术司表示,数据中心产业链既包括传统的土建工程,还涉及IT设备制造、信息通信、基础软件、绿色能源供给等,产业链条长、覆盖门类广、带动效应大。 值得注意的是,有媒体从权威人士处获悉,通过算力枢纽和数据中心集群建设,将有力带动产业上下游投资,预计启动后将每年拉动4000亿元人民币的投资。 首创证券发2月18日上午发表研报指出,东数西算工程是新基建的范畴,需要新建数据中心,数据中心需要很多高性能计算芯片,相关高性能计算芯片、通信芯片、接口芯片等硬件设施需求有望持续提升,将迎来利好。 “我们认为,‘东数西算’是促进数字经济发展而展开的战略级布局,有望为数字经济奠定坚实基础。 ”东方证券表示,“十四五”期间,算力基础设施建设有望进入新一轮高景气周期,国产服务器及相关生态厂商迎来发展机遇。 国盛证券认为,本次“东数西算”工程的全面启动,叠加数字经济确定的发展方向,对于整个数据通信领域将是确定性大机会。 算力、流量持续高速增长是必然趋势,配套基础设施持续建设扩容是刚性需求,未来3-5年具有高确定性。 当前全球 科技 发展趋势均指向算力和流量的确定性机会,而算力、流量乃至应用的发展,也将带动移动网络建设力度,5G及相关产业链作为核心也将持续受益。 中信证券通信首席分析师黄亚元表示,作为新基建代表,数据中心产业链条长、覆盖范围广、带动效应强,有望充分受益“东数西算”工程推进。 看好“东数西算”工程对IDC、ICT设备、光模块、运营商、温控设备、光通信等领域的需求驱动。
东数西算,即东数西算工程,指通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。
“东数西算”中的“数”,指的是数据,“算”指的是算力,即对数据的处理能力。“东数西算”是通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。
2022年3月,提请十三届全国人大五次会议审查的计划报告提出,实施“东数西算”工程。数字时代正在召唤一张高效率的“算力网”。
“东数西算”是把东部密集的算力需求有序引导到西部,使数据要素跨域流动。打通“数”动脉,织就全国算力一张网,既缓解了东部能源紧张的问题,也给西部开辟一条发展新路。
“东数西算”工程的实施,一是有利于提升国家整体算力水平,通过全国一体化的数据中心布局建设,扩大算力设施规模,提高算力使用效率,实现全国算力规模化集约化发展。
二是有利于促进绿色发展,加大数据中心在西部布局,将大幅提升绿色能源使用比例,就近消纳西部绿色能源,同时通过技术创新、以大换小、低碳发展等措施,持续优化数据中心能源使用效率。
三是有利于扩大有效投资,数据中心产业链条长、投资规模大、带动效应强。通过算力枢纽和数据中心集群建设,将有力带动产业上下游投资。
四是有利于推动区域协调发展,通过算力设施由东向西布局,将带动相关产业有效转移,促进东西部数据流通、价值传递,延展东部发展空间,推进西部大开发形成新格局。
在云计算和大数据遍地开花的今天,很多个人及企业级客户对自己的数据存放环境并没有一个很直观的认识,包括电商从业者(云主机,云空间),私有云、公有云及混合云企业用户等等。
而数据中心内部结构繁多、组成复杂,经过多年行业积累,客户在选择数据中心时主要关注数据中心等级、选址标准、建筑与结构、电力、暖通、消防、监控和网络这几个方面。
数据中心内部整体结构
1、数据中心分级标准
目前对数据中心的分级,最常用的有国内和国际两种标准:
1)在国内标准《电子计算机机房设计规范》(GB-92)中主要从机房选址、建筑结构、机房环境、安全管理及对供电电源质量要求等方面对机房分级,可分为A(容错型)、B(冗余型)、C(基本型)三个级别(建议企业选择A级别和B级别的机房);
2)在美国标准TIA-942《数据中心的通信基础设施标准》中主要是根据数据中心基础设施的“可用性”、“稳定性”、和“安全性”分为四个等级:Tier Ⅰ,Tier Ⅱ,Tier Ⅲ,Tier Ⅳ(企业更多会青睐于Tier Ⅲ和Tier Ⅳ级别的机房)。
2、选址标准
从数据中心基本选址要求角度出发,需满足以下条件:
1) 距离停车场≥10米;
2) 距离铁路或高速公路≥100米(不包括各场所各自身使用的机房);
3) 距离飞机场≥1600米(不包括各场所各自身使用的机房);
4) 距离化学工厂中的危险区域\废品填埋场≥400米(不包括化学工厂所各自身使用的机房);
5) 距离军火库≥1600米(不包括军火库所各自身使用的机房);
6) 距离核电站的危险区域≥1600米(不包括核电站所各自身使用的机房);
此外,不允许在有可能发生洪水的地区、地震断层附近或有滑坡危险区域、高犯罪率地区设置机房。
3、建筑与结构
1) 建筑结构建议采用钢筋混凝土框架结构或钢筋混凝土框架加剪力墙结构;
2) 抗震设防分类应不低于丙类,抗震烈度不低于7级;
3) 楼层层高≥4.6米;
4) 楼板承重需满足以下条件:
主机房楼板承重:800~1000 Kg/㎡;
不间断电源系统室楼板承重:800~1000 Kg/㎡;
电池室楼板承重:1600 Kg/㎡;
钢瓶间楼板承重:800 Kg/㎡;
5) 防静电活动地板的高度≥400mm。
4、电力系统
高等级数据中心电力需满足以下条件:
1) 电力供应需满足整体所需电力;
2) 两路市电接入,分别来自同城2个不同的变电站;
3) 不间断电源系统(UPS)电池备用时间不能少于15分钟;
4) 配置备用柴油发电机组N+1模式。
5、暖通系统
暖通系统由空调机组和新风系统组成。
机房内冷通道和热通道需分离,冷通道内温度需控制在18-28℃,机房湿度需控制在30-70%。
6、消防系统
消防系统主要由灭火系统和火灾报警系统组成。
机房内常用灭火系统主要有两种,分别是FM200气体灭火系统和IG541气体灭火系统;辅助区域设置水喷淋系统。
7、监控系统
监控系统包括环境监控、设备监控、安全监控和大屏幕显示监控。
其中,环境监控系统包括:配电监控、空调监控、机房环境监控、柴油发电机监控、UPS电池组监控和机柜电流监控;
安全监控包括:门禁系统、视频监控系统和防盗报警系统。
8、网络
网络需采用不同的骨干链路接入物理路由,实现双链路双冗余。
机房标识小知识
机房标准:
随着云计算的不断发展,企业对数据中心的级别要求越来越高,高等级机房越来越成为当今的趋势。所以本篇我们会着重介绍A级机房以及Tier 3、Tier 4级别机房的标准。
A级机房
A级机房,是指其场地设备不应因操作失误、设备故障、外电源中断、维护和检修而导致电子信息系统运行中断,可达到容错型要求的机房。在保证系统正常运行的标准中,电力系统和暖通系统是最为关键的。
什么行业需要使用A级机房
不同行业对机房的要求是不一样的,其中金融行业的要求最为严格。金融数据中心需满足安全可靠的标准,主要表现为对基础设施的要求非常高。那么,何为安全可靠的数据中心?体现在两点:基础设施满足符合国家A级机房标准;消除单点故障隐患点。除此之外,其他行业也有部分客户对数据中心的要求非常高,此类企业也多会选择A级机房,用来保证业务、数据等各方面的稳定性和连续性。
Tier 3和Tier 4级别标准的主要差别
有孚网络云计算数据中心等级
有孚网络拥有强大的云计算数据中心资源,以北京、上海、广州、深圳为核心分布至各个区域,总建筑面积100,000㎡+,机房面积60,000㎡+,接入电信、联通、移动、铁通等多家运营商的骨干网络,并拥有覆盖全国的优质BGP资源。
在众多资源中,有孚网络云计算数据中心均按照高等级标准建造,达到国家A级标准或国际Tier 3级别以上标准,基础设施配置完善,服务内容全面,部分机房可根据客户需求进行机房资源独享模块定制化,在提供高等级数据中心资源的同时,提供高标准的专业化服务。
安得广厦千万间,又如何才能风雨不动安如山?古代寒士道出此番领悟,感叹怎样才能得到千万间宽敞高大的房子,房子在风雨中也不为所动,安稳得像是山一样?对于企业来说,要满足其IDC未来业务发展需求,找到安稳坚固的数据中心,显得尤其重要。那么,我们就来谈谈数据中心选址和建筑的那些事儿。选址标准和建筑结构,作为企业对数据中心外部环境和建筑物考虑的一个重要因素,涉及到很多方面,并且随着数据中心发展的成熟以及客户需求的不断提高,高等级数据中心已是大势所趋。金融行业,作为高标准高要求的行业,所选数据中心首先必须满足国家A级机房的选址和建筑要求。
选址标准
我们可以先简单了解下国家A级机房在机房位置选择上的主要要求:
距停车场的距离要在20m及以上;
距铁路或高速公路的距离要在800m及以上;
距飞机场的距离要在8km及以上;天
周边400m内不得出现化工厂危险区域及废品填埋场;
周边1.6km内不得出现军火库、核电站危险区域等。
建筑结构
同样,国家A级机房在建筑结构上也设定了相关的要求,主要标准如下:
抗震烈度不低于7级;
楼层层高≥4.6米;
楼板承重需满足以下条件:
主机房和不间断电源系统室楼板承重:800~1000 Kg/㎡;
电池室楼板承重:1600 Kg/㎡;
钢瓶间楼板承重:800 Kg/㎡。
防静电活动地板的高度≥400mm。
金融业的选择标准
事实上,金融行业在考虑数据中心地理位置及建筑结构的时候,除了以上这些必不可少的因素外,还有更加严格的要求标准。
地理位置:周边不得有危险品工厂,并且极少有自然灾害发生;
建筑条件:机房要有能力提供单独的VIP包间;
周边配套设施:周边配套设施需完善,选择交通便利的数据中心(靠近地铁站或距市中心近),在现场访问及后期维护的时候能够带来极大的交通便利;周边要配备餐饮、超市等设施,并且3km内需要有能租住的配套完善的公寓、大型居民区、酒店式公寓等;
周边环境考察:在北京、上海、广州这几个数据中心聚集地区,都会有金融行业的数据中心集群区域,那么金融行业在选择第三方数据中心的地理位置时必然会优先考虑这些区域。 除此之外,周边金融环境、数据中心入驻的金融客户等都会成为选址考虑的因素;
电力因素:金融行业数据中心必须有双路市电引入且来自两个不同变电站,以保证电力的持续供应,故在选址时应考虑数据中心市电接入的两个变电站的供电情况。
有孚网络云计算数据中心有哪些优势?
上海有孚网络股份有限公司拥有大型的自建云计算数据中心以及合作的高等级云计算数据中心资源,运营管理经验超过15年。以北京、上海、广州、深圳为核心辐射各个区域,机房毗邻地铁沿线,可提供丰富的机房资源独享模块定制服务,包括网络、带宽、电力、机房面积、运维服务、可扩展性、容灾、资源预留等。此外,部分大型云计算数据中心建在当地金融行业数据中心集群区域内,受周边成熟金融数据中心的辐射影响,具有得天独厚的地理优势。
现代数据中心供电系统的典型架构:
现代数据中心供电系统的典型架构
有孚网络自建及合作的云计算数据中心已经覆盖北京、上海、广州、深圳等地,并通过这些核心节点辐射各大区域。高等级标准建造,电力系统满足A类机房要求,每个云计算数据中心均引入来自不同变电站的双路市电,拥有双路UPS并行输电,并配置双路柴油发电机,提供不间断电源,保障业务安全、稳定、可持续发展。
对于金融行业数据中心来说,要满足其安全可靠的要求,供电系统需达到A级标准。那么,在A类级别的数据中心中,它的供电系统又是怎么要求的呢?
1、 由来自两个不同的变电站引入两路市电电源,同时工作、互为备用;
2、 机房内设有能够满足UPS电源、机房空调、照明等设备用电的专用柴油发电机,且备用有同样标准的柴油发电机,即柴油发电机系统需达到:(N+X)冗余 (X=1,2,3,4……)的要求;
3、 为了使数据中心的电力持续供应,需使用两套独立的UPS供电系统,来保证数据中心的供电,即UPS系统需达到:2N或M(N+1) 冗余 (M=2,3, 4……)的要求;
4、 其中,市电电源间、市电电源和柴油发电机间均可通过ATS(自动切换开关)进行切换,电源列头柜用来进行电源分配和供电管理,以提高供电系统的易管理性。
金融行业在供电方面除了需要满足以上要求外,还需满足其他相关电力要求:
1、 市电中断,发电机30秒自启动;
2、 市电电源为10KV以上;
3、 空调设备采用双路电源供电;
4、 不间断电源电池单机容量备用时间大于等于15分钟;
5、 要求采用专用配电箱(柜),专用配电箱(柜)应靠近用电设备安装;
6、 用于电子信息系统机房内的动力设备与电子信息设备的不间断电源系统应由不同回路配电;
7、 自动转换开关检修时,不应影响电源的切换。
云计算与存储是未来商业的发展趋势,无论是互联网界还是传统企业通过搭建数据中心可以更好的掌握用户数据,为用户提供可靠的定制服务。从用户的角度来讲,企业搭建数据中心也是用户的选择。
(注:本文特约上海十佳IDC服务商之一的有孚网络(共承担了6项国家及地市级专项课题),将云计算数据中心的最佳实践与众多相关从业者分享。上海有孚网络股份有限公司创立于2001年,拥有超过15年的IDC运营管理经验,并形成了一套完整的自有云计算数据中心体系,为成千上万家客户提供专业的产品与服务。)
立足数据中心运维管理的现状,顺应时代发展的潮流,充分利用信息技术的机遇,利用现有资源对数据中心的运维管理加强完善和创新,为行业的发展,国家的进步贡献力量。
1.大数据时代数据中心运维管理的现状
大数据时代作为时代发展的机遇出现在大众视野,但是也是作为挑战逐步渗透在行业的数据中心运维管理中。以计算机技术为依托的数据中心运维管理的显著特点就是大规模的数据流量,正在不断与原有的数据中心架构产生冲突。
目前,大数据时代的数据中心运维管理的先进意识已经深入人心,但是实际项目操作过程中会有众多的问题出现。因为在磨合期,所以现有设备不能满足大数据时代的数据中心管理要求;运维管理人员的没有经过大数据时代新的运维管理思路的熏陶,技术水平与之不匹配;还有就是数据中心的运维管理制度不都完善,相应的管理水平不高。
2.解决数据中心运维管理困境的策略
针对目前数据中心运维管理的困境,本文提出了相应的解决策略,以供业界参考。
2.1 提升运维管理人员的整体能力
基于目前数据中心运维管理工作人员的实际能力,通过采取以下积极的措施来提升运维管理工作人员的综合能力水平。
2.1.1 大数据背景下,强化数据中心运维管理人员的技术应用水平
通过多维度的检验途径,比如定期检查该技术的理论与实践水平确定工作人员的当前能力,在制定符合目前技术短板的相关培训,从而保证运维管理工作的顺利进行。
2.1.2 加强管理方面的知识渗透
在加强数据中心运维管理人员的技术应用水平的前提下,可以加强管理学知识的渗透,为技术团队的整体语言表达能力的提升以及为管理层储备后续力量,既懂技术又懂管理的新世纪人才,有助于数据中心运维管理工作更加高质量的完成。
2.1.3 加强工作人员执行力,更高效的完成工作
在数据中心运维管理的众多评价标准中,执行力是影响一个团队整体运作能力很重要的一个指标,良好的执行力可以保证时间段内的工作目标提前完成或者超量完成。
2.2 强化业务管理工作和业务培训工作
现如今,科学技术的更新速度往往超出人们的接受速度,在数据中心运维管理这个领域也同样适用。所以使得运维管理人员刚刚熟练掌握新的运维既能并熟练应用,新的技术又刷新了行业应用领域。所以设立专门的培训机构,强化管理人员终身学习的意识,紧跟时代发展的脚步。
2.2.1 制定合理的业务培训和业务管理培训计划
科学合理的方案总能给与人们正确的指导,并保证在规定期限内达到既定目标。运维管理培训和业务培训的内容要与时俱进,不断为管理人员灌输新的知识,为运维管理的工作融入新鲜的血液。
2.2.2 合理安排培训时间
运维工作人员在企业内是员工,男性员工在家庭里是儿子,是丈夫,是爸爸,所以要协调好培训的时间,保证员工能充分解决员工之外的各种事情,全身心的投入工作。
2.2.3 使业务管理和业务培训的形式呈现多元化
公司管理层应加强与行业内部个组织间的联系,比如同专业的大学、同行业资深专家、专业讲座等等。通过多元形式的学习加深对行业发展的了解,并积极促进管理人员的专业素养。
2.2.4 定期进行培训效果的考核
在定期进行学习之余,为检验学习效果是否达到预期目标,应适时进行检验,进一步促进运维工作人员的学习质量的提升,提升其主观学习的动力。
总之,强化对运维工作人员的业务培训,能够有效地对运维工作者的维修技术进行与时俱进的培训,能够有利于运维管理工作人员进行数据中心运维管理工作的开展,最终有利于信息技术飞速发展下的运维工作的稳定进行。
2.3 加强了解整体行业环境的意识
有些企业的运维管理的硬件设施和软件配备欠缺,造成整体的管理水平低,是因为企业没有采取相应的举措保障。以下将详细讲述如何提升整体行业环境的了解。
(2)定期组织团队中的成员进行行业发展前景的探讨,在探讨交流的过程中了解当下运维管理工作的总趋势,从而能够为运维工作的有效进行提供有价值的参考意见。
总之,强化了解和分析业务环境的意识,能够有利于运维管理工作人员有行业的危机意识和行业的发展意识以及个人职业规划意识的提升,最终有利于大数据时代数据中心运维管理工作的顺利开展。
3.大数据时代下,技术层面面临的挑战
3.1动力环境监控系统概述
通过应用数据采集系统,计算机和网络技术,逐步完成数据中心运维管理动力电源供电设备的运行和机房的监控的平台就是数据中心动力环境监控系统。
3.2 动力环境监控数据的特点。
通过采集数据中心的关键指标数据,针对实际运行情况实现预警功能、远程功能以及运行监测功能。动力环境监控数据具有其本身特点。
3.2.1 数据结构化、格式化程度高
因系统采集到的实时监控数据大都存储于数据库中,因而动环监控数据结构化、格式化程度高,这也为数据挖掘提供了便利。
3.2.2 实时更新
动力环境监控系统运行的最底保证便是数据的准确性和实时更新,其数据采集的更新时间间隔为每秒。
3.2.3 时序性
动力环境监控系统实时记录的环境温度、环境湿度等数据都是随时间更替而进行采集的。
3.3 数据挖掘提高告警信息准确性
动力监控系统是以计算机为载体,以信息技术为依托的技术,所以其产生的大规模数据也是大数据时代一个突出的特点。就目前而言大规模的数量利用率较低,即使专业水准较高的管理人员也会深感难度高、工作量大,与现有的技术水平不能完好对接。
数据挖掘技术的出现解决了目前的难题。数据挖掘中关联分析方法解决了数据中心运维管理中不明原因的重复警报,为运维管理的工作有序进行提供了基础,并为专业水平较低的运维人员提升了工作效率。
3.3 运维经验知识化的工作模式需要改进
据以往的运维工作人员的叙述,过度依赖专家给与的指导经验,成为行业内部的不良风气。首先运维专家的培养周期较长,短时间没有任何效益输出;其次专家的意见偶尔会带有强烈的主管色彩,但是对于实际操作过程并不适用,最终导致工作的延误;最后就是过度依赖专家,若运维专家不在职装天下将会对运维管理工作造成重创,不具有可持续性。
所以建立关于数据中心运维管理的内部数据和外部数据,为现有的运维人员过度依赖专家的不良习惯提出解决方案。内部数据主要是指内部运维经验;外部数据是指来源于互联网的运维知识。对于收集到的内外部数据,利用文本挖掘、聚类、分类预测等方法对信息进行加工展现,转化成知识库中的知识,并实现对信息的快速、自动化检索。
3.4 资源调度成为容量管理的关键
在大数据时代下,数据中心存储容量指标是指机位空间指标等,尤其是计算资源指标,是其组成的关键部分。需要最新的数据中心运维管理平台实现监测服务器、使用网络以及存储资源等功能,根据实际情况进行管理策略的变动和资源的优化配置。
云计算技术已成为数据中心运维管理的核心,并打破传统的数据运维管理信息系统结构,建立一个全新的集计算、存储、和网络三维一体的虚拟资源库,通过实际的操作,实现现有资源的动态优化配置。
虚拟化技术可以保证存储环节中大规模数据的安全性,在逐步实现数据资源的重复使用、关联以及动态管理等动能的同时,也为运维管理人员提出了巨大的挑战。故此,通过科学合理的分析容量数据,构建完善的资源调度制度,实现实现新一代数据中心资源在应用间的动态分配,将成为大数据时代下数据中心运维管理的一大挑战。
4.结束语
为顺应大数据时代的潮流,必须进行数据中心运维管理的深度优化,为数据中心的整体发展提供新鲜的 科技 动力。通过提升运维管理人员各方面的能力还有利用先进的动力环境监控系统技术,为数据中心的运维管理提供强大的人力支持和技术支持,助力大数据时代背景下,数据中心运维管理的长足发展。
参考文献
[1]朱玉立,任义延,高甲子等,浅谈大数据时代下的数据中心运维管理[J].信息系.统工程,2015.
[2]解林超,石佳,王仲锋等。大数据时代对传统数据中心的影响及思考[J].中国新通信,2014.
[3]周焘。大数据时代的档案大编研[J].陕西档案,2014.
[4]陈艺高,动环大数据,提升运维效能[J].通信电源技术,2014.
[5]张隽轩,张文利,黄毅。数据中心运维系统应用ITIL管理体系分析[J].智能建筑与城市信息,2015.
[6]宋维佳,马皓,肖臻,张晓军,张蓓.虚拟化数据中心资源调度研究[J].广西大学学报:自然科学版,2011,36(01):330-334.
我们公司的一些想法和经验,今天的主要内容是关于如何定位数据中心基础设施的管理。 传统意义上的数据中心通常会和IT隔离出来,在云计算时代,我们会认为数据中心所有服务的东西都应该作为一个基础设施来看待,就像微软的集装箱,这里面已经拥有了IT技术的中心,在这个层面上就可以展开了,我们IT只能拿到我们的网络,我们的服务器。 因此意味着我们把跟IT架构的环境和整个环境作为一个统一的对象来考虑,并且考虑到之间的相互管理,这点对我们传统意义上的数据中心是不太一样的。 在数据中心的生命周期角度来讲,从设计开始,会经过实施运营持续的勾画,我们会发现这是一个数据的管理,在设计阶段,我们可以看到作为基础设施来说,IT部门不是具体到服务器的一个数量,这个时候我们需要考虑的是运算的能力,就是数据中心到底能够支撑多少运算的能力,从能力这个层面上考虑的,因此数据中心的要有这样的能力,这个能力不能一估就10年,但是我们通常是10年、20年来预估的。 整个IT预估的过程起码是1一3年。 在设计完整以后,我们进行实施,实施其实是部署的一个过程,部署完成了以后,就接着是一个运营,运营过程要解决一个很大的问题,解决实际运行的情况及跟我们当初设计的情况是否吻合,如果不吻合我们就进行调整,包括做更大动作的调整整改,假设一下,如果现在的实际情况和预想的情况是一致的,在运营层面就不用做太多的工作,现在IT的情况越来越复杂,从IT来说,投入的成本大于我们当初预算的成本,最后一个阶段是优化阶段,我们不断的调整,需求在不断的变化,我们需要进行优化,优化的结果是下一个数据中心的模式的设计,这就变成一个循环。 从数据中心的基础设施来讲,IT有五个物理需求,包括攻坚、制冷、空间、安防、布线。 我们采购IT设备的标准也必须是统一的,如果这些标准主要反映到我们刚才提炼的五个物理需求上,所以在设计的阶段,我们要注意这五个方面,但是现在的数据中心来说,用户往往会考虑得很周到,更多的是考虑供电和制冷,因为这有一个计算能力的需求,所有的服务器用电90%的用电量会进行排放,所以制冷是一个很重要的因素。 在管理的层面上有三个非常重要的地方,第一,保证IT的可控性,我们一般把IT分为三个层面,对底层的是基础设施,上去是IT,IT上去是业务应用,比如说IT层面像业务层面提供服务的,如果业务层面不可用的话,说明IT存在的必要性会受到一个挑战,因此,保证可用性是第一位的,再满足第一位的情况下,我们可以降低运营的成本。 对于数据中心的运营来说,我们可以拆散为几个阶段,第一个阶段是部署,也就是支撑IT运营的过程,第二个是IT业务系统的上线,业务开始运作了,我们各种OA都可以运用,第三是对监控系统,发现问题后,我们可以采取相应的行动,确保业务系统的正常运作。 第四,确保业务可用的情况下,我们可以用一些技术或者是云的技术新一代的技术实现绿色的优化,降低运行的成本。 在数据中心,基础设施目前面临的挑战可以有五点。 第一点是可用性,这也是我们存在必要性一个很重要的地方,后面两点是我们在云时代继续生存的要素,包括在生命周期内的可适应性和可扩展性。 最后两点的可管理性和可维护性/服务型做到,这五点他们是相互依托的。 回到最初的设计阶段,看上去跟IT没有很大的关系,因为在我们公司的设计阶段,IT基本上是不存在的,只是一个概要的需求,当数据中心运行起来以后,我们可以通过这个图展示数据运行的情况,发现机位是不是过热,供电是不是足够的情况,因为我们设想跟实际情况是有差异的,所以我们要对这个数据进行管理。 我们尽可能的缩小实际跟设计之间巨大的差距,当然缩小是不可能最小化的,不然的话,我们的业务就没有发展,到了差距没有办法缩小的时候,我们应该增加一个模块实现扩充,这也是数据中心模块化的定义,当前可以从两个方面缩小差异,一是构建支持硬的基础设施,包括通过可调整模块化的基础设施,比如说,模块化的UPS,模块化的供电,模块化的空调实现基础设施的设计,另外我们可以通过配电和容量管理系统帮助我们掌握基础设施的消化的趋势,我们可以通过了解未来IT的发展趋势,包括云计算这些新的技术,便于我们在数据中心采取更好的技术,使这个数据中心有更强的生命力。 第二块,通过优化基础设施的使用,做一些全面、细致和精准地了解,通过规划地使用基础设施,通过这些延长数据中心的使用,实时检测基础设施,排除异常的情况,从而使基础设施能够得到很好的使用。 假设我们现在是维护一个好的数据中心,其实非常重要的一点是在于挖掘,我们经常说我们的网络是不可管理的,目前大多数的基础设施是可以管的,我们面对新的数据中心的时候,或者是对数据中心进行调整的时候,第一步是对原有投资过的一些功能给挖掘出来,比如说以前的制冷的UPS,把可管理的功能挖掘出来了以后,可以整合到新的平台里面,这是非常重要的一步,这里面涉及到局限性,主要是在于数据的兼容性和管理的细化,可以这样讲,对于一个管理接口,管理的力度决定了可以管理的深度,因此在设计阶段,我们决定自己管理的深度和可管理的光度,在这个层面上决定我们需要购买哪些设备,如果我们投资很多的钱买一个功能丰富的设备,但是发现我们管理上是达不到这个水平的,实际上这也是一种浪费。 在基础设施的管理方面,我们很少说管理这个词,大多的时候是使用监控这两个字,在中国的词汇里面,监控有两个方面的含义,检是代表检测、采集和收集大量的数据,控是做一些反馈,调整运行状态,怎么根据收集上来的运行数据决定策略对于大多数的用户来讲,绝大多数都放在检测上,对于监控是一个自化性的,或者是本能执行的手段。 如果这是一个云的数据中心,我们就可能在依据手动的方式进行调整,而是根据收集上来的数据进行判断,再根据业务进行混合决定如何控。 这个控的过程也是自动的,这样的话,响应的速度才能足够的快,才能满足云计算的要求,同时,这也意味着检测的时候,我们决定着设备采集的信息量的大小。 在整个过程里面,我们需要消费我们收集上来的检测数据,加上我们本身对这个数据的知识库,最后形成了一个控制的结果,这也是管理里面最核心的地方。
本文地址:http://www.hyyidc.com/article/15490.html
上一篇:SSL了解保护在线通信的安全协议ssl解决什么...
下一篇:使用Python脚本自动执行FTP上传使用PYTHON...