测试
全部博文(931)
分类: 架构设计与优化
2019-04-20 10:31:02
Jerry的前一篇文章企业数字化转型与SAP云平台介绍了SAP云平台在企业数字化转型中的重要地位和作用。作为一个平台即服务(PaaS)解决方案, SAP云平台实现了高度的虚拟化,包括CPU计算资源,存储,网络和数据库等实体的虚拟化,使用户可以按需使用各种资源。然而这些虚拟化资源从实现角度而言,最终仍然需要运行在物理服务器上。这些物理服务器所处的地理位置,在云计算领域内称为数据中心。
SAP官网有个链接专门介绍SAP数据中心策略。
下图是截至2018年6月20日,SAP官网上的SAP数据中心全球分布图。
图中这些数据中心对应着我们在SAP云平台Cockpit的Regions标签页里看到的列表内容。
下图是位于德国St.Leon-Rot的SAP数据中心的布局和组件构成示意图。
我们用Cloud Service Level Agreement(服务水平协议)来衡量云服务的高可用性。比如如果一个云服务其SLA为99.99%,意味着每个月服务出现故障的时间只能占总时间的0.001%,即4分钟多一点的时间,或者折合成年计算,就是每年该服务处于离线状态的时间不得超过50分钟。
为了确保云服务的高可用性,不间断的电源供应,以及良好的硬件散热装置就成为数据中心必不可少的设施。数据中心连接当地公用事业企业运营的两个独立的电网系统。若其中一个系统出现故障,则另一个继续供电。每个数据中心里备有13台柴油发电机(上图的Diesel generators),总共发电量为29兆瓦,确保数据中心在紧急情况下的电力供应。当地电力供应公司和柴油发电机提供电压为20千伏的电力,再由上图的变压器(Transformers)转换成380伏特。此外,数据中心的电池组能提供15分钟的电力供应,用于在从发生电力故障到启动柴油发电机这个时间窗口内的紧急供电。电池组的最大充电容量会定期检查,如果显著降低会进行更换。
高性能服务器运行时产生的热量是相当惊人的,所以散热就成了数据中心一个永恒的话题。数据中心机房里机柜和机架的摆放是很有讲究的,甚至有一套国际统一标准,这些标准的代号通常以ANSI/TIA开头,全称是American National Standard Institute/Telecommunications Industry Association。比如ANSI/TIA/EIA-606-A标准,规定在数据机房中必须使用两个字母或阿拉伯数字来标记每一块边长为600毫米架空地板。
对机柜/机架列的摆放的前部、背部和高度,ANSI/TIA/EIA标准做了以下的规定:
看一些网上找到的实物图:
再回到位于德国St.Leon-Rot的SAP数据中心的布局和组件构成示意图,下图的三个组件都和散热有关:
当外界温度低于12~13摄氏度时,机房内的空调装置将机房内充满服务器工作时产生巨大热量的热空气抽除至室外,以室外的冷空气替代。当室外温度高于13摄氏度时,空调系统会使用水冷方式进行散热(和上世纪末90年代末本世纪初电脑发烧友使用水冷装置辅助散发CPU超频时产生的大量热量方法一致)。Rot数据中心共有6个turbo-cooling单元,它们只有部分处于运行状态,其他则处于备用和候补只用。一旦数据中心处于运行中的冷却系统出现故障,在备用单元启动之前,数据中心将使用预留的30万升4摄氏度以下的冰水,确保备用冷却单元启用前数据中心的散热需求。
散热单元本身也需要散热。Rot数据中心有18个热交换装置(heat exchangers), 将冷却装置产生的热量排到外界。在夏季,当外界室温高于26摄氏度时,热交换装置也会使用水冷散热方式,通过水分的蒸发达到更佳的散热效果。Rot数据中心配有专属的供水工厂确保夏季用于热交换装置使用的水供应,同时Rot本地的市政供水系统也预留了部分水供应配额作为Rot专属供水工厂的后备。
希望下面这张3D的示意图能让大家对于数据中心内部组成有一个更直观的了解。
数据中心物理站点的安全性:SAP数据中心处于7×24小时不间断的监控之下。所谓的陷阱房间(Man trap Room)确保只有合法人员才能进入一个安全控制区域。程序猿可以把陷阱房间类比成在代码里执行业务逻辑之前必要的权限检查。本质上它就是进入一个安全控制区域之前的一个小房间,一个有意设计的"陷阱"。这个"陷阱",让数据中心安全系统对来访者进行安全验证,如果发现有试图未经授权的进入,会触发警报。进入高安全性要求的区域,需要通过生物特征扫描的方式进行认证。
数据的安全性:一方面,数据中心的入侵检测系统(intrusion detection system)会对网络传输进行即时监视, 监控输入数据并识别可疑活动;另一方面,由不同厂家制造的防火墙可以保护数据。此外,备份文件和数据以加密形式与客户交换,或通过安全的光纤电缆传输。
硬件的安全性:所有虚拟服务器和物理服务器,SAP HANA数据库,存储单元和网络都可以访问物理硬件池。若单个元件出现故障,其正在服务的负载可以立即转移到其他元件上,不会影响系统稳定性。如果因火灾引发硬件故障,数据可以从备份系统中恢复。
数据中心的消防措施:这么多服务器聚集在一起,万一着火了怎么办?数据中心被分为多个防火分区。数千个火灾探测器和吸气式烟雾探测器监控着所有机房。一旦探测器检测到过热电子元件散发出的特殊气体,会发出预警。如果发生火灾,会自动向消防部门发出警报,同时喷射出洁净的INERGEN灭火气体,扑灭火情。灭火气体的压力也会定期检查确保处于达标状态。
数据中心的建筑安全性:数据中心由 10万吨钢筋混凝土构筑而成,支架是 480 根混凝土立柱,每根柱子深入地下 16 米。外墙厚度高达 30 厘米,同样由钢筋混凝土砌成。服务器机房由三面混凝土墙环绕保护。这种设计可以有效保护数据中心免受各种自然界或者人为破坏,比如抵御风暴甚至小型飞机坠毁事件。
数据隐私:客户数据的处理均在客户选择的授权范围内处理,不会转发给第三方。
数据备份:数据备份通过磁盘对拷的方式进行,确保了数据的快速创建和恢复。除了每日例行的完整备份之外,每日内的不同时间段还会创建多个临时备份版本,并且像完整备份一样进行归档处理,存储于其他介质上。
早在SAP于德国St.Leon-Rot创建第一个数据中心时,如何高效使用能源成为了优先级最高需要考虑的话题。得益于绿色电力的引入以及其他类型能源的高效利用,SAP 全球各地的数据中心于2014年成功地实现了温室气体零排放。德国第二大的TUV(Technischer überwachungs-Verein,技术检验协会)检测机构Rhineland,给予SAP数据中心年度审查的结果是最高级别:Premium。
早在2014年,SAP就宣布其数据中心使用的能源为100%可再生资源。
新闻链接:%E2%80%99s-data-centers
再回到SAP云平台的Cockpit。Region标签页里每个Region代表地球上的一个数据中心。
您可能已经观察到了,为什么有的数据中心,其Infrastructure提供商是亚马逊,微软,谷歌这些厂商,而有的数据中心,却又是由SAP自己来扮演Infrastructure提供商的角色呢?
这个差异就得从SAP云平台的开发环境,Neo和CloudFoundry说起了。对于Neo开发环境来说,SAP包办了IaaS中的基础设施I和PaaS中的平台P。而对于CloudFoundry开发环境,
从上图看出其底层基础设施是由第三方的数据中心提供商负责搭建的,SAP只负责搭建和运维平台层的服务,即CloudFoundry本身。
至于Neo和CloudFoundry这两个开发环境的区别和各自的使用场景,Jerry会在将来的文章继续介绍。
要获取更多Jerry的原创技术文章,请关注公众号"汪子熙"或者扫描下面二维码: