新闻资讯

平均70万美金善后成本的数据中心事故该如何避免

发布者:柯施泰中国  发布时间:2019/11/26 11:34:03


数据中心的历史可追溯至信息技术快速发展的上世纪50年代,人们把容纳计算机系统、存储系统等电力设备相关组件,称为“服务器农场”。

现代物联网发展的热潮,让物与物,人与物建立了联系,“移动支付”、"外卖平台"、“网上办公”等等我们正通过网络享受的服务都离不开数据中心的支持。数据中心已经成为了生活当中看不见,但又离不开的存在,一旦服务器宕机,后果不堪设想。

双十一当天破了千亿元的成交额, 试想"若当天有1分钟宕机",损失也将是不可估量的。随着用户对于网络依赖性的增加,数据中心宕机将是难以承受的事件。

中断运行的原因有很多,但引起舆论关注,占据行业头条的事故可能多为闪电袭击或新型恶意软件的攻击。

"2005年,谷歌位于比利时的数据中心遭遇了4次闪电袭击"

“2013年,施工队无意间挖断了通信光缆,造成腾讯华东数据中心服务中断超过7小时”

"2015年,杭州市一处地下光缆被挖断,影响支付宝用户的登录或支付功能"
...
但Uptime Institute,全球公认的数据中心标准组织,在2018年夏季公布的调查结果显示:数据中心出现停电事故较2017年增长5%, 恶意天气和新型软件的攻击不是停机的主要原因。停机的三大原因是断电(33%)、网络故障(30%)以及IT或者软件错误(28%)。Uptime Institute, 2018

人为错误操作引起的高额代价

断电是造成数据中心最大的原因也是运营人员最不愿意见到的事情,所以很多数据机房都很乐意接受UPS电源。但研究人员发现UPS系统故障连续占据数据中心意外停机原因的首位。

由于人为故障导致的事故占总数的70%。复杂庞大的系统,人不可能面面俱到处处精通,其中经验不足或疏忽的错误操作引发的故障,占到了人为故障的80%。更重要的是80%的数据中心管理人员表示这些停机事件是可以预防的。

平均70万美元的事故成本

数据中心的安全事故对企业及用户影响之深,停机事故的善后成本也逐渐变高,据Ponemon Institute2016年发布的研究数据显示,从2010年到2015年间,数据中心停机成本上升了38%,从平均的505502美元增加到740357美元。曾经美国达美航空公司数据中心的电力中断,造成高达1.5亿美元的经济损失。又比如美国“超级碗”赛场断电,耽误赛事日程。

不容丝毫马虎的运维工作

UPS对数据中心的作用不言而喻,当电源异常或电力中断时,需要切换到UPS电源保障机房电力系统不间断运行。防止黑客网络手段对数据中心进行的破坏,还应该防止内部人员的破坏,工作人员疏忽出现的工作失误,无形中增加了数据中心的安全隐患。

柯施泰UPS解决方案
建立运维文档和流程控制变得十分重要。增添硬件和加强人员管理双管齐下是防止灾难性停电的最佳方法。

--联锁 x 电力链了解数据中心运营需要哪些电力相关的设备是数据中心运营的关键。从进入建筑的电力到UPS、PDU等供电设备,知晓设备各自间的相互依赖关系,在某些设备故障或脱机维护时提前预防潜在影响。

柯施泰解决方案,安全联锁依据设备维护时的操作逻辑顺序设置。UPS检修时,安全联锁确保作业人员只有完成每一步预设步骤,先完成旁路合闸,才能分闸UPS安全检修,UPS分闸检修时也有不间断的电源供应。

--经验≠安全
工作人员总是假设他们对电源供应链的操作了如指掌,但经验≠安全,运营的每个环节都不容一丝马虎。柯施泰编码钥匙确保依序作业,只有对应的编码钥匙可以解锁对应的联锁。无论新人还是老手,通过联锁间的钥匙传递即可有效保障稳妥安全的作业流程。

柯施泰UPS解决方案已服务于多个数据中心项目, 保障数据中心维稳运行,小小的机械联锁也能发挥非凡的价值。