计划外中断最严重。所有公司的四分之一报告说,现在要花一个小时的计划外停机时间 300,000元至400,000元之间 –现在有15%的公司表示,一个小时的计划外停机造成的损失超过500万美元。

这些成本由许多因素组成–肯定是销售损失和生产力损失,还包括服务器技术人员,更换零件,新的云量,匆忙购买的支持许可证等的超时成本。由于消费者会记住您的服务不可用,并决定以后不再与您开展业务,因此也会产生长尾效应。公司甚至可能会遭受永久性数据丢失,法律责任和监管影响。

理想情况下,您将有一个计划,确定服务器和应用程序何时出现故障而不发出警告。您将能够故障转移到不同的网络连接,启动新实例,并通常确保您的客户甚至不会注意到连接闪烁的情况。但是,如果您确实要推迟下一次系统中断, 您将需要一个准确的CMDB.

为什么停机时间需要这么长时间才能解决?

尽管服务器中断造成了巨大损失,但最终仍会花费大量时间。平均而言,数据中心的总停机时间为 超过两个小时,而部分数据中心中断可能会持续59分钟。对于25%的公司而言,这意味着整个数据中心中断将造成60万至80万美元的损失。 Uptime Institute调查的结果表明,至少 三分之一的数据中心 2017年发生故障。

根据上面的调查,停机的原因在断电,网络故障和基础架构/软件错误之间大致相同。下一个数字更为重要-80%。那就是数据中心经理所说的,他们经历的最后一次断电是可以避免的。

管理数据中心的问题之一是数据中心(毫不奇怪)很复杂。最初,数据中心的布局非常精确,但是随着时间的流逝,其系统变得越来越繁琐。首先,工程师不需写下任何内容即可添加一些服务器和网络硬件。然后他们离开公司。然后,另一位工程师尝试清理掉留下的污点,从而产生更多的污点。然后他们离开。等等。

在最坏的情况下,目前没有人在数据中心工作过,如何对事物进行连接有很好的了解,因此解决中断可能涉及到从使用Netflow或数据包捕获到物理跟踪机架上的电线等任何事情。理想情况下,这是您要在紧急情况前要做的事情,但是像许多常见的基本原则一样,  适当的数据中心审核 可能很难做到。

不只是审计-使用准确的CMDB

为了防止在停电期间进行疯狂的在线游戏,您的第一步可能是进行数据中心审核。说起来容易做起来难。首先,我们已经说过,数据中心很复杂。可能需要数周或数月的时间才能进行完整的会计处理,这意味着更重要或更具创新性的项目将被搁置。

此外,数据中心不只是物理基础架构,而且还不仅仅是一家仅面向运营的商店。在DevOps下,开发人员可以在数据中心基础架构中进行大量更改,以支持关键任务应用程序。此外,他们可能启动虚拟机,容器化现有应用程序或连接云实例。这意味着对数据中心的任何审核都只是快照。

使用准确的CMDB,审核时间减少了几个数量级。一个准确的CMDB可能要花费数小时或数分钟,而不是花费数周的时间来对基础结构和应用程序进行分类。此外,CMDB会在其他更改发生后立即做出反应-并保持最新状态。最后,准确的CMDB可以构建包括VM,微服务和云实例的应用程序依赖关系图。

在停机时间方面,CMDB将帮助您了解心跳中的复杂故障。您不仅可以查看哪些应用程序或服务器无响应,还可以查看哪些依赖的基础架构在它们旁边失败。通过毫不费力地跟踪中断源,您就可以节省宝贵的时间,节省数十万美元。

在Device42上,我们提供了业界响应速度最快和准确的CMDB产品。如果您想了解有关让Device42可以在数据中心下次宕机时进行救援的更多信息, 立即下载我们的演示!

资源://www.device42.com/blog/2020/04/prevent-your-next-system-outage-with-an-accurate-cmdb/