< 返回云服务器列表

边缘数据中心如何实现无人值守?

发布时间:2021-07-26    来源: 118云vps 阅读:
    研究表明,电信公司、云计算服务提供商、大型企业等行业组织将在未来五年内投入大量资金建设边缘数据中心。但是,运营和维护大量边缘数据中心会给数据中心运营商在人员配备和运营成本方面带来巨大的压力。
    世邦魏理仕公司数字基础设施咨询主管Duncan Clubb指出,边缘数据中心的数量未来几年中将会迅速增长,而边缘数据中心采用的先进技术将成为数据中心实现自动化的催化剂。
 
    边缘数据中心空间和容量主要用于处理计算资源。而边缘数据中心提供商的目标是建设和运营大量的小型数据设施,并且可以像传统数据中心一样运营和维护,同时为物联网等应用提供超高速的本地服务。
 
    与传统集中式数据中心有所不同的是,传统数据中心中通常有现场工作人员运营和维护,而分布在世界各地的大量小型边缘数据中心通常是无人值守的。
 
    自动化技术和无人值守管理方法将在某种程度上使边缘数据中心实现自动化运营,而最终将采用机器人等自动化技术。
 
    预测性维护
 
    无人值守的数据中心通常在工程师和技术人员很少或根本不干预的情况下运行。这个想法已经提出了很长时间,但事实证明难以实现。传统数据中心设施需要工作人员来运营,因此使其内部IT设备完全自动化运营并不是当务之急。
 
    随着第一代边缘数据中心设施的出现,无人值守已经成为一个更加紧迫的目标,或者将成为必要的条件。
 
    边缘数据中心基于集中式数据中心使用的技术,但它们的交付占用空间更小,数量更多,以至于人工维护和运营难以应对其规模的增长。
 
    工作人员不再运营和维护边缘数据中心将会使它们在许多方面变得更加强大。而更少的人为干预意味着更少的损耗以及避免人为错误,例如可能具有意外滑倒或刮蹭电缆等风险。
 
    微软公司通过运行一个水下无人值守数据中心来证明其安全性和可靠性:该公司在苏格兰地区的海底试点运行了一个安装12个机架的完全密封的水下数据中心。这个水下数据中心的设备使用寿命是同等规格设备的7倍,可以完成传统数据中心实施的工作。
 
    边缘数据中心需要采用更具弹性、高可用性的IT基础设施,这些设施由故障间隔时间(MTBF)更低的组件组成,无需工作人员的管理和维护。
 
    而硬件的冗余配置是最大限度减少停机时间的必要条件。因此,如果边缘数据中心的某一硬件设备出现故障,可以自动切换到另一个冗余的硬件设备运行。边缘数据中心基础设施将严重依赖“自我修复”组件,这些组件部署精确的状态监控和实时分析软硬件来处理收集的数据,并提供预测性维护。
 
    从供电和备份、供暖、通风和空调(HVAC)、冷却、环境监测和物理安全等这些不同的互连系统,将不断检查组件行为的变化,并做出相应的响应。
 
    这是迈向自动化的重要一步,为IT运营(AIOps)平台添加人工智能(AI)技术将增加分析和机器学习功能,以实时自动识别和响应问题。通过使用人工智能和机器学习查询在正常操作期间获得的大量历史数据,管理系统可以快速发现异常,这些异常表明潜在的故障或影响性能的问题,自动修复或通过提醒工程师远程登录,并协调重新配置过程。
 
    2020年发生的疫情使人们更加关注边缘数据中心,这是由于疫情带来的封锁导致工作人员难以进入数据中心。
 
    数据中心运营商发现,客户对使用远程工作的系统比以往更感兴趣,而专业知识的增加将促进自动化边缘数据中心的部署。
 
    标准化降低复杂性
 
    规模较小的边缘数据中心可能就是一个专用的预集成硬件设备。而规模较大的边缘数据中心将不同的IT组件组合在一起。所有边缘数据中心都需要对服务器、网络和电源进行带外管理,并结合常见任务流程的自动化,以最大限度地减少工作人员的管理和维护,可以按照访问频率和复杂性划分优先级,因此这些工作可以远程完成,最好是自动完成。
 
    在边缘计算架构中使用标准化和经过认证的API,可以在一定程度上简化由于在其设施中使用不同供应商的硬件和软件而导致的复杂性,从而使自动化成为可能。
 
    大多数数据中心运营商会采用更简洁的方法,并首先对一种特定类型的架构实现标准化。这意味着可以减少更换的零件,并且在现场准备一些更换的套件。
 
    围绕RESTful API构建的编排工具可以进行远程服务器供应、配置和监控。这同样适用于基于软件定义网络(SDN)和网络功能虚拟化(NFV)技术的网络组件,这些技术允许数据中心工作人员远程控制和管理服务器、网络、存储基础设施,以及将广域网内不同组件连接到互联网。
 
    如果设备故障数量低于需要现场维护的性能阈值之前,让边缘数据中心以部分容量运行数年的时间,那么可以显著降低维护成本。
 
    备件负担
 
    但这些支持和访问仍然是一个问题。边缘计算数据中心的薄弱环节是需要人员维修以及更换备件。这是一笔很大的开销。
 
    根据针对数据中心托管服务商的一份调查报告,他们的客户希望能够管理更多小型数据中心,就像他们管理大型数据中心一样。
 
    经验丰富的边缘数据中心运营商已经考虑到物流服务的需求,可以将零件运送到边缘数据中心并进行安装和维修。DartPoints公司首席执行官Scott Willis在2020年接受行业媒体采访中表示,该公司正在市场上购买远程服务。
 
    Willis说,“随着规模的扩大,我们可以考虑与在美国拥有大量技术资源的第三方组织合作。”
 
    无论是否有支持合作伙伴,DartPoints公司都需要区域结构提供支持。Willis表示,该公司将作为虚拟物流公司进行运营。
 
    采用机器人等自动化技术
 
    但数据中心运营商能否在寻求真正无人值守的边缘数据中心的过程中走得更远?
 
    EdgeConneX公司建立了一种小型区域数据中心,可以有效地实现无人运营,并使用远程监控和传感器来跟踪操作。此外,还具有远程控制安全性,因此客户可以远程操作和管理。
 
    EdgeConneX公司首席信息官Lance Devin说,“我们的业务主要基于无人值守的数据中心,运营的是电力容量为2MW的小型数据中心,我们不会为运营这样的数据中心雇佣工程师、安全人员和维护人员。”
 
    对于远程运营小型数据中心设施,可能需要更进一步的措施:一些边缘数据中心部署了可以更换硬件或者能够更换或升级服务器的机器人。
 
    例如,在一个集装箱式边缘数据中心部署了12个热插拔的服务器机架,还有一个备用机架,以及一台龙门式机器人(就像自动磁带库中的机器人一样),该机器人能够根据需要更换出现故障的设备。
 
    而移动和更换IT部件似乎不是一个好主意,增加了边缘数据中心的复杂性,并且机器人本身也需要维护,但也提供了更多的好处。
 
    无人值守机器人现在已经在一些自动化程度高的生产工厂中应用,但在边缘数据中心的应用还很少。这将需要配备额外的硬件,增加了边缘数据中心的运营成本,但是将其访问减少最低限度是值得的。例如,联邦快递或UPS快递人员可以将新零件快递到边缘数据中心,并从其料斗中回收故障或损坏的设备。
 
    构建无人区
 
    机器人可以提供无人值守的好处,例如微软公司试点运营的水下数据中心这样的边缘数据中心。
 
    微软公司Natick项目负责人David Cutler说:“我们的边缘数据中心运行了25个月零8天。在此期间,在传统数据中心运营的135台服务器中,有8台宕机;而在水中运行的同样规格的855台服务器中,只有6台宕机。”
 
    隔绝外部环境是户外运行的边缘数据中心的一个主要好处,因为这样的边缘数据中心可以避免潮湿空气进入机架,从而损坏IT设备。边缘数据中心设施可以进行密封并填充惰性氮气,因此服务器设备将具有更长的使用寿命。
 
    虽然这样的边缘数据中心还在开发和研究中,并且达到当前数据中心运营商的商业模式还有很长的路要走,但这种技术进步很重要,最终可能会改变下一代传统数据中心的设计和运营方式。
 
    这些边缘数据中心中的IT设备采用传统数据中心中使用的IT套件,并且电源和冷却架构将会兼容,其设备也将兼容大型数据中心的设备。如果开发出一种有效可行的自动化技术,那么应用在传统数据中心将是一个巨大的进步。
 
    边缘数据中心的发展将会促进液体冷却等领域的变化和发展,虽然这对于改造大型数据中心设施来说可能成本昂贵,但对于规模较小的边缘数据中心来说可能是最有效的方法。
 
    为边缘数据中心开发的自动化软件将很容易应用在传统数据中心,这将为未来采用机器人等自动化技术铺平道路。