如果黑客或某种技术故障造成企业服务器瘫痪,可能会造成数以百万计的损失。一家名为Correct Power Institute的公司开发出了一套计算机中心监控方法,可快速跟踪供电故障以尽可能延长IT系统的正常运行时间。
其中,WAGO万可控制器可检测所有电流和环境数据,并利用云技术进行分析。其强化版Linux操作系统和Correct Power的高级安全架构,可确保最高等级的数据安全。
不妨设想斯图加特一家汽车制造商的情景:早班进行的过程中,生产突然停止。传送带停止运行、零件加工机器人的敏捷动作突然暂停、生产工程师所用的触摸屏幕变黑。稍后问题清楚了,网络罪犯攻击了该制造商的计算中心,并切断了服务器的电源。在已部署的工业4.0,最重要的过程都是通过IT控制的地方,这种经历代价不菲:据估计,该公司此次停产导致的损失高达2000万欧元。
虽然这个案例是虚构的,但它又非常真实,因为几乎所有的大型企业、银行和保险集团都将其IT业务外包给计算中心。此类不间断的数据处理、分析和存储通常都在云端完成,从而大幅提升IT能力。
但难点在于:如果服务器群的IT安全性不够强大,就会很容易遭到互联网攻击。黑客会变本加厉地利用这些弱点将病毒植入代码,窃取数据或是破坏电源。
“电源是服务器的致命要害,”Correct Power Institute GmbH的CEO Bernd Steinkühler解释说。该公司是德国波鸿一家专门从事服务器群构建与监控的公司。问题在于尽管供电须服从相关监管标准和要求,但这些标准和要求往往难以贯彻。“规章制度太多,操作人员很难记住。另外,还往往缺少监控,有问题又不能及早发现,”Steinkühler表示。 而这些可能会对一家公司造成致命影响。如果IT部门不能夜以继日地工作,生产和竞争力就会受到负面影响。
利用Azure实现云分析
Correct Power可提供补救措施:该公司已开发出一套旨在实现供电能力最大化的服务器群监控理念。“为满足对于现代化计算中心的可用性与安全性要求,我们必须更加明确地完成电力检查,从而更细致地完成剩余电流的检测和评估。我们会针对电流进行大量测试,”Correct Power销售与营销部门负责人Marcel Steinkühler解释说。
WAGO万可控制器在其中扮演着关键的角色。它们会从每个服务器群的多达15000个数据点采集电流与环境数据,并将其发送给Microsoft的Azure平台进行分析和存档,而该平台则由Telekom的子公司T-system进行管理。
“这就为我们提供了集中的大数据情报。此外,由于T-system承担德国受托人职能,对访问权限进行控制,因此Azure能够提供高级别的数据监控,”首席执行官Bernd Steinkühler表示。
Correct Power的分析基于计算中心服务器机架中检测到的差动电流值。根据定义,差动电流即电气系统某个特定点处,所有有效导体电流的矢量和。由于流进流出机架的电流必须平衡,所以此值应等于零。“如果出现偏差,则很可能存在故障,我们的系统会拉响报警,”Steinkühler解释说。
该公司还会监测湿度、温度和压力等环境值。如果服务器机房内过热,则敏感型服务器就会以低输出、高功耗的方式运行。这种情况下,气候控制系统就会自动管理温度,并由云端发出一则警报消息。
这些听起来都很简单,但实际都是以一套十分复杂的系统为基础的。Correct Power的专家会在设计中充分考虑到数据安全性。
“市面上的许多控制器根本无法满足我们在这方面的需求,”Steinkühler表示。
此类控制器均基于Windows,因此需要定期安全更新。“这会带来大笔支出,而且并不符合我们的高标准安全要求。”
因此,Correct Power选择了WAGO万可的PFC200 Linux控制器。
“安全始于设计”—— IT安全从一开始就在基于层级的安全架构中集成,确保数据窃取者在面对这些控制器时束手无策。“我们十分钟爱这套强化版Linux操作系统, ”Steinkühler 表示。
安全链的核心
如果没有PFC200,这家波鸿公司设计师的理念也就无从谈起。PFC200会按定义的时间间隔自动将选定值发送给Palo Alto Network(一家安全公司)的防火墙。通信安全可通过成熟的MQTT协议,利用加密的VPN连接来保障。Palo Alto会评估信息、探测入侵者并挡住来自IT的攻击。之后再将“干净”数值通过互联网传达给Azure,以供进一步云处理。
“正是由于这个中间步骤,我们的监控解决方案已成为数据安全的‘诺克斯堡’,我们十分钟爱PFC200中的这套强化版Linux操作系统。”Steinkühler说。
由WAGO万可子公司M&M开发的“资产管理云”可通过Azure接收数据。将Web门户用作用户界面,可进行相应设置,例如,最终将什么信息存储于云端,或者哪些测量值可以触发报警。这些信息可以图表的方式清晰地显示在仪表板和由Correct Power提供支持的数据仓储数据库中。
“该解决方案的优势在于,无论我们身在何处,都可访问当前和历史数据,”Steinkühler解释说。
Correct Power监控系统已经吸引到了工业企业、银行和保险公司的注意。IT专家已在遍布欧洲、亚洲和澳洲的几十个服务器群完成了这些系统的部署。Correct Power计划在下个项目中使用Azure进行故障预测,并制定提升服务器可用性的新型运营策略。“问题通常来自于不利关联。我们要利用人工智能 ( 即所谓的机器学习 ) 来检测并预防错误,”Steinkühler说道。
专家们已在机器学习和神经网络中看到了未来的发展大势,因为在它们的帮助下,即可利用能耗与过程数据进行预测性维护。生产系统将不再是故障后维修,而是发生故障前进行维护。如此可避免长时间的闲置以及相应的成本。
WAGO万可还可推动企业向工业4.0再迈一步,因为其控制器可用作模拟与数字信息的中央数据管理器,与云端的链接也十分安全,更多价值的创造尽在万可。