2023年12月21日,由中国通信标准化协会绿色网格标准推进委员会(TGGC)主办的2023绿色网格低碳论坛在北京成功举办。论坛期间,华为就此前发布的《中小数据中心基础设施可靠性关键要素白皮书》(以下简称《白皮书》)进行了详细解读,为中小数据中心提升可靠性和可用性指明方向,牵引数据中心产业加速迈向高可靠发展新阶段。 架构融合,补足中小数据中心可靠性短板“大时代”带来“大机会”,随着大模型、AIGC的加速应用,人工智能算力需求爆炸式增长。与此同时,千行百业数字化转型如火如荼,边缘计算的崛起催生大量中小数据建设需求,既有的中小数据中心也亟待改造升级。然而,传统中小数据中心由于业务体量小、设备功率密度低、空间受限、缺乏专业运维等原因,与当前的高算力建设需求不匹配,面临着可靠运行的巨大考验。《白皮书》分析了中小数据中心建设、运维现状,并指出供配电、暖通和弱电智能化系统是影响中小数据中心可靠性的三大核心系统。基于这三大系统,《白皮书》从架构可靠、产品可靠、运行可靠和体系可靠四个维度系统阐述中小数据中心可靠性的关键要素,并给出具体的应对措施和建议,对提升中小数据中心的可靠性有很强的指导意义。 其中,在架构可靠方面,《白皮书》明确指出:企业自用的中小型数据中心一般采用风冷空调,且多数没有配备专用油机,IT设备的备电时间一般在30~120分钟,由于机柜的功率密度不高,这类数据中心往往不会为空调配备UPS备电。但随着服务器算力的大幅提升,机柜的功率密度也同步攀升,逐步向5~8kW演进,机房断电后,设备散发的热量也变得不可忽视。根据第三方的研究报告,当机柜功率密度达到8kW,数据中心的热保护关机时间缩减到不足240s。这意味着高密度的中小数据中心在市电中断后,机房短时间内会快速升温,极易导致服务器高温宕机,长时间的电池备电并未起到保障作用。近年来由于制冷系统失效导致机房高温宕机的事故频发,也说明传统中小数据中心制冷架构存在可靠性短板。连续制冷逐渐成为中小型数据中心的刚需,这种设计架构在机房断电时,可同时为IT设备和制冷设备提供稳定供电,保证机房在断电情况下,不过温宕机,从架构上大幅提升中小数据中心可靠性,补足短板,让中小数据中心坚定运行。使能绿色算力,构筑可靠底座论坛期间,华为数据中心能源及关键供电拓展部总工万欣,发表《构筑绿色算力底座,让数字世界坚定运行》主题演讲。万欣表示,随着AI、大数据、云计算等新兴技术的加速应用,算力尤其是AI算力呈现爆发式增长,数据中心作为核心基础设施,迎来高速发展机遇,同时也面临着能耗高、建设周期长、运维复杂、数据/物理安全挑战大等挑战。华为基于"GSSR(绿色、极简、智能、安全)"理念,从供(清洁供能)—建(低碳建设)—用(高效用能)—营(绿色运营)”四个维度,端到端打造面向未来的新一代绿色低碳数据中心,让数字世界坚定运行。