近日,由CDCC和益企研究院主办,OCTC开放计算委员会协办的“2024中国智算中心全栈技术大会、第5届中国数据中心绿色能源大会暨第10届中国(上海)国际数据中心产业展览会”在上海新国际博览中心盛大开幕!曙光数创作为液冷数据中心技术的领航者之一,受邀参加此次盛会。
在本次大会中,曙光数创副总裁兼CTO张鹏博士在“AI时代液冷爆发”论坛发表《相变浸没液冷系统关键技术分享》主题演讲。曙光系是液冷数据中心,尤其是浸没式液冷数据中心,的*大实践者。自从2011年开始启动液冷有关技术的研究,至今连续三年液冷产品市占率*,在浸没液冷技术和项目实践经验都有丰富且精深的积累,本次张鹏深度解析了曙光数创相变浸没液冷系统的独到之处,揭秘了这一前沿技术的关键所在。
演讲中张鹏博士对曙光数创相变浸没液冷系统6大关键技术进行了全面的剖析,每一项技术难题的攻克,都彰显了曙光数创在液冷领域的深厚技术底蕴,也侧面反映了其在推动数据中心绿色转型和能效提升方面的重要贡献。
冷媒是实现高效浸没冷却技术的重要材料,液冷系统的换热效果、材料与信号兼容性、安全性等都与冷媒自身的物性特征紧密相关。冷媒作为高效浸没液体冷却技术的换热介质,须具有高绝缘、低沸点、大潜热、稳定性高、低粘度、安全性、以及环境友好(无臭氧破坏、温室效应低)等诸多特点,这对浸没冷媒的筛选和测试工作带来很大挑战。曙光数创浸没液冷所使用的冷媒是曙光数创与中国科学院某研究所联合研发的产品,冷媒的整个研发过程科学严谨,技术先进,同时符合国家政策的要求,绿色环保。与国外同种类型的产品相比,曙光数创冷媒在性能和成本方面具有显而易见的优势。从2017年到2024年,经过三代冷媒产品的研发迭代,曙光数创的浸没冷媒实现了技术自主可控、成本可控、性能优越和安全环保。
若将服务器浸没在冷媒中,须考虑服务器的电子元器件、结构件、密封件、焊料等所有涉液部件与冷媒的兼容性问题,确保其与冷媒长期兼容,不影响液冷服务器的长期稳定运行。曙光数创的开发团队自2012年就开始了冷媒相关兼容性研究,搭建了专用兼容性测试平台,选出了适合浸没液冷的冷媒,并与几十种电子元器件进行了数万小时的材料相容性测试,建立了材料白名单和黑名单,并不断迭代出适用于全浸式液体相变冷却技术的完善材料兼容性数据库,在为该技术在电子计算机领域的全面推广应用打下坚实理论基础的同时,还在实践中摸索出一套自主高效的冷媒筛选及材料兼容性测试方法,为设计和材料选择提供了明确的依据。
关键技术3—高速信号衰减抑制技术:信号完整性的保障
由于冷媒的介电常数与空气不同,信号在浸没环境中传输路径的分布电容增加,导致高频信号衰减。这给主板设计和信号完整性(SI:SignalIntegrity)带了巨大挑战。主板上的CPU、GPU、内存、PCIe、高速网络的信号速率均高于1Gbps,此类信号在全浸环境下电信号特征会出现非常明显的失真,严重影响信号可靠传输。曙光数创通过研究浸没环境下的高速信号衰减规律,针对关键高速信号传输进行了优化,形成了一整套针对浸没环境的高速信号设计规范,包含主板Layout规则、板卡材料要求、测试方法等多方面内容。
关键技术4—结构密封与机电转接:实现气液循环的密封解决方案
全浸式液体相变冷却技术方面的要求在密封环境中进行冷媒的气液两相循环,以避免冷媒的损失。曙光数创通过开发适用于液体、气体、电气和信号的连接器,使这些连接器能够在密封环境中实现内部和外部的连通,同时保持良好的密封性能。这种结构密封技术对于保持系统的长期稳定运行至关重要。
相变换热技术通过强化沸腾和强化冷凝过程来提高冷却效率。曙光数创聚焦于散热器表面处理工艺的创新。通过微纳复合强化沸腾结构的引入,散热器表面被赋予了前所未有的微观形态,从而明显地增加了气化核心的数量。这一创新设计,促使沸腾过程在更低的过热温度下发生,极大地提高了热传导效率。气泡在微纳复合结构上形成并迅速脱离,加速了热量的散发,确保了液冷系统的高效运行。
强化冷凝传热,则是通过精心设计的微纳复合翅片锯齿状结构来实现的。这一独特的结构设计,旨在扰动冷凝液的流动状态,打破液膜表面张力的平衡。在微纳复合翅片的作用下,冷凝液的流动状态变得更加复杂,促使液膜在重力作用下快速脱离冷凝管,大大加快了冷凝过程。这种创新的冷凝机制,不仅提高了热交换效率,还减少了冷凝液的滞留时间,以此来降低了能耗,提升了整体系统的冷却效能。
通过强化沸腾和强化冷凝两项技术的协同作用,曙光数创的液冷系统实现了对传统冷却方式的超越,为数据中心的高效、节能冷却提供了全新的解决方案。
关键技术6—相变换热自动控制技术:智能化的系统管理
全浸式液体相变服务器,作为数据中心绿色转型的关键技术之一,对供液流量、温度和系统压力的精准控制提出了极高的要求。任何细微的失控,都可能引发连锁反应,迅速导致芯片温度异常升高、服务器内部压力超标,甚至引发设备干烧损坏的难以处理的后果。因此,寻找*适宜的控制策略,是确保其卓越的性能和系统可靠性亟待攻克的难题。
面对全浸式液体相变服务器中固有的复杂非线性特性,传统的微分方程建模方法逐渐显露出局限性。曙光数创凭借其深厚的研发底蕴,引入了神经网络等前沿技术,替代传统方法,对系统来进行了深度建模。这一创新举措,不仅仅可以精准捕捉系统的动态行为,还为控制器设计和参数优化提供了强大的仿真验证环境。通过这一系列复杂而精细的建模工作,曙光数创得以在虚拟空间中反复试验和优化,确保了控制策略的高效性和可靠性。
为了使控制管理系统能够稳定、快速且准确地响应负载变化,曙光数创采用了串级双层闭环控制结构,并巧妙地融入了基于模型预测的前馈控制环节。这一控制架构,不仅增强了系统的鲁棒性和适应性,还明显提高了其动态响应速度。无论是在负载突然激增还是骤降的情况下,控制管理系统都能够迅速做出调整,确保服务器内部的温度和压力维持在安全范围内,有很大成效避免了因响应迟缓而可能会引起的一系列问题。这种前瞻性与创新性的控制策略,充足表现了曙光数创在液冷技术软件控制方面的深刻洞察和卓越能力。
在浸没液冷产品的研发过程中,曙光数创面临着一道道技术难关,每一次挑战都如同攀登科技的高峰,考验着团队的智慧与毅力。面对浸没液冷技术中错综复杂的挑战,曙光数创的开发团队展现出了非凡的创造力和出色的解决实际问题能力。正是这份对技术创新的执着追求,让曙光数创在一次次攻坚克难中茁壮成长,勇于探索未知,将理论与实践紧密结合,不断推动技术革新,实现了产品的持续更新和迭代升级。
曙光数创的液冷技术已在多个行业得到普遍应用,包括政府、金融、科教、互联网等,为不同场景下的数据中心提供了高效、可靠的冷却解决方案。
本次大会的成功举办,不仅为行业提供了一个交流和学习的平台,也为曙光数创等企业展示了其在数据中心绿色能源领域的突出优势。在此次盛会上,曙光数创不仅展示了其在液冷技术领域的深厚积累,更首次公开揭秘了相变浸没液冷技术的独家奥秘,曙光数创通过一系列详实的数据,展示了在相变浸没液冷技术上的*新研究成果,用实际行动诠释了科学技术创新的力量。
未来,曙光数创将继续秉承创新精神,深耕液冷技术,不断探索和实践,致力于为行业带来更高效、可靠、环保的冷却解决方案,助力数据中心行业向更绿色、更智能的方向发展,让我们共同期待,在AI赋能的新时代,共同构建一个可持续发展的数字化未来。