首页 导报现场 正文

曙光数创:避免对液冷技术的三个误读

2025-01-15 16:08 中国发展网
液冷技术 服务器 数据中心 数字经济

摘要:曙光数创相关负责人日前在京接受记者采访时表示,液冷技术是大势所趋,未来大有可为,但从技术角度要避免三种“误读”。

中国经济导报、中国发展网 记者崔立勇报道

据中国信息通信研究院测算,2023年全球算力规模为1397EFlops,中国占比达三分之一。算力的增长离不开数据中心的支撑。在满足巨大算力需求的同时,数据中心的高效和稳定却面临散热和能耗的巨大挑战。

相关研究表明,当芯片TDP(Thermal Design Power,散热设计功耗)超过350W时,风冷逼近极限,液冷呼之欲出。液冷目前在我国的整体渗透率约为10%,业内认为,预计未来3至5年,液冷行业有望保持30%以上的年复合增长率。

曙光数创在2023年度的液冷基础设施市场中表现出色,以61.3%的市场份额连续第三年稳居中国液冷行业首位。曙光数创相关负责人日前在京接受记者采访时表示,液冷技术是大势所趋,未来大有可为,但从技术角度要避免三种“误读”。

误读1:应用液冷仅仅是为了节能

“千万不要把液冷仅仅局限为绿色节能,这是一个特别大的误区。”曙光数创副总裁兼CTO张鹏强调,符合国家绿色低碳的发展战略,是液冷快速落地的重要原因,但是液冷爆发的根本原因还是传统的风冷技术手段无法解决服务器芯片的散热难题。

数据中心用电量目前占社会总发电量的2%至3%。预计到2025年,我国数据中心电力消耗将接近4000亿千瓦时,占全国总电力消耗的5%以上。在此背景下,采用更为节能的液冷技术成为必然。

要解决数据中心耗电问题,液冷技术是有效的手段之一。曙光数创致力于技术创新,通过优化产品设计和生产工艺,提供更加环保高效的算力基础设施服务,为构建绿色高效的AI生态系统奠定了坚实的基础,助力“双碳”目标的实现。

然而不能忽视,液冷也是被“逼出来”的。张鹏介绍,数据中心经历了数据处理中心(DC)、互联网数据中心(IDC)、智算中心(AIDC)等阶段。随着AI模型日益复杂,数据处理量爆炸式增长,AI正在驱动数据中心快速发展。

过去,服务器CPU功耗只有150瓦至200瓦,这种水平持续了近20年。从2020年开始,全球数据量呈指数级增长,尤其是随着AI大模型训练对算力需求的激增,GPU更是从A100的450瓦发展到H100的700瓦,B100甚至达到1200瓦,功率之大可谓“恐怖”。而且,芯片功率还有进一步提高的趋势,GPU开始普遍采取高密度部署的方式。

在此情况下,传统风冷技术不仅会影响芯片性能发挥,还可能导致服务器稳定性和可靠性下降。张鹏表示,当散热变成数据中心难以跨越的难题,那么液冷技术的应用就不是可选项,而是必选项。

“我们的主要工作就是‘伺候’服务器。”张鹏说,曙光数创用高效能的液冷解决方案,为解决高密度计算带来的散热难题提供了新的途径。作为北交所上市公司中的专精特新“小巨人”企业代表,曙光数创深耕数据中心液冷领域20余年,在液冷技术领域持续加大研发与应用力度,正是为了保证算力基础设施建设的安全和稳定。

误读2:“风液混冷”是风冷和液冷分开使用的二选一

在实践中,曙光数创将风冷系统与液冷系统高效集成,一体化解决数据中心的散热需求。这种“风液混冷”智算数据中心解决方案创新性地采用风、液共用一套冷源系统的方式,简化了系统结构,降低了建设和运维成本,还实现了风液冷却的弹性调节。

从技术上分析,有的国内企业在储能产品上使用风液混冷技术。具体看来,是产品在不同工况下分别采取风冷或液冷——高功率运行时,使用液冷;低功率运行时,采取风冷。

张鹏解释,与之不同,曙光数创的“风液混冷”方案是同时对同一数据中心中的不同设备或部件分别采用风冷或液冷,用合理的风冷和液冷的比例搭配让数据中心“冷下来”。

冷板式服务器对最主要的发热芯片进行了液冷覆盖,硬盘、网络、电源、内存等仍然需要风冷去散热。传统的液冷数据中心采取两套冷源——一套是CDU(Cooling Distribution Units,冷却分发单元),将数据中心中产生的热量转移到冷却介质中,然后将冷却介质通过冷却系统散热出去,采用的是自然冷却;另一套是以空调系统为代表的风冷。在曙光数创的“风液混冷”中,风冷系统与液冷系统共用一次侧管路,共用室外散热冷源,将复杂的冷却系统进行了极大简化。

曙光数创产品部高级总监黄元峰强调,这种新方案的优势还在于“风液可调”——在数据中心建设之初,很多用户并不确定CPU、GPU、存储的具体数量,甚至不知道风冷服务器和液冷服务器之间的比例,如果为两种服务器各自建设一套冷源,那么当服务器部署的数量发生变化,或者未来对服务器进行调整,那么冷却系统就会遭遇和服务器难以匹配的窘境。曙光数创的“风液混冷”则能够根据不同场景和需求灵活调整冷却方式,大大提高了能源利用效率。

不仅如此,曙光数创还引入了“源网荷储”一体化的新模式,实现源源互补、源网协调、网荷互动、网储互动和源荷互动等多种交互形式。

黄元峰介绍,“源”是指电源侧,“网”是指整个电力的输送,“荷”是指负载,“储”是指配储能。“源网荷储”一体化是将能源的产生、电网、用电负荷和储能系统进行有机整合,进一步增强数据中心的供电可靠性,显著提升电力系统的功率动态平衡能力,为智算中心提供经济、高效、安全的能源解决方案。

黄元峰表示,数据中心有效使用风电、光伏等新能源的电力,由此降低了数据中心的用电成本,实现减碳。更重要的是,“源网荷储”在数据中心的应用有助于化解新能源发电一直面对的“不稳定”难题。数据中心直接使用、就近消纳绿电,减少新能源电力上网的压力。同时,数据中心根据绿电供应的变化进行算力协调,实现电力和算力的配合。

误读3:液冷的产业链不成熟

液冷行业正在加速技术标准的建立。曙光数创参与了国标、行标、团标等30多项标准的制订,牵头的《数据中心冷板式液冷系统技术规范》已经通过审批。

张鹏表示,液冷技术仍在发展迭代,能力和可靠性还将继续提升,但是从产业链角度观察,这并不代表液冷产业链尚未成熟。

张鹏分析,以冷板式液冷为例,技术成熟度较高,汽车发动机采用同样的技术原理,近年来在储能领域也得到广泛应用。在数据中心,用户对液冷的接受度不成问题。

与此同时,张鹏认为,标准化和模块化将推动行业的整体健康发展,降低整个行业的成本。他举了一个具体的例子——液冷设备缺乏统一的接头标准,每个品牌的接头都不一样。按照曙光数创的统计,接头成本占据了液冷系统1/4-1/3的成本。“系统中最贵的应该是管路、水泵、散热器等部件,接头成本不应该超过总成本的1/10。”他说,随着液冷规模的扩大,接头标准亟待建立。

需要解决的还有液冷的水质问题。冷板中的水温一般在40—50摄氏度,这个温度相对容易滋生细菌。为了应对这种问题,行业内采用了在水中添加乙二醇、丙二醇或者杀菌剂等办法。在张鹏看来,这些方法各有其优点和不足,总体来看还没有特别有效且经济的手段。

张鹏表示,液冷技术仍在不断进步,更细微更具体的问题将逐步得到破解。随着相关标准的逐步建立,液冷行业仍将持续快速发展。

责任编辑:崔立勇

返回首页
相关新闻
返回顶部