信息机

服务器液冷温控行业专题报告AI推动液冷从

发布时间:2024/1/12 14:50:08   
白癜风治愈 http://m.39.net/news/a_5964855.html

(报告出品方/作者:招商证券,梁程加、孙嘉擎)

一、芯片厂商出于功耗考虑,加大液冷散热技术研发与引入力度

1、芯片内部集成微流体液冷系统,CPU/GPU芯片厂商加装冷却器/对接液冷系统

后摩尔定律时代芯片算力与功耗同步大幅提升,一方面,学界创新性提出“于芯片内部集成微流体液冷系统”,并逐步在业内尝试,主流CPU、GPU厂商则选择加装冷却器、对接液冷系统,实现芯片的液冷散热。主流CPU、GPU厂商则选择加装冷却器、对接液冷系统,实现芯片的液冷散热:

CPU方面,以Intel为首的CPU芯片厂商选择为CPU芯片加装一体式(AIO)冷却器,与风冷模式类似,整个冷却过程从CPUIHS基板出发,IHS上附有导热管,方便两个表面之间进行传热,基板的金属表面则为水冷头的一部分,水冷头中装填冷却液。当冷却液通过水冷头时,会从基板中吸收热量,而后向上通过管道到达散热器,散热器再将液体暴露于空气中,实现冷却的一次循环。

GPU方面,NVIDIA在其AGBPCIe中提供双插槽风冷式或单插槽液冷式双版本,AGBPCIe单插槽液冷版本类似于桌面液冷显卡,其中整合水冷头,接口置于GPU芯片尾部,方便对接液冷系统,HGXA则采用SXM样式计算卡,在机架内部直接整合液冷系统。

2、主流芯片厂商布局情况

(1)CPU方面,IntelQ1发布的第四代至强处理器多款子产品热设计功耗达W,传统风冷解决方案散热压力极大,年1月Intel至强发布会上表明,第四代至强处理器将会配置液冷散热方案。

Intel与合作伙伴共同设计冷板式液冷解决方案。一方面,Intel携手生态伙伴,全面系统地总结冷板液冷系统的设计与实践经验,发布《英特尔高效能数据中心白皮书》、《绿色数据中心创新实践——冷板液冷系统设计参考》。另一方面,Intel和合作伙伴不断推进冷板方案的具体落地应用,Q2,Intel与京东云合作,基于第三代Intel至强可扩展处理器,共同调整其核心数、Turbo频率、TDP、RAS特性等主要参数,以适配冷板式液冷解决方案的部署。Intel已通过自研、合作研发等模式对于服务器浸没式液冷开展研究。1)年,Intel宣布与Sumber合作,双方会将至强架构的CPU系统与精密冷却技术相结合,开发基于浸没式液冷的余热回收技术;2)年,GRC(GreenRevolutionCooling)公司宣布将会为Intel至强处理器提供浸没式液冷技术优化;3)年,Intel发言人透露,Intel将会在其希尔斯伯勒工厂内继续进行浸没式液冷创新技术研究。

(2)GPU方面,年5月,英伟达宣布将在A、H系列产品中引入直接芯片(DirecttoChip)液冷散热技术,AGBPCIe将在尾部安置接口,以对接液冷系统。根据Equinix与NVIDIA的测试结果,液冷NVIDIAAPCleGPU一方面可以在空间相同的条件下,实现双倍计算量;另一方面,采用液冷技术的数据中心工作负载可以与风冷设施持平,但能源消耗量将减少28%。同时,根据NVIDIA估计,采用液冷GPU的数据中心PUE可以达到1.15,远低于风冷的1.6。

二、液冷温控供应商梳理:

1、液冷温控市场空间测算

预计年国内IDC液冷市场规模将达到.8亿元,其中AI服务器液冷市场规模达亿元、通用服务器液冷市场规模达32.8亿元;预计年国内IDC液冷市场规模将达到亿元,其中AI服务器液冷市场规模达亿元、通用服务器液冷市场规模达37.7亿元;

2、温控解决方案供应商

国内液冷温控解决方案提供商在液冷解决方案技术储备、液冷产品线上各有差异。

三、算力升级大趋势下服务器厂商加速布局液冷服务器产品

1、冷板式液冷对于服务器整体改动较小,浸没式液冷对于服务器有较高要求

(1)冷板式加装液冷模块

冷板式液冷对于服务器本身改动较小,主要途径为加装液冷模块。冷板式液冷是最为典型的间接接触型液冷技术,在冷板式液冷系统中,服务器芯片等发热器件不直接接触冷却液,而是通过装配在电子元器件上的冷板(通常是铜、铝等高导热金属构成的封闭腔体)将热量间接传递给封闭在循环管路中的冷却液体,从而将主要发热器件的热量传递出去。

冷板式液冷技术对现有服务器芯片组件及附属部件改动量较小,液冷化改造可操作性相对较强。主要在服务器中加装液冷模块,采用集中式或分布式CDU供液、Manifold分液,以此对于CPU、DIMM等部件进行精准制冷。在实际操作过程中,中国移动(呼和浩特)数据中心将冷板式液冷细分出“两级热管”、“水冷+热管”、“芯片冷板”三条具体技术路径:“两级热管”液冷服务器:此模式将服务器CPU、GPU、内存等产生的热量从一级导热管传递至二级导热管,二级热管冷媒流动至换热器将热量传递给冷冻水,交换后的热水通过室外回水管路流出,完成整个换热过程。“水冷+热管”液冷服务器:此模式将通过热管导热原理将服务器CPU、GPU、内存等产生的热量传递至热管冷凝端,冷却水在冷凝端与热管进行热交换,交换后的热水经由回水管路流出,完成整个换热过程。“芯片冷板”液冷服务器:此模式采用泵驱动冷却液流过芯片背部通道,冷却液在通道内通过板壁与芯片进行充分热交换,带走芯片端的热量后,含有热量的冷却液将通过集分水器将热量输送至机房内的CDU完成热量交换。

(2)浸没式要对服务器箱体定制化改造

浸没式液冷改造对于服务器本身及浸没腔体具有较高要求。浸没式液冷改造过程中,服务器箱体需要进行定制,满足三点要求:1)采用高功率密度设计;2)采用结构定制化设计以强化液体与发热器件之间的热交换;3)采用结构定制化以提高浸没式液冷环境下电子信息设备的运维效率。同时,浸没式液冷服务器浸没腔体应该被设计顶部开盖、由四个壁面和一个底面围成的具有一定内部容积的结构,分气相区与液相区,服务器主板浸没于液相区内,气相区保障气密性良好,确保冷却液蒸汽无泄漏;单项系统中液相区的液体温度场需均匀,无局部热点,同一水平界面下温差需要5℃。实践层面上,中科曙光以液冷刀片形式为行业提供服务器改造思路。浸没式液冷技术基于液体直接制冷,当前仍然处于发展早期,由于研发难度较大、投入成本较高,当前入局的服务器厂商较少。中科曙光旗下子公司曙光数创,专注于数据中心制冷基础实施开发,由其所开发的以液冷刀片服务器为核心的浸没相变产品为行业提供技术商业化落地思路。液冷刀片服务器由刀片模块,后插单板、电源等组成,通过设备后总接口置于冷媒之中。根据曙光数创方案,将液冷服务器全部浸没于冷媒之中,CPU、GPU等发热元器件通过冷媒相变换热的方式实现散热,气化的冷媒进入换热器与常温冷却水换热,冷凝为液体后,完成热力循环。

2、主流服务器厂商布局情况

算力升级大趋势下AI服务器渗透率快速提升,功耗提升带动服务器厂商加速布局液冷服务器产品。根据IDC数据,年全球AI服务器市场规模达亿美元,同比增长29.8%,占服务器市场规模的比例为16.4%,同比提升1.2pct。

相比于传统服务器,AI服务器整机功耗也随之走高,如NVIDIADGXA640GB,其采用双路AMDRome与8颗NVIDIAAGBTensorCoreGPU,最大整体功耗达到6.5kW。故中科曙光、中兴通讯、紫光股份、浪潮信息、宁畅等服务器厂商也开始加速布局液冷服务器产品以应对算力升级趋势下服务器功耗持续提升的现状。

(1)中科曙光:高性能计算领军企业,深耕服务器液冷技术研发十余年

中科曙光作为国内液冷先进计算的领导者,液冷技术研发经历“冷板式液冷技术”、“浸没式液冷技术”、“浸没相变液冷技术”三大发展阶段。公司于年开始液冷技术研究,年推出我国首款标准化的量产冷板式液冷服务器,年推动全球首个大规模浸没相变液冷项目的商业落地。当前公司已形成冷板式液冷C系列、浸没式液冷C系列、TCE-LP冷板式液冷刀片服务器产品线,覆盖物理、化学、材料、生命科学、气象等基础研究领域及金融、动漫等多行业。核心发热部件采用液冷散热方式,改造技术成熟并可有效控制成本。受制于成本与技术成熟度等因素,传统液冷高性能服务器大规模部署遭遇瓶颈,公司C系列通用液冷服务器与TCE-LP刀片式液冷服务器皆采用风冷与液冷相结合的方式,通过为服务器内部主要热源(CPU、内存等)配置液冷冷板套件、封闭通道、竖直分液单元、液冷换热单元等产品,对于传统风冷服务器进行液冷改造设计,整体冷板式液冷改造技术成熟,并可以有效控制成本,为后续液冷高性能服务器产业化提供可能。

高端计算领域浸没液冷技术储备充足,逐步向液冷存储、AI液冷服务器、液冷集装箱产品拓展。根据中国智能计算产业联盟发布的《东数西算下新型算力基础设施发展白皮书》,公司在高端计算领域的浸没式液冷技术与高密度刀片系统集成技术相当成熟,但机柜功率已达kW,模块化组装设计方案使得单位机房计算密度提升30倍。年11月,公司发布业内首款液冷存储系统ParaStor,采用冷板式液冷设计,帮助降低除芯片外,硬盘、内存等关键存储部件的工作温度。随着各大厂商陆续进行自己的AI大模型研发,年2月,公司推出“全浸没式液冷AI训练专用服务器”,并与百度、复旦大学等深度合作,支持国内多个千亿级以上参数规模的AI大模型训练。年3月,公司子公司曙光数创正式发布“液冷集装箱数据中心”产品,集成冷板式液冷、浸没式液冷与风冷基础设施设备,满足通用、人工智能计算等应用场景需求。

(2)中兴通讯:长期处于市场一线,前瞻布局ICT液冷一体化解决方案

中兴通讯作为全球领先的综合性通信解决方案提供商,长期处于市场一线,根据自身技能专长,前瞻性布局ICT液冷一体化解决方案。公司当前主要基于冷板式液冷技术,形成单板级、插箱级、机柜级、机房级四个不同维度的液冷技术线,主要覆盖IT液冷服务器设备、CT液冷路由交换设备、DC液冷数据中心机房的开发与交付。根据公司

转载请注明:http://www.aideyishus.com/lkjg/6221.html

------分隔线----------------------------