一、芯片散熱概覽:功耗升級、散熱技術(shù)持續(xù)革新
電子設(shè)備發(fā)熱的本質(zhì)原因就是工作能量轉(zhuǎn)化為熱能的過程。散熱是為解決高性能計算設(shè)備中的熱管理問題而設(shè)計的,它們通過直接在芯片或處理器表面移除熱量來優(yōu)化設(shè)備性能并延長使用壽命。隨著芯片功耗的提升,散熱技術(shù)從一維熱管的線式均溫,到二維VC的平面均溫,發(fā)展到三維的一體式均溫,即3D VC技術(shù)路徑,最后發(fā)展到液冷技術(shù)。
二、主要散熱技術(shù):從風(fēng)冷到液冷,冷板到浸沒式
散熱技術(shù)包括風(fēng)冷與液冷兩類。風(fēng)冷技術(shù)中,熱管與VC的散熱能力較低,3D VC散熱上限擴(kuò)至1000W,均需搭配風(fēng)扇進(jìn)行散熱,技術(shù)簡單、便宜,
適用于大多數(shù)設(shè)備。液冷技術(shù)具備更高散熱效率,包括冷板式與浸沒式兩類,其中冷板式為間接冷卻,初始投資中等,運維成本較低,相對成熟,英偉達(dá)GB200 NVL72采用冷板式液冷解決方案;浸沒式為直接冷卻,技術(shù)要求較高,運營維護(hù)成本較高,曙光數(shù)創(chuàng)研發(fā)“1拖2”雙相浸沒液冷結(jié)構(gòu)。
三、性能+TCO多重驅(qū)動,散熱市場規(guī)模持續(xù)向上
AI大模型訓(xùn)推對芯片算力提出更高要求,提升單芯片功耗。芯片溫度影響性能,當(dāng)芯片工作溫度近70-80℃ 時,溫度每升高2℃,芯片性能會降低約
10%,故單芯片功耗增長進(jìn)一步提升散熱需求。此外,英偉達(dá)B200功耗超1000W、接近風(fēng)冷散熱上限;“雙碳”+東數(shù)西算等政策嚴(yán)格數(shù)據(jù)中心PUE要求,液冷平均PUE低于風(fēng)冷;TCO方面,相比風(fēng)冷,冷板液冷的初始投資成本接近風(fēng)冷,并且后續(xù)運行成本更低。
1.1 芯片散熱起源:電子設(shè)備發(fā)熱的本質(zhì)是工作能量轉(zhuǎn)成熱能
● 電子設(shè)備發(fā)熱的本質(zhì)原因就是工作能量轉(zhuǎn)化為熱能的過程。芯片作為電子設(shè)備的核心部件,其基本工作原理是將電信號轉(zhuǎn)化為各 種功能信號,實現(xiàn)數(shù)據(jù)處理、存儲和傳輸?shù)裙δ?。而芯片在完成這些功能的過程中,會產(chǎn)生大量熱量,這是因為電子信號的傳輸 會伴隨電阻、電容、電感等能量損耗,這些損耗會被轉(zhuǎn)化為熱能。
● 溫度過高會影響電子設(shè)備工作性能,甚至導(dǎo)致電子設(shè)備損壞。據(jù)《電子芯片散熱技術(shù)的研究現(xiàn)狀及發(fā)展前景》,如對于穩(wěn)定持續(xù) 工作的電子芯片,最高溫度不能超過85 ℃,溫度過高會導(dǎo)致芯片損壞。
● 散熱技術(shù)需要持續(xù)升級,來控制電子設(shè)備的運行溫度。芯片性能持續(xù)發(fā)展,這提升了芯片功耗,也對散熱技術(shù)提出了更高的要求。此外,AI大模型的訓(xùn)練與推理需求,要求AI芯片的單卡算力提升,有望進(jìn)一步打開先進(jìn)散熱技術(shù)的成長空間。
來源:CSDN,各公司官網(wǎng),國海證券研究
1.2 散熱技術(shù)原理:電子設(shè)備發(fā)熱的本質(zhì)是工作能量轉(zhuǎn)成熱能
資料來源:雙鴻公告,飛榮達(dá)官網(wǎng),國海證券研究所
資料來源:uanalyze,國海證券研究所
1.3 芯片散熱革新:浸沒式散熱效果好,冷板式更為成熟
根據(jù)ODCC《冷板液冷服務(wù)器設(shè)計白皮書》,綜合考量初始投資成本、可維護(hù)性、PUE 效果以及產(chǎn)業(yè)成熟度等 因素,冷板式和單相浸沒式相較其他液冷技術(shù)更有優(yōu)勢,是當(dāng)前業(yè)界的主流解決方案。
資料來源:《冷板液冷服務(wù)器設(shè)計白皮書》,國海證券研究
2.1.1 熱管:高效傳熱器件,適用大功率和空間小場景
來源:分析測試百科網(wǎng),Tom's Hardware,蘭洋科技,國海證券研究
2.1.2 VC:相比熱管,具備更高的導(dǎo)熱效率與靈活性
VC均溫板,全稱為Vapor Chamber,即真空腔均熱板散熱技術(shù),是一種比熱管更先進(jìn)、更高效的導(dǎo)熱元件, 尤其在處理高密度電子設(shè)備的熱管理問題時表現(xiàn)出色。
相比熱管,VC的導(dǎo)熱效率與靈活度更強(qiáng)。銅的導(dǎo)熱系數(shù)為401W/m.k,熱管可以達(dá)到5000~8000 W/m?k,而均 熱板則可以達(dá)到20000~10000W/m?k,甚至更高。熱管是一維導(dǎo)熱,受其形狀顯示。而均熱板形狀則不受限制, 可以根據(jù)芯片的布局,設(shè)計任意形狀,甚至可以兼容處于不同高度的多個熱源的散熱。
2.1.2 3D VC:具備高效散熱、均勻溫度分布、減少熱點優(yōu)勢
● 3D VC(三維兩相均溫技術(shù)):是利用熱管與均溫板蒸汽腔體貫通的散熱技術(shù)。
● 3D VC具有“高效散熱、均勻溫度分布、減少熱點”等解熱優(yōu)勢,可滿足大功率器件解熱、高熱流密度區(qū)域均溫的瓶頸需求,也 可以保證獲得更強(qiáng)的超頻性能以及超頻后的系統(tǒng)穩(wěn)定性。
● 對比熱管/均溫板間導(dǎo)熱,是把熱量傳遞至二次組裝的多根熱管/均溫板,存在接觸熱阻以及銅本身的熱阻;而3D VC通過三維結(jié) 構(gòu)連通下,內(nèi)部液體相變、熱擴(kuò)散,直接、高效地將芯片熱量傳遞至齒片遠(yuǎn)端散熱。
2.1.3 風(fēng)扇:與熱管/3DVC/冷管等組合使用
2.1.4 機(jī)房空調(diào):水冷空調(diào)相對風(fēng)冷系統(tǒng)制冷效果好
來源:前瞻產(chǎn)業(yè)研究院,LEDC,制冷百科,國海證券研究所
2.1.4 機(jī)房空調(diào):氟泵系統(tǒng)與間接蒸發(fā)系統(tǒng)較為穩(wěn)定
● 氟泵系統(tǒng):一種用于制冷和空調(diào)設(shè)備中的循環(huán)系統(tǒng),它通過泵送氟利昂或其它制冷劑來傳遞熱量。主要優(yōu)點是可以精確控制制冷 劑的流量和壓力,從而提高系統(tǒng)的效率和穩(wěn)定性。
● 間接蒸發(fā)系統(tǒng):是一種利用水蒸發(fā)吸熱原理來降低空氣溫度的空調(diào)系統(tǒng),它與直接蒸發(fā)冷卻系統(tǒng)不同之處在于,冷卻的空氣與蒸 發(fā)的水不直接接觸。這種設(shè)計可以提供比直接蒸發(fā)冷卻更為清潔和干燥的空氣,適用于對濕度和空氣質(zhì)量有特殊要求的環(huán)境。
來源:制冷百科,凱德利
2.2 液冷:冷板式與浸沒式液冷為主
● 服務(wù)器液冷分為直接冷卻和間接冷卻,直接冷卻以浸沒式為主,間接冷卻以冷板式為主。
● 冷板式液冷的冷卻液不與服務(wù)器元器件直接接觸,而是通過冷板進(jìn)行換熱,所以稱之為間接液冷。依據(jù)冷卻液在 冷板中是否發(fā)生相變,分為單相冷板式液冷及兩相冷板式液冷。
● 浸沒式液冷是將整個服務(wù)器或其組件直接浸入液體冷卻劑中的冷卻方式
來源:《冷板液冷標(biāo)準(zhǔn)化及技術(shù)優(yōu)化白皮書》等
2.2.1 冷板式液冷:需改造服務(wù)器,滲透率逐漸提升
2.2.1 冷板式液冷:英偉達(dá)GB200 NVL72使用冷板式液冷結(jié)構(gòu)
2.2.2 浸沒式液冷:液體浸泡服務(wù)器整體,技術(shù)要求高
2.2.2 單相浸沒:實現(xiàn)服務(wù)器全液冷,技術(shù)難度較高
● 單相浸沒液冷機(jī)柜:是將液冷服務(wù)器內(nèi)置于Tank內(nèi)部,CDU與Tank之間由管道鏈接,下部管道輸送低溫冷卻介質(zhì)到tank內(nèi),液 冷介質(zhì)吸收了液冷服務(wù)器的熱量,溫度上升后流回CDU,熱量由CDU帶走。此種結(jié)構(gòu)可實現(xiàn)服務(wù)器的全液冷,無風(fēng)扇的設(shè)計使 功率密度更高,相比風(fēng)冷PUE更低。但技術(shù)難度較高,滲透率相對較低。
● 阿里云布局浸沒式液冷系統(tǒng):2016年,阿里云發(fā)布首套浸沒式液冷系統(tǒng),于2017年完成浸沒式液冷集群構(gòu)建;2018年,建成首 個互聯(lián)網(wǎng)液冷數(shù)據(jù)中心;2020年,打造中國最大規(guī)模的單相浸沒式液冷數(shù)據(jù)中心暨全國首座5A級綠色液冷數(shù)據(jù)中心。
來源:Intel官網(wǎng),《綠色節(jié)能液冷數(shù)據(jù)中心白皮書》,國海證券研究
2.2.2 雙相浸沒:技術(shù)要求較高,可大幅提升系統(tǒng)功率密度
● 雙相浸沒液冷服務(wù)器結(jié)構(gòu)(以曙光數(shù)創(chuàng)技術(shù)為例):
● 1)“1拖2”單元結(jié)構(gòu):由中間CDM液冷柜和左右兩側(cè)計算機(jī)柜構(gòu)成。兩側(cè)機(jī)柜內(nèi)服務(wù)器產(chǎn)生的熱量由中間CDM液冷機(jī)柜帶走。中間液冷柜內(nèi)集成CDM、循環(huán)管路等系統(tǒng)。此種結(jié)構(gòu)可以大幅度提升系統(tǒng)功率密度,降低數(shù)據(jù)中心建設(shè)難度。
● 2)刀片式相變浸沒腔:獨立可插拔設(shè)計,完全解耦節(jié)點與節(jié)點之間的熱循環(huán)路徑,使得每一個節(jié)點都可以進(jìn)行獨立的插拔,方 便用戶對單獨的節(jié)點進(jìn)行硬件升級或維護(hù)。
● 3)芯片強(qiáng)化沸騰散熱設(shè)計:由于服務(wù)器內(nèi)主芯片功率較高,芯片表面需要進(jìn)行強(qiáng)化沸騰處理,以增加其表面的氣化核心,增強(qiáng) 相變換熱效率。曙光數(shù)創(chuàng)的浸沒相變液冷數(shù)據(jù)中心基礎(chǔ)設(shè)施產(chǎn)品對芯片采用了強(qiáng)化沸騰封裝的方式,換熱區(qū)域采用高密翅片來強(qiáng) 化沸騰界面的沸騰換熱,最高可實現(xiàn)100W/c㎡以上的散熱密度。
來源:《綠色節(jié)能液冷數(shù)據(jù)中心白皮書
AI算力發(fā)展與政策PUE等驅(qū)動下,芯片級散熱將從熱管/VC轉(zhuǎn)向更高效的3DVC與冷板,芯片級散熱有望打開成長空間、迎量價齊升。
相關(guān)公司
1)芯片散熱:曙光數(shù)創(chuàng)、飛榮達(dá)、中航光電、立訊精密、中石科技、思泉新材;
2)數(shù)據(jù)中心散熱:英維克、高瀾股份、申菱環(huán)境、佳力圖、朗威股份、依米康、同飛股份、川潤股份、潤澤科技、科華數(shù)據(jù)、網(wǎng)宿科技;
3)服務(wù)器整機(jī):浪潮信息、中科曙光、工業(yè)富聯(lián)、華勤技術(shù)、紫光股份、中興通訊、軟通動力、神州數(shù)碼、烽火通信、中國長城等。
來源:國海證券研究所
-
AI
+關(guān)注
關(guān)注
87文章
29349瀏覽量
267631 -
芯片散熱
+關(guān)注
關(guān)注
0文章
8瀏覽量
7518 -
液冷
+關(guān)注
關(guān)注
4文章
88瀏覽量
4926
發(fā)布評論請先 登錄
相關(guān)推薦
評論