Copyright 2012-2025 家電庫 版權(quán)所有 京ICP備20132067號-1
第二十屆中國IDC產(chǎn)業(yè)年度大典(IDCC2025)暨數(shù)字基礎(chǔ)設(shè)施科技展(DITExpo) 以“重塑算力 破界而生”為主題,將于2025年12月10-11日在北京首鋼國際會展中心1號館舉辦。歡迎報名參會,與數(shù)萬算力產(chǎn)業(yè)從業(yè)者深入探討產(chǎn)業(yè)關(guān)鍵領(lǐng)域的技術(shù)突破與商業(yè)模式創(chuàng)新。
立即報名!
當(dāng)大模型參數(shù)從百億躍升至萬億,算力底座的“軍備競賽”也隨之進入“萬卡集群”時代。從OpenAI的GPT-4,到國內(nèi)“百模大戰(zhàn)”的跟進,“萬卡”已成為AI巨頭入場券的代名詞。然而,當(dāng)我們談?wù)?ldquo;萬卡”時,如果視線仍局限于機柜功率的提升和液冷技術(shù)的引入,那可能尚未觸及其變革的真正核心。
這場由AI驅(qū)動的算力變革,正從根本上重塑數(shù)據(jù)中心產(chǎn)業(yè)。它帶來的挑戰(zhàn)遠非“更高、更快、更強”的線性迭代,而是一場關(guān)乎設(shè)計邏輯、系統(tǒng)架構(gòu)和交付模式的“質(zhì)變”。“萬卡”集群,正在倒逼數(shù)據(jù)中心從“房地產(chǎn)”模式向“超級計算機”模式進化。
01. 建設(shè)邏輯顛覆:從“機房遷就IT”到“IT定義機房”
長久以來,傳統(tǒng)數(shù)據(jù)中心的建設(shè)邏輯遵循一種“房東與租戶”的模式。即“基建先行”,先建設(shè)一個標(biāo)準(zhǔn)化的“白色空間”(White Space),包含標(biāo)準(zhǔn)化的供配電、制冷和網(wǎng)絡(luò)布線,然后再由不同的IT設(shè)備“拎包入住”。這種模式的優(yōu)勢在于通用性和靈活性,可以適配不同客戶的通用計算需求。
然而,萬卡AI集群的出現(xiàn),徹底打破了這一延續(xù)數(shù)十年的平衡。AI集群,特別是萬卡規(guī)模的GPU集群,是一個極端“挑剔”的租戶。它不是由成千上萬個獨立的服務(wù)器組成,而是一個被設(shè)計為“單一系統(tǒng)”(Single System Image)的“超級計算機”。它的需求不再是標(biāo)準(zhǔn)化的機架和冷風(fēng),而是對系統(tǒng)架構(gòu)、網(wǎng)絡(luò)拓?fù)浜凸挠兄鴺O端定制化、高耦合度的要求。
這就帶來了一個根本性的轉(zhuǎn)變:建設(shè)邏輯從“機房遷就IT”逆轉(zhuǎn)為“IT定義機房”。
在萬卡集群的規(guī)劃中,一切都必須從IT系統(tǒng)本身出發(fā)。設(shè)計不再始于建筑圖紙,而是始于AI集群的架構(gòu)圖。例如,以NVIDIA的DGX SuperPOD架構(gòu)為藍本的集群,其設(shè)計之初就已經(jīng)鎖定了GPU服務(wù)器的型號、InfiniBand網(wǎng)絡(luò)交換機的布局、光纖的連接方式,乃至每個機柜高達60kW甚至100kW以上的峰值功耗。
這意味著,數(shù)據(jù)中心的土建、暖通和電氣設(shè)計,從一開始就必須完全服務(wù)于這個既定的IT架構(gòu)。傳統(tǒng)M&E(機電)工程師“按經(jīng)驗”預(yù)留冗余和通路的做法已經(jīng)失效。他們必須與IT架構(gòu)師、網(wǎng)絡(luò)工程師坐在一起,精確計算液冷管路的走向、配電單元(PDU)的精確點位,以及如何處理高密度光纖帶來的物理管理噩夢。這不再是“建筑設(shè)計”,而是“系統(tǒng)工程”。