ICC訊 華為全聯(lián)接大會(huì)2024期間,在“加速F5G-A,共贏行業(yè)智能化”峰會(huì)上,華為重磅發(fā)布數(shù)據(jù)中心全光交換機(jī)Huawei OptiXtrans DC808,打造面向AI的新一代光電融合智算DCN 網(wǎng)絡(luò)(Data Center Network,數(shù)據(jù)中心網(wǎng)絡(luò))。
華為數(shù)據(jù)中心全光交換機(jī)Huawei OptiXtrans DC808
隨著大模型參數(shù)規(guī)模不斷增長,對智算算力提出更高要求,智算集群規(guī)模不斷擴(kuò)大,傳統(tǒng)的交換機(jī)組網(wǎng)在組網(wǎng)規(guī)模、擴(kuò)展性、可用率、功耗等方面存在多項(xiàng)挑戰(zhàn)。
第一,擴(kuò)展困難。智算集群需要提前明確規(guī)模,鎖定堆疊層級和架構(gòu),按照規(guī)劃一次性部署,每次算力擴(kuò)展都需要對數(shù)據(jù)中心網(wǎng)絡(luò)進(jìn)行重新組網(wǎng),調(diào)整端口連接和路由關(guān)系,不僅調(diào)整周期長、成本高,而且在重構(gòu)過程會(huì)中斷集群訓(xùn)練,算力隱形損失大,缺乏有效的集群網(wǎng)絡(luò)擴(kuò)展手段。
第二,光模塊易失效。光模塊長時(shí)間運(yùn)行會(huì)失效,據(jù)統(tǒng)計(jì)萬卡集群每年因光模塊失效影響訓(xùn)練任務(wù)超過100次以上,嚴(yán)重影響集群可用時(shí)間。
第三,演進(jìn)升級困難。已部署的交換機(jī)受架構(gòu)制約端口速率固定,無法平滑升級支持更高速率,引入更先進(jìn)智算算力時(shí),需要替換為更高速交換機(jī)。
華為創(chuàng)新性地將全光交叉(OXC)技術(shù)引入到數(shù)據(jù)中心網(wǎng)絡(luò),推出業(yè)界領(lǐng)先的數(shù)據(jù)中心全光交換機(jī)Huawei OptiXtrans DC808,打造面向AI的新一代光電融合智算DCN網(wǎng)絡(luò)。該全光交換機(jī)支持256*256無阻塞全光交換,超高集成度(6U高)、超低功耗(整機(jī)小于200W)、超高可靠(電信級可靠性),帶來四大價(jià)值:
大規(guī)模彈性組網(wǎng):全光交換機(jī)端口密度高,耗電超低,智算集群組網(wǎng)可基于中長期規(guī)劃的目標(biāo)組網(wǎng),按POD顆粒度分期建設(shè);支持算力資源分鐘級靈活分割和租售;靈活可變拓?fù)?,提升?jì)算集群算效。
超高可靠:全光交換機(jī)無需光模塊,有效減少整網(wǎng)光模塊的總數(shù)量,DCN網(wǎng)絡(luò)因光模塊失效導(dǎo)致的故障率降低20%。
平滑演進(jìn):基于全光交換,不感知下聯(lián)交換機(jī)的端口速率和協(xié)議,支持從400G、800G甚至更高速率平滑演進(jìn),無須更換全光交換機(jī);支持DCN網(wǎng)絡(luò)跨代際復(fù)用,多代速率在統(tǒng)一架構(gòu)中融合,穩(wěn)定DCN網(wǎng)絡(luò)架構(gòu),降低投資成本。
綠色節(jié)能:采用全光交換,省掉傳統(tǒng)交換機(jī)的光電轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)發(fā)過程,以400G端口為例,相比傳統(tǒng)交換機(jī)功耗降低98%,整網(wǎng)能耗降低20%。
華為數(shù)據(jù)中心全光交換機(jī)預(yù)計(jì)將于2025年正式商用,助力智算集群網(wǎng)絡(luò)規(guī)模和效率提升,以光強(qiáng)算,為AI時(shí)代數(shù)據(jù)中心發(fā)展提供新質(zhì)生產(chǎn)力。