用戶(hù)名: 密碼: 驗(yàn)證碼:

AIGC引爆數(shù)據(jù)洪流,云服務(wù)商跑步進(jìn)入800G以太網(wǎng)時(shí)代

摘要:AIGC產(chǎn)業(yè)的爆發(fā)進(jìn)一步帶動(dòng)了800G以太網(wǎng)的需求。通過(guò)引入全新的MAC和PCS,800G以太網(wǎng)找到了當(dāng)前最經(jīng)濟(jì)理想的實(shí)現(xiàn)方案——8通道112G SerDes或PHY技術(shù)。不過(guò),要把800G SR8方案系統(tǒng)框圖兌現(xiàn)到具體的800G芯片中,依然面臨著性能、功耗、面積和信號(hào)完整性等多方面的挑戰(zhàn),幫助大家克服這些挑戰(zhàn),便是新思科技112G以太網(wǎng)PHY IP和以太網(wǎng)VIP的價(jià)值所在。

  數(shù)日前,SimilarWeb更新了一份關(guān)于聊天機(jī)器人ChatGPT訪(fǎng)問(wèn)數(shù)的數(shù)據(jù)統(tǒng)計(jì)。數(shù)據(jù)顯示,2023年4月ChatGPT訪(fǎng)問(wèn)量再創(chuàng)新高,已經(jīng)超過(guò)了必應(yīng)、DuckDuckGo等其他國(guó)際搜索引擎,也超越了紐約時(shí)報(bào)和CNN等知名網(wǎng)站;目前ChatGPT訪(fǎng)問(wèn)數(shù)已經(jīng)達(dá)到百度搜索引擎的60%,谷歌搜索引擎的2%。

  圖1:ChatGPT訪(fǎng)問(wèn)數(shù)據(jù)統(tǒng)計(jì)(圖源:SimilarWeb)

  當(dāng)然,不光是ChatGPT,近一段時(shí)間以來(lái),全球科技巨頭紛紛發(fā)布自己的大模型。北京時(shí)間5月11日,谷歌宣布推出最新大型語(yǔ)言模型PaLM 2,在部分任務(wù)上已經(jīng)超越GPT-4;在中國(guó)市場(chǎng),百度、360、阿里、華為、京東、騰訊等也都紛紛推出了自己的AI大模型。

  訪(fǎng)問(wèn)量陡增的ChatGPT,加上紛至沓來(lái)的AI大模型,AIGC(人工智能生成內(nèi)容)產(chǎn)業(yè)不僅帶來(lái)檢索效率和工作效率的提升,同時(shí)由于大模型需要大量的數(shù)據(jù)和算力進(jìn)行訓(xùn)練和運(yùn)行,并在使用過(guò)程中產(chǎn)生大量新的數(shù)據(jù),因此對(duì)底層基礎(chǔ)設(shè)備提出了更高的要求。

  在數(shù)據(jù)傳輸方面,光通信行業(yè)市場(chǎng)調(diào)研機(jī)構(gòu)Lightcounting曾在2021年時(shí)預(yù)測(cè),800G光模塊將從2025年底開(kāi)始主導(dǎo)市場(chǎng)。如今,在GPT等大模型的帶動(dòng)下,這一節(jié)奏明顯提前。市場(chǎng)消息顯示,目前已經(jīng)有云服務(wù)廠(chǎng)商開(kāi)始集中測(cè)試和采購(gòu)800G光模塊,相關(guān)需求將在2023年下半年開(kāi)始集中爆發(fā)。

  800G以太網(wǎng)需求提前爆發(fā)

  為什么頭部云服務(wù)商如此重視800G以太網(wǎng)用以數(shù)據(jù)傳輸呢?

  最直接的回答就是:為了應(yīng)對(duì)數(shù)據(jù)大爆炸。就以AI大模型訓(xùn)練而言,公開(kāi)數(shù)據(jù)顯示,從GPT-1到GPT-3,模型的參數(shù)量從1.1億個(gè)增長(zhǎng)到了1750億個(gè)。有傳言稱(chēng),GPT-4模型的參數(shù)達(dá)到5000億個(gè),甚至可能超過(guò)萬(wàn)億規(guī)模。根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)TrendForce的數(shù)據(jù),如果以英偉達(dá)A100顯卡的處理能力計(jì)算,GPT-3.5大模型需要2萬(wàn)塊GPU來(lái)處理訓(xùn)練數(shù)據(jù)。

  因此,在算力集群的超算中心里,先進(jìn)芯片和先進(jìn)算力之間并不是劃等號(hào)的,算力芯片只是提供了算力,而要高效利用算力還需要依賴(lài)光模塊、存儲(chǔ)等芯片的支持。

  如下圖所示,這是中國(guó)移動(dòng)在《算力網(wǎng)絡(luò)白皮書(shū)(2021年版)》中分享的一張算力網(wǎng)絡(luò)體系架構(gòu)。在這個(gè)結(jié)構(gòu)中,中國(guó)移動(dòng)將其分為算網(wǎng)底座、算網(wǎng)大腦、算網(wǎng)運(yùn)營(yíng)三個(gè)部分,其中在算網(wǎng)底座這部分,全光底座是行業(yè)的共識(shí)。因此,先進(jìn)算力實(shí)際上是遵循“木桶效應(yīng)”的,算力、存儲(chǔ)和網(wǎng)絡(luò)傳輸三大核心環(huán)節(jié),一個(gè)出現(xiàn)短板,整個(gè)系統(tǒng)的性能就會(huì)出現(xiàn)巨大的下滑,這便是為什么云服務(wù)商積極部署800G以太網(wǎng)光模塊的原因。

  圖2:先進(jìn)算力網(wǎng)絡(luò)框圖(圖源:中國(guó)移動(dòng))

  目前,已經(jīng)有多家方案商表示已經(jīng)完成800G光模塊送樣量產(chǎn)。供需大幅度提前讓LightCounting修改了自己在2022年的預(yù)測(cè),該機(jī)構(gòu)在今年3月份最新預(yù)測(cè)中表示,雖然今年整個(gè)以太網(wǎng)光模塊市場(chǎng)將出現(xiàn)10%的下滑,但是800G光模塊市場(chǎng)將在2023年維持高速增長(zhǎng)。

  當(dāng)然,不光是800G光模塊,在交換機(jī)芯片和交換機(jī)整機(jī)方面,產(chǎn)業(yè)也是快速跟進(jìn)。2022年8月,博通正式發(fā)布自己的Tomahawk 51.2 Tbps交換機(jī)芯片;在2022年OCP全球峰會(huì)上,思科發(fā)布了兩款新的800G交換機(jī)系列——Nexus 9232E和8111交換機(jī),以及帶有100G和400G接口的800G光模塊。如下圖所示,過(guò)去12年里,交換機(jī)的交換能力已經(jīng)從640G發(fā)展到102.4T。

圖3:交換機(jī)容量擴(kuò)張年表

  800G以太網(wǎng)的優(yōu)勢(shì)

  當(dāng)前,芯片廠(chǎng)商如博通等,設(shè)備廠(chǎng)商如思科等,云服務(wù)商如亞馬遜等,圍繞著高性能計(jì)算、5G和深度學(xué)習(xí)等產(chǎn)業(yè)積極向800G以太網(wǎng)過(guò)渡。

  對(duì)于高性能計(jì)算和深度學(xué)習(xí)訓(xùn)練等領(lǐng)域而言,800G以太網(wǎng)具有兩大突出的賦能價(jià)值。其一是在同等算力規(guī)模下,800G以太網(wǎng)能夠帶來(lái)倍增的計(jì)算效率。通過(guò)以太網(wǎng)技術(shù)聯(lián)盟發(fā)布的800GBASE-R規(guī)范可以看出,800G以太網(wǎng)是400G的延伸和擴(kuò)展,最直觀的改變是帶寬是此前400G以太網(wǎng)的兩倍。如下圖所示,端到端的以太網(wǎng)通信實(shí)際上可以抽象為這種連接,如果交換機(jī)全部端口從400G升級(jí)到800G,那么交換機(jī)傳輸容量將直接翻倍。

圖4:端到端800G以太網(wǎng)實(shí)施用例

  其二是能夠進(jìn)行更大規(guī)模的算力集群。我們都知道,算力網(wǎng)絡(luò)最底層的算力底座一般會(huì)分為算力基礎(chǔ)設(shè)施和網(wǎng)絡(luò)基礎(chǔ)設(shè)施,兩者融合使得目前的數(shù)據(jù)中心和算力中心呈現(xiàn)出一種類(lèi)似葉脊的架構(gòu)。結(jié)合下圖來(lái)看,這是Facebook構(gòu)建的樹(shù)形數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu),名為data center fabric網(wǎng)絡(luò)架構(gòu),里面的連接無(wú)處不在。

  圖5:4層data center fabric網(wǎng)絡(luò)架構(gòu)(圖源:Facebook)

  從上圖的上方不難看出,data center fabric網(wǎng)絡(luò)架構(gòu)是一個(gè)四層結(jié)構(gòu),也被成為“F4結(jié)構(gòu)”。不過(guò),F(xiàn)acebook在2019年已經(jīng)將其升級(jí)為“F16結(jié)構(gòu)”,原因是數(shù)據(jù)暴漲和設(shè)備更新讓“F4結(jié)構(gòu)”已經(jīng)難以適應(yīng)。

  參考下圖來(lái)看,“F16結(jié)構(gòu)”明顯是更大規(guī)模的算力集群,連接數(shù)量和服務(wù)器數(shù)量都更多。預(yù)計(jì)這個(gè)結(jié)構(gòu)很快也會(huì)更新,因?yàn)樵?019年Facebook認(rèn)為400G并不成熟,所以只支持了100G以太網(wǎng),如今800G已經(jīng)步入商用,這個(gè)集群規(guī)模顯然太小了。

  圖6:16層data center fabric網(wǎng)絡(luò)架構(gòu)(圖源:Facebook)

  800G以太網(wǎng)的部署挑戰(zhàn)

  在具體實(shí)現(xiàn)的過(guò)程中,800GBASE-R規(guī)范并非是簡(jiǎn)單地將兩個(gè)400G拼接在一起,而是引入了新的介質(zhì)訪(fǎng)問(wèn)控制(MAC)和物理編碼子層(PCS),能夠以最小的成本實(shí)現(xiàn)800G。由于新的PCS包含對(duì)之前PCS的重用,因此保留了標(biāo)準(zhǔn)RS(544, 514)前向糾錯(cuò),并提供了很好的向后兼容特性。

  下圖是800G Pluggable MSA工作組在《800G MSA白皮書(shū)》中給出的示意圖,這是一種能夠快速上市的800G實(shí)現(xiàn)方案,通過(guò)重新調(diào)整兩個(gè)400G的PMA,進(jìn)而得到一個(gè)800G的PMA,再定義一個(gè)低成本的800G的PMD,最終實(shí)現(xiàn)基于8通道100Gb/s技術(shù)的800G以太網(wǎng)。

  圖7:800G SR8方案系統(tǒng)框圖(圖源:MSA)

  當(dāng)然,為了繼續(xù)向1.6T以太網(wǎng)進(jìn)化,MSA工作組在白皮書(shū)中指出,后續(xù)800G會(huì)通過(guò)每通道200G PAM4技術(shù)進(jìn)行優(yōu)化,并且DSP芯片會(huì)采用更先進(jìn)的工藝制程,因此這是一種更加低功耗、低延遲的解決方案。不過(guò),如MSA工作組所言,這種實(shí)現(xiàn)方式實(shí)際上是為了從800G向1.6T過(guò)渡,是一種未來(lái)式的實(shí)現(xiàn)方式。

  圖8:800G FR4方案框圖(圖源:MSA)

  雖然系統(tǒng)框圖都已經(jīng)很清晰,不過(guò)要完成800G交換芯片的設(shè)計(jì)還是會(huì)遇到很多挑戰(zhàn)。

  首先,第一個(gè)顯著的問(wèn)題是,800G并不是簡(jiǎn)單的兩個(gè)400G疊加,那么MAC、PCS和PMA被集成之后,如何保證整個(gè)系統(tǒng)能夠?qū)崿F(xiàn)最佳的性能和延遲。

  下圖展示的是一個(gè)800G芯片的設(shè)計(jì)框圖,對(duì)于這款芯片而言,信號(hào)完整性、電源完整性等方面的測(cè)試只是基礎(chǔ),重點(diǎn)是如何系統(tǒng)性?xún)?yōu)化beachfront、SerDes、PCS和MAC這些塊分區(qū)。如果是在交換機(jī)芯片研發(fā)設(shè)計(jì)的過(guò)程中,又會(huì)分為單裸片方案、雙裸片方案和Chiplet三個(gè)不同的類(lèi)型,需要考慮的因素都不同。比如在Chiplet配置方式里,需要考慮如何更好地進(jìn)行模塊劃分,如何進(jìn)行參考時(shí)鐘布線(xiàn)等。

  圖9:具有8通道100G Serdes的800G芯片示例圖

  為了保證在各種實(shí)現(xiàn)方式中,整個(gè)芯片的信號(hào)一致性和低延遲,就需要一種高效的FEC,用以補(bǔ)償更快傳輸速度下必然伴隨的更高錯(cuò)誤率。

  第二個(gè)挑戰(zhàn)是芯片功耗和面積難題。目前800G芯片采用的是112G SerDes或PHY技術(shù),進(jìn)而打造成一款并行處理能力強(qiáng)和時(shí)鐘速度快的硬件。雖然采用先進(jìn)制程,不過(guò)為了保證良率,芯片面積不能過(guò)小。然而,在交換機(jī)中,器件的集成度只會(huì)越來(lái)越高,因此合適的芯片尺寸是一個(gè)非常值得考究的問(wèn)題;另外,高速芯片必然伴隨功耗問(wèn)題,如果功耗過(guò)高就需要在交換機(jī)中加入額外的、昂貴的冷卻系統(tǒng)。

  第三個(gè)挑戰(zhàn)也來(lái)自112G SerDes或PHY技術(shù),那就是如何做到更好的跨信道傳輸。為了讓各個(gè)112G SerDes或PHY之間具有最小的串?dāng)_(xtalk)影響,在芯片實(shí)現(xiàn)的過(guò)程中往往會(huì)采用增加封裝層數(shù),以滿(mǎn)足高速SerDes或PHY串?dāng)_規(guī)格,這必然會(huì)帶來(lái)更高的成本挑戰(zhàn)。同時(shí),多層封裝也需要考慮南北(N/S)、東西(E/W)方向進(jìn)行封裝出線(xiàn)的問(wèn)題。

  因此,如果要打造一款高性能的800G芯片,就需要擁有用于優(yōu)化beachfront、SerDes、PCS和MAC設(shè)計(jì)的專(zhuān)業(yè)知識(shí),同時(shí)對(duì)時(shí)鐘布線(xiàn)、封裝出線(xiàn)和Chiplet等有深刻的認(rèn)識(shí)。如此,才能夠打造出一顆完美的800G芯片。

  新思科技800G以太網(wǎng)方案

  看到了挑戰(zhàn)和要求,可能對(duì)一些想要從事800G以太網(wǎng)芯片研究的人進(jìn)行了勸退。為了幫助大家應(yīng)對(duì)這些挑戰(zhàn),新思科技提供了業(yè)界唯一完整的200G/400G/800G以太網(wǎng)IP解決方案。

  作為全球以太網(wǎng)IP開(kāi)發(fā)的領(lǐng)航者,新思科技能夠?yàn)闃I(yè)界提供經(jīng)過(guò)硅驗(yàn)證的800G以太網(wǎng)IP方案。我們上面提到,800G是基于112G SerDes或PHY技術(shù)進(jìn)行實(shí)現(xiàn)。新思科技112G以太網(wǎng)PHY IP解決方案可實(shí)現(xiàn)真正的長(zhǎng)距離、中距離、極短距離和超短距離(LR、MR、VSR、XSR)接口,以及CEI-112G-Linear和CEI-112G-XSR+光接口,是支持實(shí)現(xiàn)800G光模塊和800G交換機(jī)的理想方案。

  早在2021年1月,新思科技就已經(jīng)推出經(jīng)過(guò)硅驗(yàn)證的采用5納米FinFET工藝的112G以太網(wǎng)PHY IP,提供超出IEEE 802.3ck和OIF標(biāo)準(zhǔn)電氣規(guī)范的卓越信號(hào)完整性和電氣性能。研發(fā)人員借助這款PHY IP能實(shí)現(xiàn)高集成度的800G以太網(wǎng)芯片,擁有顯著的性能、面積和功耗優(yōu)勢(shì)。這款I(lǐng)P主要用于長(zhǎng)距離和中距離接口,能夠在大于45dB的信道中以低于5pJ/bit實(shí)現(xiàn)出色的BER(誤碼率)。

  另外,用于極短距離接口的新思科技112G以太網(wǎng)PHY可以在大于20dB的信道中以低于3pJ/bit的速度實(shí)現(xiàn)出色的BER;用于超短距離接口的新思科技112G以太網(wǎng)PHY可以在大于10dB的信道中以低于1.4pJ/bit實(shí)現(xiàn)出色的BER。

  這些PHY IP全部都支持在芯片的四個(gè)邊緣進(jìn)行布局和堆疊,最大限度地提高每個(gè)芯片邊緣的帶寬。它們都支持脈沖幅度調(diào)制4級(jí)(PAM-4)、不歸零(NRZ)信號(hào)和獨(dú)立的每通道數(shù)據(jù)速率,并以極高的靈活性支持PCI Express®、DDR、HBM、Die-to-Die、CXL和CCIX等廣泛的連接協(xié)議。

  為了使研發(fā)人員能夠加速基于以太網(wǎng)設(shè)計(jì)的驗(yàn)證收斂,新思科技還推出了用于以太網(wǎng)的VC VIP,提供一套全面的協(xié)議、方法、驗(yàn)證和生產(chǎn)力功能。

圖10:新思科技以太網(wǎng)VIP

  通過(guò)這些IP和VIP,再結(jié)合新思科技在路由可行性研究、封裝基板指南、信號(hào)和電源完整性模型以及串?dāng)_分析等方面的全面經(jīng)驗(yàn),研發(fā)人員可實(shí)現(xiàn)高速可靠的800G芯片開(kāi)發(fā)。

  當(dāng)然,在此還需要額外提到,新思科技112G以太網(wǎng)PHY是該公司廣泛的IP產(chǎn)品組合中的一部分,新思IP產(chǎn)品組合包括邏輯庫(kù)、嵌入式存儲(chǔ)器、嵌入式測(cè)試、模擬IP、有線(xiàn)和無(wú)線(xiàn)接口IP、安全I(xiàn)P、嵌入式處理器和子系統(tǒng),對(duì)高性能HPC應(yīng)用進(jìn)行全方位的賦能。

  結(jié)語(yǔ)

  AIGC產(chǎn)業(yè)的爆發(fā)進(jìn)一步帶動(dòng)了800G以太網(wǎng)的需求。通過(guò)引入全新的MAC和PCS,800G以太網(wǎng)找到了當(dāng)前最經(jīng)濟(jì)理想的實(shí)現(xiàn)方案——8通道112G SerDes或PHY技術(shù)。不過(guò),要把800G SR8方案系統(tǒng)框圖兌現(xiàn)到具體的800G芯片中,依然面臨著性能、功耗、面積和信號(hào)完整性等多方面的挑戰(zhàn),幫助大家克服這些挑戰(zhàn),便是新思科技112G以太網(wǎng)PHY IP和以太網(wǎng)VIP的價(jià)值所在。

【加入收藏夾】  【推薦給好友】 
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話(huà):0755-82960080-168   Right