IEEE慶祝802.3標(biāo)準(zhǔn)發(fā)布30周年,邁向令人鼓舞的新方向
得益于羅伯特·梅特卡夫(1973年以太網(wǎng)標(biāo)準(zhǔn)的發(fā)明者),IEEE以太網(wǎng)802.3 標(biāo)準(zhǔn)協(xié)會(huì)召開11月全體會(huì)議,慶祝他們30年來為以太網(wǎng)標(biāo)準(zhǔn)所做的與時(shí)俱進(jìn)的工作。梅特卡夫博士和以太網(wǎng)標(biāo)準(zhǔn)協(xié)會(huì)的同事們回顧過去,并詳細(xì)闡明了未來車聯(lián)網(wǎng)的遠(yuǎn)景。這個(gè)不會(huì)很快實(shí)現(xiàn),但是將會(huì)產(chǎn)生很大流量。1GbE 用于雙絞銅線(P802.3bp)研究小組、PoDL研究小組(power over data lines)、P802.3br PAR 研究小組(Interspersing Express Traffic)將會(huì)是實(shí)現(xiàn)車內(nèi)和車輛之間網(wǎng)絡(luò)革命的生力軍。為什么LightCounting的客戶需要關(guān)注?400GbE研究小組的一個(gè)演講告訴我們到2023年,只在北美一個(gè)地區(qū),就有240Tbps的流量要加到核心網(wǎng)中去,使8000萬的聯(lián)網(wǎng)車輛可以互相交流。(即使你的車由計(jì)算機(jī)聯(lián)網(wǎng),我們希望車主們坐在那里要集中精力!)光核心網(wǎng)絡(luò)是增長(zhǎng)最快的市場(chǎng)。LightCounting一直在關(guān)注這個(gè)市場(chǎng)。在LC預(yù)測(cè)報(bào)告附帶數(shù)據(jù)庫的預(yù)覽版里有詳細(xì)介紹。這個(gè)預(yù)測(cè)報(bào)告數(shù)據(jù)庫預(yù)覽版將于12月17日發(fā)布。
我們提到400GbE了嗎?100G 交換機(jī)還沒有問世,我們是否太超前了?400GbE研究小組的175位專家不同意這個(gè)觀點(diǎn)。超級(jí)數(shù)據(jù)中心的建造者們、電信公司和其他運(yùn)營(yíng)商(如廣電網(wǎng))想把400G解決方案用于路由器到路由器和路由器到核心網(wǎng)的鏈路上。LightCounting欣然用實(shí)際部署的數(shù)據(jù)支持了他們的演講。
步驟一:400GbE研究小組決定他們想要什么樣的標(biāo)準(zhǔn)。達(dá)成一致意見。這個(gè)研究小組共選取了四個(gè)目標(biāo):在多模光纖100m鏈路上、在單模光纖500m、2公里和10公里鏈路上運(yùn)行400GbE。400G用于電纜的目標(biāo)沒有得到足夠的投票,但是現(xiàn)在為時(shí)還早,這種情形會(huì)變化的。LightCounting在之前的臨時(shí)特別會(huì)議中提出:一個(gè)服務(wù)器上有1個(gè)10GibE端口。4個(gè)服務(wù)器可以一同接入路由器的1個(gè)40GibE的端口。這個(gè)研究小組的很多討論圍繞是否要支持這種分離功能。最終分離功能沒有采納。而另外一個(gè)要求被采納:在這更高速率上需要更低的比特誤碼率:10-13來避免頻繁出錯(cuò)。
步驟二:這個(gè)研究小組須展現(xiàn)的第二件事是證明使用未來目標(biāo)的產(chǎn)品要滿足以下五個(gè)條件:有足夠客戶、跨廠商兼容性、獨(dú)特ID、技術(shù)上可以實(shí)現(xiàn)且在一個(gè)合理的成本范圍內(nèi)。有很多工作需要做。這個(gè)研究小組轉(zhuǎn)變成工作小組的最早時(shí)間是五月份。當(dāng)他們開始編寫標(biāo)準(zhǔn)的時(shí)候,那才是有很多挑戰(zhàn)的時(shí)刻。我們將用16 個(gè)通道每個(gè)通道傳輸25G帶寬來實(shí)現(xiàn)400G傳輸,還是使用8個(gè)通道,每個(gè)通道50G帶寬來實(shí)現(xiàn)?抑或是簡(jiǎn)單地把4個(gè)100G帶寬結(jié)合在一起,就像之前的40GigE網(wǎng)絡(luò)那樣(把4個(gè)10GigE帶寬結(jié)合起來達(dá)到40G傳輸)這個(gè)研究小組是否最后使用一次 WDM NRZ 還是現(xiàn)在是應(yīng)該跳到更先進(jìn)調(diào)制?LightCounting認(rèn)為在未來的研究小組會(huì)議上有很多新的技術(shù)觀點(diǎn)和爭(zhēng)論。所以,敬請(qǐng)留意!
超級(jí)計(jì)算展會(huì)強(qiáng)調(diào)速度、密度和省電
超級(jí)計(jì)算機(jī)展會(huì)2013 匯聚11000人,關(guān)注在高性能計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)和數(shù)據(jù)分析的最新進(jìn)展。高性能計(jì)算HPC已經(jīng)不再是關(guān)于科學(xué)模擬的運(yùn)算能力了。大數(shù)據(jù)分析和云計(jì)算與HPC融合?,F(xiàn)在比以前有更多不同的架構(gòu)。
Infiniband 經(jīng)常被HPC互聯(lián)使用。AOC是長(zhǎng)距離InfiniBand連接的實(shí)現(xiàn)形式。很多超級(jí)計(jì)算2013展商都展示和詮釋了他們的這些產(chǎn)品。然而超性能計(jì)算機(jī)能做的更重要的事情是低延遲,且多個(gè)處理器可以共享同一個(gè)內(nèi)存(Remote Direct Memory Access)。所以云計(jì)算公司在考慮使用RoCE (RDMA over Converged Ethernet)以便可以待在以太網(wǎng)系統(tǒng)中。不管使用這兩種方式中的哪一種, AOC將是HPC系統(tǒng)中以這些協(xié)議方式傳輸信號(hào)的性價(jià)比高和便利的一種方式。
HPC的另外的新功能是處理器和互連的高密度。由于交換機(jī)供應(yīng)商在其面板上安裝了QSFP+模塊,所以其面板上已經(jīng)沒有多少空間。 EOM是一個(gè)解決方案。Arista Networks的創(chuàng)始人Andy Bechtolsheim給LightCounting展示了他們新100GbE線卡,在面板端有12個(gè)MPO連接器,另一端是Finisar提供的EOM。這些是12X10G 的連接器,可以在連接器界面分成多路。
專有互連需要最高速度和寬度。Cray 展示了他們的新XC30超級(jí)計(jì)算機(jī),在其面板上有120個(gè)CXP端口,其主板由多個(gè)12x12.5G AOC連接。Fujitsu 展示了他們下一代超級(jí)計(jì)算機(jī)主板,使用8個(gè)Finisar 新款12x25F EOMs(Finisar 稱其BOAs), 與 三個(gè)Sparc64 處理器協(xié)同工作。
Samtec的客戶對(duì)他們的FireFly 互連系統(tǒng)很感興趣。當(dāng)你嵌入FireFly 互連系統(tǒng)時(shí),可以選擇使用銅線鏈路或光鏈路。這個(gè)鏈路使用一個(gè)普通連接器器,插入主板。12x28G 銅線鏈路的傳輸距離是13”,或者以每通道以14G的速度,傳輸是0.5m。 FireFly EOM,以14G的速度,可以延長(zhǎng)傳輸距離到100m。
一些更新的方法確實(shí)使布線降低到最少。Clustered Systems Company 演示了一個(gè)高密度機(jī)架,通過PCI-Express ,將高達(dá)260個(gè)的Intel Xeon 處理器與一個(gè)正交銅線背板連接。若是需要,將會(huì)使用InfiniBand來連接多個(gè)機(jī)架。Numascale 有一種技術(shù),可以用不長(zhǎng)于1.5米的線,來連接216個(gè)服務(wù)器(10,000核),每個(gè)服務(wù)器的內(nèi)存是240GB。這個(gè)共享內(nèi)存結(jié)構(gòu)的意思是單個(gè)Linux程序的實(shí)例能以虛擬的形式查看所有可用的服務(wù)器和所有內(nèi)存,沒有間斷。
最后,Intel 告訴我們他們打算把以太網(wǎng)網(wǎng)卡和Infiniband卡整合到下一代Xeon 服務(wù)器 和 Xeon Phi協(xié)處理器中。10GbE 將會(huì)明年整合進(jìn)去。下一代InfiniBand卡會(huì)在2015年及以后的時(shí)間整合進(jìn)去。將要推出的Xeon Phi 協(xié)處理器,也叫做Knights Landing,將要使用Cray HPC 互連控制器,它有100Gbps網(wǎng)絡(luò)互連規(guī)格 和32個(gè)第三代PCI-Express通道。