ICCSZ訊 “更高帶寬,更高性能”,一直以來(lái)都是網(wǎng)絡(luò)領(lǐng)域的不懈追求。如今,隨著云計(jì)算、大數(shù)據(jù)、移動(dòng)化等新一代IT技術(shù)的應(yīng)用帶來(lái)了數(shù)據(jù)量的海量增長(zhǎng),以及用戶對(duì)體驗(yàn)的關(guān)注,這一目標(biāo)顯得更為緊迫和現(xiàn)實(shí)。比如,NVIDIA(英偉達(dá))最新推出的深度學(xué)習(xí)一體機(jī)對(duì)網(wǎng)絡(luò)帶寬和性能的要求已經(jīng)達(dá)到了新的高度,標(biāo)配就有4片100G的網(wǎng)卡。
其實(shí),網(wǎng)絡(luò)領(lǐng)域也一直在不斷創(chuàng)新,努力提升網(wǎng)絡(luò)產(chǎn)品的性能和帶寬,“卸載”(即將傳統(tǒng)由CPU處理的部分工作轉(zhuǎn)移到網(wǎng)絡(luò)設(shè)備進(jìn)行)就是其中的技術(shù)之一。Mellanox就是這一技術(shù)的主要倡導(dǎo)者和實(shí)踐者,正是基于這一創(chuàng)新技術(shù),Mellanox不斷推出新一代更高性能的網(wǎng)絡(luò)產(chǎn)品。日前Mellanox全球市場(chǎng)部副總裁 Gilad Shainer在接受記者采訪時(shí)表示,明年Mellanox將推出200Gb/s的InfiniBand和以太網(wǎng)交換機(jī),這也是業(yè)界首次推出如此高速的網(wǎng)絡(luò)設(shè)備。此舉無(wú)疑會(huì)又一次推動(dòng)網(wǎng)絡(luò)傳輸能力的升級(jí)。
Mellanox全球市場(chǎng)部副總裁 Gilad Shainer
加速網(wǎng)絡(luò)互連
提到Mellanox,在HPC領(lǐng)域幾乎無(wú)人不知。Mellanox成名于HPC,從其2001年推出一代InfiniBand產(chǎn)品以來(lái),一直是InfiniBand市場(chǎng)的領(lǐng)導(dǎo)者。在最近一期的全球超級(jí)計(jì)算機(jī)500強(qiáng)(TOP500)榜單上,前500套HPC中有39%(194套系統(tǒng))采用了Mellanox的InfiniBand產(chǎn)品。如果以其中真正用于超級(jí)計(jì)算的設(shè)備來(lái)計(jì)算,占比會(huì)更高,達(dá)到65%。
“在HPC市場(chǎng)InfiniBand占有絕對(duì)的優(yōu)勢(shì)。在排名最靠前的這些系統(tǒng),比如千萬(wàn)億次的系統(tǒng)中,我們占據(jù)了近一半的市場(chǎng)份額,這充分了Mellanox在高性能計(jì)算系統(tǒng)里面的實(shí)力。”Gilad Shainer說(shuō)。
Gilad Shainer介紹說(shuō)有可能問(wèn)鼎2018年TOP500第一的美國(guó)“Coral珊瑚”系統(tǒng)也會(huì)采用Mellanox InfiniBand。
當(dāng)然,InfiniBand并不是Mellanox發(fā)力的唯一領(lǐng)域。除了InfiniBand之外,在以太網(wǎng)領(lǐng)域,Mellanox同樣成績(jī)斐然,尤其是在高性能計(jì)算方面。比如,在全球HPC TOP500的榜單中,所有4萬(wàn)兆以太網(wǎng)系統(tǒng)采用的都是Mellanox的產(chǎn)品。同時(shí),全世界第一套100G以太網(wǎng)的系統(tǒng)用得也是Mellanox的網(wǎng)絡(luò)產(chǎn)品。
值得一提的是,上文中提到的4萬(wàn)兆以太網(wǎng)和100G以太網(wǎng)系統(tǒng)都出自中國(guó),這一方面說(shuō)明Mellanox在HPC領(lǐng)域的技術(shù)實(shí)力,同時(shí)也表明中國(guó)在HPC領(lǐng)域的領(lǐng)先態(tài)勢(shì)。
Gilad Shainer說(shuō),HPC領(lǐng)域是Mellanox的傳統(tǒng)領(lǐng)域,除了HPC之外,Mellanox還將其技術(shù)優(yōu)勢(shì)擴(kuò)展到其他領(lǐng)域,包括高速存儲(chǔ)、數(shù)據(jù)庫(kù)、人工智能等。其中,人工智能也被Mellanox鎖定為今后的重點(diǎn)領(lǐng)域。
“在這個(gè)領(lǐng)域里,需要對(duì)大量數(shù)據(jù)進(jìn)行分析和讀取,非常類似于高性能計(jì)算。另外,Mellanox還能夠通過(guò)機(jī)器學(xué)習(xí)和人工智能等快速地延伸到物聯(lián)網(wǎng)、自動(dòng)駕駛、醫(yī)療、制造、零售等眾多行業(yè)。”他說(shuō)。
從“以CPU為中心”到“以數(shù)據(jù)為中心”
Mellanox在高速網(wǎng)絡(luò)方面的成績(jī)得益于其獨(dú)特的技術(shù)理念和基于這些理念下的諸多獨(dú)特優(yōu)勢(shì),“以數(shù)據(jù)為中心的網(wǎng)絡(luò)”就是其中之一, 而“卸載”則是為了落實(shí)這一理念而采用的技術(shù)。
在Mellanox看來(lái),傳統(tǒng)數(shù)據(jù)中心的計(jì)算模式是以CPU為中心,即所有的數(shù)據(jù)都要移動(dòng)到CPU以后才能進(jìn)行計(jì)算。在小數(shù)據(jù)量的時(shí)候,這一模式運(yùn)轉(zhuǎn)得很好,但當(dāng)數(shù)據(jù)量不斷增加以后會(huì)出現(xiàn)問(wèn)題。比如,現(xiàn)在很多領(lǐng)域用到了分布式計(jì)算方式,其中CPU都要等待數(shù)據(jù)達(dá)到以后才計(jì)算,如果要移動(dòng)的數(shù)據(jù)太多就會(huì)使整個(gè)應(yīng)用程序的性能出現(xiàn)瓶頸——因?yàn)镃PU要等數(shù)據(jù)到齊才能完成計(jì)算,有時(shí)還會(huì)出現(xiàn)互相等待的情況。
Mellanox認(rèn)為,未來(lái)的數(shù)據(jù)中心應(yīng)該是以數(shù)據(jù)為中心的,也就是數(shù)據(jù)在哪里,計(jì)算就應(yīng)該在哪里發(fā)生,從而避免CPU成為瓶頸。為了踐行這一理念,Mellanox設(shè)法讓網(wǎng)絡(luò)參與到計(jì)算過(guò)程中,也就是把一部分計(jì)算交由網(wǎng)絡(luò)設(shè)備來(lái)完成,網(wǎng)絡(luò)設(shè)備的角色不再只是數(shù)據(jù)的傳輸者,這就是Mellanox所說(shuō)的“卸載”。
“以數(shù)據(jù)為中心的新一代架構(gòu)應(yīng)該是:數(shù)據(jù)在哪兒,數(shù)據(jù)分析就在哪兒。如果數(shù)據(jù)在CPU,我們就在CPU分析;如果數(shù)據(jù)在傳輸當(dāng)中,我們就應(yīng)該有能力在數(shù)據(jù)的傳輸路徑中完成這個(gè)數(shù)據(jù)分析。為了高效地分析數(shù)據(jù),我們就需要把計(jì)算能力向數(shù)據(jù)轉(zhuǎn)移,而不是把數(shù)據(jù)向計(jì)算去移動(dòng)。”Gilad Shainer表示。
據(jù)Gilad Shainer介紹,在“以數(shù)據(jù)為核心”的數(shù)據(jù)中心中,數(shù)據(jù)在網(wǎng)絡(luò)中移動(dòng)的同時(shí)就會(huì)完成一些操作,如數(shù)據(jù)的加減和數(shù)據(jù)的簡(jiǎn)單分析。這樣,當(dāng)數(shù)據(jù)經(jīng)過(guò)網(wǎng)絡(luò)傳輸?shù)竭_(dá)CPU時(shí),已經(jīng)是經(jīng)過(guò)清洗、處理的數(shù)據(jù)。這有很多好處:第一,它會(huì)提升系統(tǒng)的性能,因?yàn)閿?shù)據(jù)不會(huì)等到了CPU以后再分析;第二,它會(huì)降低數(shù)據(jù)傳輸?shù)臅r(shí)延,能把通訊延遲從現(xiàn)在的20-30多微秒下降到3-4微秒。
智能的網(wǎng)絡(luò)硬件
很顯然,以數(shù)據(jù)為中心的新一代數(shù)據(jù)中心中,因?yàn)榫W(wǎng)絡(luò)設(shè)備可以分擔(dān)部分CPU的壓力,同時(shí)也可以減輕網(wǎng)絡(luò)的傳輸壓力,是一個(gè)不錯(cuò)的演進(jìn)方向,但這無(wú)疑對(duì)網(wǎng)絡(luò)設(shè)備提出了更好的要求,也就是網(wǎng)絡(luò)設(shè)備需要更加智能。用Mellanox的表述,就是需要具備“Offloading(卸載)”的網(wǎng)絡(luò)硬件才能完成數(shù)據(jù)中心的這一重要轉(zhuǎn)型。
“實(shí)際上,Mellanox一直致力于開(kāi)發(fā)智能網(wǎng)絡(luò),讓網(wǎng)絡(luò)來(lái)協(xié)作處理數(shù)據(jù)。比如,我們發(fā)布的最新產(chǎn)品HDR InfiniBand 200Gb/s的網(wǎng)絡(luò)產(chǎn)品,包括全球第一款200Gb/s的交換機(jī)和全球第一個(gè)200Gb/s的網(wǎng)卡ConnectX-6,都是基于這一理念推出的新一代智能網(wǎng)絡(luò)產(chǎn)品。”Gilad Shainer說(shuō)。
據(jù)悉,HDR InfiniBand交換機(jī)中的Quantum芯片具有非常強(qiáng)大和智能的處理能力,可以支持網(wǎng)絡(luò)內(nèi)的計(jì)算,Mellanox將這項(xiàng)技術(shù)稱為SHArP 2.0。
“通過(guò)這個(gè)技術(shù)能夠在我們的交換機(jī)里面完成數(shù)據(jù)分析、數(shù)據(jù)查詢,同時(shí),還能支持聚合式的通訊、包括新的一些Tag Matching,這些功能對(duì)整個(gè)應(yīng)用程序性能提升非常關(guān)鍵,無(wú)論是傳統(tǒng)的高性能計(jì)算還是新興的深度學(xué)習(xí)、人工智能軟件都能適用。”Gilad Shainer表示。
Gilad Shainer強(qiáng)調(diào),除了傳統(tǒng)的高性能計(jì)算和深度學(xué)習(xí)能用到卸載,網(wǎng)絡(luò)設(shè)備還能完成很多其他功能的卸載,包括存儲(chǔ)、安全以及一些網(wǎng)絡(luò)協(xié)議的卸載,從而提升整體系統(tǒng)的性能。
正是為了更好地實(shí)現(xiàn)部分CPU功能的卸載,實(shí)踐“以數(shù)據(jù)為中心”的網(wǎng)絡(luò),Mellanox于2015以約8億美元的現(xiàn)金收購(gòu)了以色列芯片公司EZchip半導(dǎo)體公司,并于2016年推出了一個(gè)名為BlueField的SoC芯片。
據(jù)介紹,BlueField集成了ARM的CPU和PCIe 4.0的內(nèi)置交換,是一個(gè)具有交換、網(wǎng)絡(luò)和CPU的SoC系統(tǒng)。根據(jù)Mellanox的說(shuō)法,基于此SoC可以構(gòu)建很多專用系統(tǒng),比如存儲(chǔ)一體機(jī)、深度學(xué)習(xí)一體機(jī)、安全的一體機(jī)以及NFV的一體機(jī)。
“和傳統(tǒng)解決方案相比,這種方式可以達(dá)到更好的可擴(kuò)展性,同時(shí)成本更低。這也是我們?cè)诰W(wǎng)絡(luò)領(lǐng)域里面一個(gè)新的探索,包括如何集成網(wǎng)絡(luò)加計(jì)算的能力,如何更好地去處理數(shù)據(jù)。”Gilad Shainer表示。
“這就是Mellanox,一方面我們擁有一個(gè)被業(yè)界證明了的非常穩(wěn)定、擁有最高性能的并持續(xù)不斷改進(jìn)的InfiniBand產(chǎn)品,同時(shí),我們也在不斷探索致力于提供更高性能、更高效、更高可擴(kuò)展性、更智能的新一代的網(wǎng)絡(luò)產(chǎn)品。”Gilad Shainer總結(jié)說(shuō)。