在本文中,康寧光通信與達拉斯的Citadel Analytics展開了合作,而后者一直在托管數(shù)據(jù)中心(MTDC)中部署AI平臺。
在互聯(lián)網(wǎng)上通常有這樣的一句話:“知識告訴你說應該把雞蛋放進籃子,智慧則是叫你不要把所有雞蛋都放進一個籃子” 。機器學習(ML)會引導我們認識雞蛋并放進籃子,但是人工智能(AI)建議我們不要將其放入一個籃子。
撇開笑話而言,從語言翻譯到對復雜疾病的診斷,AI和ML的應用非常廣泛,遠遠不止于視覺領域。為了讓您了解AI和ML需要多少計算能力,百度在2017年展示了一種中文語音識別模型,在整個訓練周期內,不僅需要4TB的培訓數(shù)據(jù),而且還需要2000億億次的運算。
我們需要把握一個平衡點,那就是既要滿足AI和ML需求,還需要以最低的成本提供最高的服務質量。那么如何提供最高的服務質量呢?通過減少數(shù)據(jù)在終端設備和處理器之間傳輸?shù)奈锢砭嚯x,以改善延遲對傳輸?shù)挠绊憽N覀兛梢园堰吘墧?shù)據(jù)中心建設在更靠近創(chuàng)建和使用數(shù)據(jù)的地方,這樣可以優(yōu)化傳輸成本和服務質量。其次是尋求最低的成本。傳輸成本會隨著傳輸?shù)臄?shù)據(jù)量、距離或“跳數(shù)”的增加而增加。而AI和ML大大增加了傳輸?shù)臄?shù)據(jù)量,從而導致更高的傳輸成本。邊緣數(shù)據(jù)中心靠近數(shù)據(jù)創(chuàng)建的地方,因此日益成為重要的解決方案,而一大部分邊緣計算都部署在MTDC中。MTDC可以提供最低的本地數(shù)據(jù)中心部署風險,而且可以最快實現(xiàn)收益。
什么是AI、ML、MTDC?
在討論AI,ML,邊緣數(shù)據(jù)中心和MTDC之前,有必要仔細研究一下它們的概念,以確保每個人都在同一個理解層面上。
人工智能是計算機系統(tǒng)理論的延伸發(fā)展,它能夠執(zhí)行通常需要人類執(zhí)行的智能任務,例如視覺感知,語音識別,決策和語言之間的翻譯。如果利用玩具套娃來描述這些關系,那么 AI是最大的那個套娃,機器學習位于其中,而深度學習則位于機器學習套娃中。機器學習是AI的一種應用,它使系統(tǒng)能夠自動學習并從經(jīng)驗中進行改進,而無需進行編程。
邊緣數(shù)據(jù)中心是通過從核心數(shù)據(jù)中心分散一些對延遲較敏感的應用程序,使數(shù)據(jù)中心的計算和處理能力更接近創(chuàng)建數(shù)據(jù)的地方。
多租戶數(shù)據(jù)中心(MTDC)也稱為托管數(shù)據(jù)中心,用戶可以通過租用空間來托管其設施。 MTDC提供了空間和網(wǎng)絡設備,以最小的成本將用戶連接到服務提供商。用戶可以租用空間、服務器機架或完整的專用模塊,來滿足其各種需求。
AI有那么厲害?
AI和ML是自電力出現(xiàn)以來我們所見過的最具革命性的技術。它比互聯(lián)網(wǎng)和移動革命的總和還要強大。AI技術之所以如此強大和如此具有影響力,是因為它們可以快速、有效地理解大量數(shù)據(jù)。我們生活在一個數(shù)據(jù)不斷生成并且由數(shù)據(jù)驅動的世界中(市場分析師預測,如今存在的數(shù)據(jù)中有80%以上是在最近兩年內創(chuàng)建的),如果沒有能夠理解這些數(shù)據(jù)的工具,我們將會淹沒在這些數(shù)據(jù)中。
舉個簡單的例子,今年全世界將創(chuàng)造大約40兆字節(jié)的信息。那就是40萬億GB的信息。人類無法理解所有這些信息,即使每個人晝夜不停地工作,從理論上講也是不可能的。
那么我們如何理解所有這些數(shù)據(jù)呢?答案是使用AI和ML。這些技術偏愛數(shù)據(jù),數(shù)據(jù)就像是它們的氧氣。通過使用功能強大且經(jīng)過適當培訓的AI / ML模型,我們可以準確地處理大量信息,從而揭示非常有價值的數(shù)據(jù)來指導我們的行動。
核磁共振(MRI)的ML模型就是一個很好的例子。他們針對已知的癌癥或非癌癥結果進行了測試(陽性和陰性結果),這個過程被稱為訓練。之后將一組新的MRI加載到經(jīng)過訓練的模型中并進行分析。這些新的MRI被稱為驗證數(shù)據(jù)集。該數(shù)據(jù)通過已經(jīng)訓練有素的模型運行,計算并顯示結果,然后再根據(jù)為該模型選擇的性能指標評估結果。如果結果可接受,則對模型進行培訓,并準備進行更多測試和驗證。如果驗證數(shù)據(jù)不符合指標,則我們回過頭來,要么重新設計模型,要么為它提供更多數(shù)據(jù),以便為下一次驗證測試提供更好的培訓。此階段稱為驗證階段。
人工智能的好處有時會帶來額外的驚喜。例如,Citadel Analytics處理過的大多數(shù)業(yè)務都是客戶期望通過AI技術提高效率來實現(xiàn)銷售增長或降低成本。但他們很快發(fā)現(xiàn),通過AI可以大大提高員工的工作效率和愉悅性,最大的受益者居然是員工。一家懂得利用AI / ML的公司,其員工往往也對工作更加滿意,這一點比不使用AI的公司高得多。
這很有意義,因為AI / ML就是要使“無聊”的東西自動化,并讓您的員工在不降低效率的情況下做他們擅長和充滿熱情的事情。使用AI技術帶來的巨大好處是,使員工擁有更多快樂,并減少員工的流失。但是這一點許多企業(yè)一開始并不重視。
如何部署AI / ML并為其提供合理的布線方案
AI需要巨大的處理能力,這一直是一個問題。值得慶幸的是,像NVIDIA,Intel,AMD等公司正在縮小處理能力的差距。這使BMW,沃爾瑪,Target等公司以及更多公司都可以部署邊緣AI功能。這需要以安裝功能強大的硬件為前提,這些硬件將使用預先訓練的模型來處理本地數(shù)據(jù)。這大大減少了等待時間和對實時帶寬的需求。
但問題在于,沒有人能真正做到邊緣的AI / ML部署,因為雖然硬件的預訓練模型可以處理數(shù)據(jù),但它的能力不足以更新此模型,并使其功能更強大。
因此,混合方案便應用而生。
在混合方案設計中,邊緣服務器將使用經(jīng)過訓練的模型來處理所有本地數(shù)據(jù)。而這些“最適合的服務器”則可能位于不同的MTDC,從而實現(xiàn)網(wǎng)絡和應用程序選擇的靈活性。MTDC的光網(wǎng)絡基礎架構通常采用單模光纖來部署,目的是滿足最終用戶對未來擴展的需求。對于部署AI / ML的公司,重要的是需要同時考慮現(xiàn)在和未來網(wǎng)絡中的帶寬需求。 Citadel Analytics通常有一個經(jīng)驗法則,即取期望帶寬的平均值并乘以4倍,就是應該在其系統(tǒng)內部署的帶寬。在當前的AI / ML部署中,帶寬尤其重要,是首要考量的因素。
帶寬的增加也凸顯了MTDC和最終用戶對高密度解決方案的需求。高密度方案可以使MTDC空間實現(xiàn)最大化收益,而最終用戶可以更有效地利用他們投資的空間。由于基礎架構會隨著不同用戶的需求而變化,因此尋找具有產品寬度(單?;蚨嗄?,LC或MTP等)和擴展靈活性的產品供應商顯得尤為重要。對于最終用戶,降低成本的一種方法是增加密度并降低功耗。這可以通過并行光學器件和端口分離來實現(xiàn),即通過使用分支線纜來實現(xiàn)將一個高速帶寬端口分解為多個低帶寬端口。比如使用一個40g并行收發(fā)器端口分解為4個單獨的10g收發(fā)器端口,以實現(xiàn)高密度的線纜轉換。
通過減小10公里以內的傳輸距離,通??梢詫⒀舆t減少45%。這意味著什么?這將推動更多的和更小的區(qū)域性數(shù)據(jù)中心部署,使其更靠近產生數(shù)據(jù)的地方。 MTDC將成為這些較小數(shù)據(jù)中心的主要承載工具。邊緣數(shù)據(jù)中心將托管在這些互連密集型MTDC中,兩者相互配合,為客戶提供更全面的服務。擁有互聯(lián)的基礎設施、生態(tài)系統(tǒng)和豐富的客戶組合的MTDC,將能把握邊緣計算發(fā)展的商業(yè)機遇。
期望
AI和ML技術將持續(xù)為采用者創(chuàng)收和提高生產率。未來我們將看到更多公司將應用程序運行在邊緣MTDC。對于這些公司而言,MTDC提供了較低的風險和較快的收益增長。這將導致會出現(xiàn)更多的邊緣區(qū)域數(shù)據(jù)中心,而不是像我們以前看到的那樣集中的大型數(shù)據(jù)中心,同時也將帶來更多的互聯(lián)設施和更高密度的解決方案。