數(shù)據(jù)中心光網(wǎng)絡(luò)智能管控
近年來(lái),全球移動(dòng)用戶數(shù)量迅速擴(kuò)增,數(shù)據(jù)中心業(yè)務(wù)快速增長(zhǎng),這些趨勢(shì)對(duì)目前的數(shù)據(jù)中心互聯(lián)光網(wǎng)絡(luò)提出了更大需求。在降低部署與運(yùn)營(yíng)成本的同時(shí)如何保證系統(tǒng)穩(wěn)定運(yùn)行是一個(gè)重要挑戰(zhàn)。一方面,隨著相干器件的發(fā)展,器件具備多種調(diào)制模式選擇,鏈路與信號(hào)的配置逐漸多樣化,配合OPC-4的Flex-grid應(yīng)用,這讓彈性光網(wǎng)絡(luò)(elastic optical networks, EON)成為了可能,鏈路性能優(yōu)則采用更高的單波速率,鏈路性能差則降低單波速率換取更高的傳送性能。這就像新能源汽車的續(xù)航里程一樣,高速行駛續(xù)航里程相對(duì)越短,勻速行駛里程相對(duì)較長(zhǎng),如何平衡這兩者的關(guān)系是一個(gè)平衡經(jīng)濟(jì)效益的點(diǎn)。網(wǎng)絡(luò)控制層能夠?qū)︻l譜資源進(jìn)行更靈活和精確的配置,但需要一套評(píng)估機(jī)制來(lái)平衡利用率與性能的關(guān)系。另一方面,隨著光網(wǎng)絡(luò)的開源解耦,基于開放平臺(tái)的控制器實(shí)現(xiàn)對(duì)多廠商設(shè)備統(tǒng)一管控,同時(shí)集中化控制場(chǎng)景下,海量的PM數(shù)據(jù)被更高頻次的采集上來(lái),網(wǎng)絡(luò)管理者可以站在更精細(xì)化的維度上去審視系統(tǒng)的性能情況,基于在線的實(shí)時(shí)性能優(yōu)化成了可能,如何處理并運(yùn)用這些數(shù)據(jù)是今后的一個(gè)重要課題。
以上提到的光網(wǎng)絡(luò)發(fā)展趨勢(shì),使得維持高質(zhì)量的光傳輸業(yè)務(wù)從壽命起始(Beginning of life, BoL)到壽命終止(End of life, EoL)更具挑戰(zhàn)性。在大部分情況下,由于光網(wǎng)絡(luò)規(guī)劃平臺(tái)無(wú)法準(zhǔn)確預(yù)估未部署的光信號(hào)傳輸質(zhì)量(Quality of transmission, QoT),為確保網(wǎng)絡(luò)正常運(yùn)行,需要預(yù)留較高的設(shè)計(jì)余量以容忍規(guī)劃的性能指標(biāo)與實(shí)際結(jié)果之間的差異。然而,高余量的設(shè)計(jì)會(huì)導(dǎo)致頻譜資源利用不足,從而浪費(fèi)了一部分傳輸容量。因此,為了構(gòu)建一個(gè)低余量的光網(wǎng)絡(luò)來(lái)增加網(wǎng)絡(luò)容量,控制層需要更準(zhǔn)確的光網(wǎng)絡(luò)規(guī)劃工具(planning tool)在光路部署前來(lái)評(píng)估傳輸性能。其中,QoT估計(jì)模型是planning tool的核心模塊。
本篇推文將首先介紹QoT估計(jì)模型中對(duì)于光纖信道的建模原理,并對(duì)兩種經(jīng)典模型進(jìn)行簡(jiǎn)要介紹。在此基礎(chǔ)上,我們將簡(jiǎn)要介紹開發(fā)QoT模型的流程及未來(lái)針對(duì)數(shù)據(jù)中心光網(wǎng)絡(luò)智能管控的研究方向。
光纖信道建模原理
通常來(lái)說,光信號(hào)在傳輸過程中,會(huì)受到多種物理效應(yīng)的影響從而引入噪聲,其中包括偏振效應(yīng)、光放大器自發(fā)輻射(ASE)噪聲、收發(fā)機(jī)噪聲、非線性噪聲、濾波效應(yīng)等。前文提到的planning tool可以通過建模這些物理效應(yīng),計(jì)算相應(yīng)的噪聲,從而評(píng)估給定參數(shù)的鏈路的QoT。但設(shè)計(jì)這樣的planning tool存在一定挑戰(zhàn),讓我們來(lái)看這樣一個(gè)現(xiàn)象,試著理解下這些難懂的過程:
小明在大街上接打電話,由于周圍環(huán)境嘈雜,小明開啟了免提并調(diào)高音量貼在耳朵上聽著對(duì)方說話,但由于音量太大揚(yáng)聲器爆音,小明更難聽明白電話另一頭濃重的鄉(xiāng)音。于是小明從書包里翻出了降噪耳機(jī)戴上后立馬可以清晰地聽清楚對(duì)方,并且連耳機(jī)的靜默電流聲也聽得一清二楚,小明努力地識(shí)別著對(duì)方的口音,費(fèi)了半天勁也沒搞明白對(duì)方說的一些詞的意思,但在此時(shí)小明被身邊的人猛得一拉,緩過神來(lái)的小明才反應(yīng)過來(lái)原來(lái)路人看見小明完全沒聽到身后汽車的鳴笛聲,是路人幫忙提醒了他。
上面這樣一個(gè)例子在生活中也是大家所常見的,其實(shí)這樣一個(gè)通信過程也夾雜著很多類似的原理:
收發(fā)機(jī)噪聲:手機(jī)的揚(yáng)聲器效果差,降噪耳機(jī)效果好,其實(shí)這就如同不同的收發(fā)器自身也會(huì)攜帶不同的噪聲,干擾我們聽清對(duì)方的話。
ASE噪聲:就像我們打電話過程中,戴著降噪耳機(jī)時(shí),在對(duì)方說話的間隔中或多或少會(huì)聽到一些背景的靜默電流聲,耳機(jī)聲音越大這個(gè)聲音也越大,耳機(jī)放大器的自身噪聲也會(huì)隨著音量調(diào)大而變大。
濾波器噪聲:小明使用降噪耳機(jī),我們可以變相地理解為通過一個(gè)降噪濾掉了小明所處環(huán)境的背景音,但是降噪耳機(jī)也有個(gè)不好的地方,大家應(yīng)該都有體會(huì):所有身邊的聲音都隔離掉之后反而對(duì)于行走中的人帶來(lái)了危險(xiǎn)。當(dāng)然這個(gè)例子只是解釋濾波器本身也會(huì)帶來(lái)代價(jià),就像降噪耳機(jī)引入安全問題一樣,也會(huì)引入新的代價(jià)。
非線性噪聲:就和小明一樣,面對(duì)一個(gè)口音濃重的人在談話中說到了一個(gè)俚語(yǔ),你很難弄清他說的這個(gè)詞是什么含義,也很難通過前后語(yǔ)境去推測(cè)這個(gè)詞到底是什么,這樣的難以判斷與預(yù)測(cè)就和非線性噪聲一樣,沒有公式或算法去計(jì)算非線性效應(yīng)的不確定性,這給通信系統(tǒng)帶來(lái)了很大的挑戰(zhàn)。
那么QoT充當(dāng)一個(gè)什么角色
QoT充當(dāng)一個(gè)量化溝通難度的工具,即在小明接通電話前我們可以告訴他,小明你的漢語(yǔ)水平結(jié)合當(dāng)前的場(chǎng)景,你可能無(wú)法理解對(duì)方的話。當(dāng)然這個(gè)例子可能并不十分恰當(dāng),實(shí)際上我們的QoT遇到的問題就像是小明所遇到的問題,不同的是planning tool不光要能準(zhǔn)確地識(shí)別和理解對(duì)方的鄉(xiāng)音與俚語(yǔ),還要評(píng)估環(huán)境噪聲有多大,例如這款耳機(jī)的降噪系數(shù)如何,音質(zhì)是否優(yōu)異,對(duì)方的口音大概是哪里人等等,即把每一個(gè)所經(jīng)環(huán)節(jié)的信息拿到并給出一個(gè)評(píng)估:在環(huán)境噪音不高于多少分貝的情況下,使用這個(gè)耳機(jī)可以讓漢語(yǔ)水平8級(jí)的人聽懂來(lái)自浙江溫州的他所打來(lái)的電話。QoT就是這樣一個(gè)評(píng)估通信系統(tǒng)代價(jià)的工具。
通過小明的例子理解這一過程后,我們來(lái)看看相對(duì)專業(yè)一些的分析,說明了我們做這樣一個(gè)工具的幾方面難點(diǎn):
1.各項(xiàng)物理效應(yīng)自身的建模存在復(fù)雜性
前文提到的各項(xiàng)物理效應(yīng)產(chǎn)生的機(jī)制不完全相同,所對(duì)應(yīng)的建模都具有一定的挑戰(zhàn)性。其中,光纖非線性噪聲在高速光纖通信系統(tǒng)中是最為復(fù)雜也最難定量計(jì)算的噪聲。這是由于非線性噪聲由多種復(fù)雜的光學(xué)物理效應(yīng)相互作用產(chǎn)生,如色散、自相位調(diào)制、交叉相位調(diào)制、四波混頻、受激散射等。非線性噪聲可以通過非線性薛定諤方程來(lái)進(jìn)行計(jì)算。由于這個(gè)方程在一般情況下沒有解析解,因此非線性噪聲的計(jì)算成為了鏈路QoT估計(jì)模型中的技術(shù)關(guān)鍵點(diǎn)。
圖中所示的這些噪聲作用于信號(hào)的時(shí)、頻域,其大小與信號(hào)配置、波道分布、光纖類型都密切相關(guān)。對(duì)于這些噪聲的單獨(dú)建模存在一定的復(fù)雜性,但都有可行的方案。目前常用的兩種QoT評(píng)估框架:高精度的基于分步傅里葉的估計(jì)模型(split-step Fourier method,SSFM)和快速的基于高斯噪聲假設(shè)的估計(jì)模型(Gaussian noise model, GN model),都可以在假設(shè)各項(xiàng)噪聲為加性噪聲的情況下,給出鏈路中噪聲的評(píng)估總和。目前關(guān)于各項(xiàng)噪聲建模的研究很多,但仍然存在改進(jìn)的空間,尤其是針對(duì)靈活彈性光網(wǎng)絡(luò)的應(yīng)用場(chǎng)景。
2.噪聲之間互相影響,增加了建模的復(fù)雜性
各項(xiàng)噪聲除了自身建模的復(fù)雜性之外,由于彼此間的相互所用,還會(huì)進(jìn)一步增加信道精確建模的難度。例如,在GN模型計(jì)算非線性噪聲的基礎(chǔ)上,在噪聲來(lái)源中加入濾波效應(yīng),會(huì)造成非線性噪聲的估計(jì)準(zhǔn)確性下降。這是因?yàn)闉V波效應(yīng)使得信號(hào)頻譜不再完全符合GN模型計(jì)算非線性噪聲時(shí)做出的信號(hào)頻譜為方形分布的假設(shè)。也就是說,簡(jiǎn)單的逐一實(shí)現(xiàn)各類噪聲并疊加不能精準(zhǔn)地建模各類噪聲共同作用的效果。
3.理論模型的部署存在著復(fù)雜性
將理論模型以能夠工程化的編程語(yǔ)言實(shí)現(xiàn)也存在一定的復(fù)雜性。我們的工作內(nèi)容就是基于目前常用的兩種QoT評(píng)估框架(SSFM模型和GN模型),首先實(shí)現(xiàn)了傳輸性能估計(jì)模型的python版本。在新信號(hào)部署前,可以使用精度較高的SSFM模型準(zhǔn)確預(yù)估其性能。對(duì)已部署的信號(hào)進(jìn)行調(diào)整時(shí),可以使用速度較快的GN模型進(jìn)行快速靈活的配置。在此基礎(chǔ)上,我們將理論模型進(jìn)行了進(jìn)一步的拓展擴(kuò)充,使之更適配實(shí)際的鏈路情況,包括鏈路中WSS濾波效應(yīng)的多樣性和EDFA增益譜噪聲譜的非一致性。
我們?cè)趺醋?
講述完困難,我們是如何做這樣一個(gè)模型的,早在2019年,我們啟動(dòng)TOOP的時(shí)候,我們意識(shí)到planning tool這樣一個(gè)產(chǎn)品是任何一家波分供應(yīng)商的核心組件,用它你可以了解一個(gè)供應(yīng)商的全部類型板卡的性能情況,因此很難有任何廠商會(huì)愿意分享他們的工具,也不會(huì)售賣,且對(duì)于他們自己內(nèi)部也是license嚴(yán)格把控。即拿到一個(gè)供應(yīng)商的EPT工具即掌握了這家的核心器件性能機(jī)密,因此我們需要有自己的評(píng)估系統(tǒng)來(lái)實(shí)現(xiàn)對(duì)通信系統(tǒng)的先驗(yàn)計(jì)算配置與后驗(yàn)優(yōu)化性能的需求。我們選擇與上交大的團(tuán)隊(duì)合作,從建模開始做一個(gè)可用的QoT功能模塊來(lái)幫助我們的開放光網(wǎng)絡(luò)部署與運(yùn)營(yíng)。
模型簡(jiǎn)要介紹
SSFM模型完整模擬了整個(gè)鏈路中信號(hào)從發(fā)端產(chǎn)生到收端被接收處理的過程。它將光纖分成小段,假設(shè)每一小段中信號(hào)的色散(線性)和非線性噪聲可以分開計(jì)算;線性效應(yīng)在時(shí)域進(jìn)行計(jì)算,而非線性效應(yīng)則在頻域進(jìn)行計(jì)算,這使得模型中存在大量的FFT和IFFT,導(dǎo)致了運(yùn)算速度較慢。在實(shí)際應(yīng)用中,可以通過設(shè)計(jì)變步長(zhǎng)的分步傅里葉算法減少時(shí)頻域變換的次數(shù)。同時(shí),通過GPU的輔助,SSFM的計(jì)算速度也可以進(jìn)一步提升。
GN模型則根據(jù)假設(shè)信號(hào)和噪聲都遵循高斯分布,通過數(shù)值運(yùn)算得到非線性噪聲的噪聲功率譜密度。由于模型計(jì)算中不產(chǎn)生符號(hào)序列,GN模型的計(jì)算速度在ms級(jí),能夠快速給出鏈路QoT估計(jì)結(jié)果。運(yùn)算速度優(yōu)勢(shì)使得GN模型可以廣泛用于對(duì)鏈路QoT估計(jì)有快速需求的場(chǎng)景。在GN模型的基礎(chǔ)上,可以將GN模型拓展為enhanced GN(EGN)模型,得到更精確的鏈路QoT估計(jì)結(jié)果。另外,還可以將GN模型的結(jié)果和其他鏈路特征送入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)一步提升模型的精度。
模型開發(fā)流程
首先,我們使用python語(yǔ)言對(duì)兩種模型進(jìn)行開發(fā),并完成封裝與集成。為了能夠給用戶提供更方便的模型選擇和參數(shù)輸入,我們將模型輸入輸出開放成RESTful接口,以json數(shù)據(jù)形式進(jìn)行讀取和寫入。
目前可以輸入的模型參數(shù)包括光纖相關(guān)參數(shù)(如長(zhǎng)度、損耗等),器件相關(guān)參數(shù)(如EDFA,WSS等)和信號(hào)相關(guān)參數(shù)(如調(diào)制格式等),并可以根據(jù)需求選擇高精度模型或快速模型來(lái)輸出收端信號(hào)的SNR。我們將在后續(xù)工作中將輸出擴(kuò)展到BER、OSNR、Q值等指標(biāo)。
另外,我們?cè)趦蓚€(gè)模型中都加入了對(duì)濾波噪聲的估計(jì)。對(duì)于SSFM模型,它在發(fā)端已經(jīng)生成了符號(hào)序列,只需要在光纖傳輸過程中添加濾波功能。對(duì)于GN模型,考慮到原始模型僅計(jì)算非線性噪聲,無(wú)法直接計(jì)算濾波噪聲,因此需要對(duì)整個(gè)模型進(jìn)行重構(gòu)。我們利用半仿真半數(shù)值解的方案來(lái)實(shí)現(xiàn):模擬一個(gè)AWGN信道,在發(fā)端產(chǎn)生符號(hào)序列,將原有GN模型上得到的非線性噪聲和ASE噪聲視為信道中的白噪聲,加在符號(hào)序列上后經(jīng)過WSS,在收端獲得最終的SNR。由于加入了符號(hào)傳輸仿真,這會(huì)使得GN模型的運(yùn)算速度稍有下降,但仍遠(yuǎn)快于SSFM模型。
后續(xù)將對(duì)模型進(jìn)行更新迭代,使模型能夠適應(yīng)帶寬靈活可調(diào)、調(diào)制格式靈活可變、路由自由定義的網(wǎng)絡(luò)場(chǎng)景,并進(jìn)一步對(duì)EDFA等器件進(jìn)行精準(zhǔn)建模,使之能夠更符合實(shí)際中的鏈路情況。
未來(lái)的研究計(jì)劃
本階段完成了對(duì)物理層光網(wǎng)絡(luò)性能估計(jì)算法的初步部署。隨著彈性光網(wǎng)絡(luò)的發(fā)展,我們將進(jìn)一步設(shè)計(jì)新網(wǎng)絡(luò)場(chǎng)景中的性能估計(jì)模型,并考慮開源硬件的趨勢(shì),對(duì)不同型號(hào)收發(fā)機(jī)及光器件進(jìn)行精準(zhǔn)地適配。同時(shí),目前的性能估計(jì)主要基于靜態(tài)模型,隨著網(wǎng)絡(luò)配置及信道的變化,下一代模型將以智能監(jiān)測(cè)為核心,從實(shí)時(shí)鏈路的監(jiān)測(cè)結(jié)果出發(fā),使靜態(tài)模型轉(zhuǎn)化為動(dòng)態(tài)模型,進(jìn)一步提升網(wǎng)絡(luò)性能,構(gòu)建智能化、數(shù)字化的光網(wǎng)絡(luò)管控系統(tǒng)。基于上述的鏈路QoT估計(jì)模型,我們未來(lái)將展開對(duì)光網(wǎng)絡(luò)智能管控算法的研究。其中的重點(diǎn)包括光功率優(yōu)化:實(shí)現(xiàn)更有效的入纖光功率配置來(lái)進(jìn)一步提升網(wǎng)絡(luò)容量。還可以根據(jù)精確的鏈路QoT相關(guān)數(shù)據(jù)分析,進(jìn)行光網(wǎng)絡(luò)中軟故障的管理,如檢測(cè)和定位等。這些研究都可以在目前工作的基礎(chǔ)上進(jìn)行,最終目標(biāo)是實(shí)現(xiàn)更智能和動(dòng)態(tài)的光網(wǎng)絡(luò)管控。
QoT給我們帶來(lái)的意義和價(jià)值
QoT的價(jià)值一方面是為我們?cè)陂_通系統(tǒng)前提供了先驗(yàn)機(jī)制,輸出對(duì)應(yīng)配置,但更大的價(jià)值在于它賦予了TOOP控制器在線診斷能力。當(dāng)線路發(fā)生劣化時(shí),根據(jù)telemetry所得到的PM數(shù)據(jù)情況,判斷劣化區(qū)間與劣化事件,通過QoT組件計(jì)算線路性能,得到最優(yōu)配置下發(fā)并調(diào)節(jié)確保系統(tǒng)可以正常運(yùn)行。從采集、分析、執(zhí)行,光層設(shè)備與電層設(shè)備如同傳感器一樣時(shí)刻反饋數(shù)據(jù),光功率、Pre-fec、Q值、SOP等參數(shù)作為評(píng)估參數(shù)進(jìn)行系統(tǒng)性能評(píng)估,并根據(jù)計(jì)算結(jié)果修正配置,這樣一個(gè)反饋循讓系統(tǒng)維持在一個(gè)健康狀態(tài)。如同開篇所講到的,長(zhǎng)久以來(lái)光網(wǎng)絡(luò)在設(shè)計(jì)時(shí)都預(yù)留很大的余量,包括工程余量,系統(tǒng)老化余量,線路劣化余量等等。過多的預(yù)留帶來(lái)的是成本問題,通過QoT組件精準(zhǔn)的性能分析可以在滿足系統(tǒng)性能的前提下預(yù)留合理的余量,最大程度的利用頻譜資源,平衡成本與穩(wěn)定性的關(guān)系。曾經(jīng)的光網(wǎng)絡(luò)設(shè)備專業(yè)且復(fù)雜,龐大的子框及聯(lián)關(guān)系,復(fù)雜的分布式功率調(diào)節(jié)算法與自動(dòng)化的缺失讓網(wǎng)絡(luò)的運(yùn)營(yíng)十分繁冗。TOOP結(jié)合QoT組件實(shí)現(xiàn)自動(dòng)化并最終像智慧管控進(jìn)行演進(jìn),這就是QoT帶給我們的價(jià)值。
上海交通大學(xué)課題組介紹
本課題組主要研究方向?yàn)閿?shù)據(jù)中心光網(wǎng)絡(luò)、核心骨干網(wǎng)光通信和B5G/6G光應(yīng)用技術(shù),研究?jī)?nèi)容涉及光通信系統(tǒng)架構(gòu)、光網(wǎng)絡(luò)智能管控、光數(shù)字信號(hào)處理和光無(wú)線融合等。主持科技部重點(diǎn)專項(xiàng)(課題負(fù)責(zé)人)和自然科學(xué)基金。在國(guó)際一流期刊和會(huì)議上發(fā)表論文140余篇,共申請(qǐng)美國(guó)專利10項(xiàng),在OFC和ECOC等國(guó)際會(huì)議上作特邀報(bào)告20余次。擔(dān)任Optics Express等國(guó)際期刊副編輯。擔(dān)任OFC等國(guó)際會(huì)議的技術(shù)委員會(huì)主席(OFC S4和OSA SPPCom等)和委員。獲2020年OFC康寧杰出學(xué)生論文獎(jiǎng)第一名,2019年華為優(yōu)秀合作獎(jiǎng)等。
感謝上海交通大學(xué)諸葛群碧副教授課題組。參與本課題的學(xué)生包括:劉曉敏、高若萱、劉蕾、倫華志、蔡萌、邱淇智。