2020年9月,國務院國資委正式印發(fā)《關于加快推進國有企業(yè)數(shù)字化轉型工作的通知》,系統(tǒng)明確國有企業(yè)數(shù)字化轉型的基礎、方向、重點和舉措,基于2020年新基建元年,新型數(shù)據(jù)中心的大規(guī)模建設,進一步為國有企業(yè)數(shù)字化轉型提供了堅實的基礎。
在積極推動數(shù)字經(jīng)濟發(fā)展的進程中,云南省提出了“數(shù)字云南”戰(zhàn)略,云南移動以5G等新基建為先進生產(chǎn)力,聯(lián)合華為積極構建全新的網(wǎng)絡聯(lián)接來助力數(shù)據(jù)中心的云化,從而加速云南移動的數(shù)字化轉型進程。
云南移動布局5G背后的數(shù)據(jù)中心挑戰(zhàn)
近幾年,云南移動的業(yè)務增長非常迅速,服務對象覆蓋近四千萬個人用戶,一千萬家庭用戶,四十多萬的政企用戶。
于此同時,我們必須要唯物客觀的看到,絕大多數(shù)的政企客戶的信息化系統(tǒng)、數(shù)據(jù)中心建設、網(wǎng)絡構建都不是一蹴而就的,而是不斷增加和改進的。云南移動數(shù)據(jù)中心也是走過“豎井式構建、緊密耦合”過去,經(jīng)歷了向“中心化、分層開放” 的過程,最終目標定位于構建“智慧中臺和切片運營” 的架構體系的過程。
比如云南移動BOSS系統(tǒng)月計單數(shù)2016年相對于2020年增長了10倍,達到了一千億條。服務器需求也從2018年的3千臺增加到2021年的1萬臺,這些增長造成了帶寬不足、數(shù)據(jù)中心機房的擴展和運維效率數(shù)據(jù)中心網(wǎng)絡的挑戰(zhàn)。
“原本的數(shù)據(jù)中心,分布在玉溪、昆明、曲靖 三個城市,業(yè)務各自部署,是傳統(tǒng)的煙囪式架構,曲靖和玉溪間相距200km,數(shù)據(jù)中心互訪需要出數(shù)據(jù)中心,走公網(wǎng),流量繞行嚴重;老數(shù)據(jù)中心的可用空間和供電能力,也達到了上限;并且傳統(tǒng)網(wǎng)絡出故障幾率大,人工維護很低效。無法滿足我們日益增長的業(yè)務需求。云南移動數(shù)據(jù)中心網(wǎng)絡升級迫在眉睫。” 云南移動信息技術部總經(jīng)理于桃分享到。
5G浪潮之下,數(shù)字化轉型離不開強大的數(shù)據(jù)中心能力。而作為IT支撐系統(tǒng)的關鍵基礎設施——數(shù)據(jù)中心網(wǎng)絡,需要更高效,更敏捷地支撐業(yè)務變革。
數(shù)據(jù)中心迎來巨變,全以太釋放更強能量
于此同時,包括通用計算資源、高性能計算資源和存儲資源的數(shù)據(jù)中心基于架構、計算單元和存儲介質正在發(fā)生天翻地覆的變化,一旦的對象和架構發(fā)生變化,網(wǎng)絡就要做出相應調整。

比較明顯的變化就是,數(shù)據(jù)中心節(jié)點百倍的增長,讓IT架構從集中式走向分布式;計算單元性能百倍的提升,讓PCIE總線優(yōu)勢不在;存儲介質從機械硬盤向全閃存升級,性能也是百倍的提升。這些變化引領著服務器以太互聯(lián)、CPU/GPU以太互聯(lián)以及全閃存以太互聯(lián)的進化。也就是說,架構、計算和存儲的三大變革正驅動數(shù)據(jù)中心網(wǎng)絡從原來的多協(xié)議模式向全以太化演進。
“IT架構從集中式走向分布式,大規(guī)模節(jié)點互聯(lián)已成為以太網(wǎng)的天下;計算單元無論是CPU還是GPU都在去PCIE總線,突破總線的速率瓶頸,直接出以太口來提供更高算力;從存儲介質上看,機械硬盤向全閃存升級,性能提升百倍,傳統(tǒng)FC只有32G帶寬,不滿足全閃存高吞吐的需求,于是帶寬高達400GE的以太網(wǎng)成為新一代存儲網(wǎng)絡的事實標準。” 華為數(shù)據(jù)中心網(wǎng)絡領域總裁王雷解釋到。
同時數(shù)據(jù)中心全以太數(shù)據(jù)中心網(wǎng)絡全以太演進過程中還面臨著眾多挑戰(zhàn),包括高性能計算要求零丟包和存儲雙活要求的零丟包挑戰(zhàn),以及大規(guī)模網(wǎng)絡運維更復雜的挑戰(zhàn)。
從技術角度看,華為數(shù)據(jù)中心網(wǎng)絡領域總裁王雷認為, “眾所周知以太網(wǎng)天然是丟包的,自誕生以來40多年一直都沒有解決,而隨著網(wǎng)絡規(guī)模的增加,丟包率將呈指數(shù)級增長;在存儲同城雙活場景中,由于長距傳輸帶來的額外數(shù)百微秒的時延,讓網(wǎng)絡流控實現(xiàn)零丟包更是雪上加霜;以太網(wǎng)缺乏有效運維手段,而在云化趨勢下,網(wǎng)絡規(guī)模百倍增長,端口、策略等網(wǎng)絡對象關系達到百萬級,僅靠人工已無法進行網(wǎng)絡運維。”
以變化應對變化,華為全新的CloudFabric 3.0聯(lián)接加速數(shù)據(jù)中心融合
云南移動IT資源池的建設是一個長期的工程,需要攻克一個又一個難關,華為聯(lián)合云南移動積極加速變革,基于四步走來對網(wǎng)絡架構進行改造。
新建超大呈貢資源池
由于老網(wǎng)空間和供電等限制,云南移動在昆明呈貢規(guī)劃了一個新的超大數(shù)據(jù)中心,規(guī)模滿足未來十年的業(yè)務增長需求。
構建跨DC統(tǒng)一資源池
運用大二層 VxLAN 技術,云南移動把六個數(shù)據(jù)中心全部互聯(lián),形成了數(shù)據(jù)中心之間端到端的二層互通,為后面的業(yè)務靈活部署和遷移提供了物理基礎。形成邏輯上的一個資源池。
業(yè)務分批部署、遷移
基礎架構搭建好后,依照先對內支撐系統(tǒng),后 業(yè)務支持系統(tǒng)的原則,依次對業(yè)務進行遷移,逐步把業(yè)務重心遷移到新的呈貢數(shù)據(jù)中心,部分業(yè)務留在老數(shù)據(jù)中心,實現(xiàn)了業(yè)務的平滑遷移。
形成一主多活多平面
“到今年底,按照我們規(guī)劃,呈貢機房服務器規(guī)模將超過四千臺。形成以呈貢數(shù)據(jù)中心為主數(shù)據(jù)中心,連接五大次規(guī)模數(shù)據(jù)中心的超大資源池格局。多數(shù)據(jù)中心之間形成主備出口,保證所有業(yè)務運行順利,穩(wěn)定性有極高保障。”于桃談到。
華為提出要解決現(xiàn)有的數(shù)據(jù)中心網(wǎng)絡面臨的挑戰(zhàn),應當具備三大特征:網(wǎng)絡實現(xiàn)無損全以太,實現(xiàn)計算和存儲網(wǎng)絡的融合,解決本地和長距傳輸下0丟包的問題;管理層實現(xiàn)部署全生命周期自動化,確保網(wǎng)絡快速響應需求變化,業(yè)務快速上線;另外,還要實現(xiàn)全網(wǎng)的智能運維,確保業(yè)務0中斷。

而華為推出全新的CloudFabric 3.0超融合數(shù)據(jù)中心網(wǎng)絡方案,基于網(wǎng)絡智能管控系統(tǒng)iMaster NCE、以及CloudEngine數(shù)據(jù)中心交換機兩大部件實現(xiàn)了:
- 全以太HPC網(wǎng)絡:攻克以太網(wǎng)丟包難題,100%釋放算力;
- 雙活全以太存儲網(wǎng)絡:突破長距以太無損,存儲性能提升87%;
- 全生命周期自動化:實現(xiàn)網(wǎng)絡即服務,業(yè)務秒級發(fā)放;
- 全網(wǎng)智能運維:實現(xiàn)故障自愈,保障業(yè)務7×24小時在線。
華為CloudFabric3.0助力云南移動構筑一朵云超能力
華為助力云南移動基于IT基礎設施IaaS層打造的“全省一朵云”的戰(zhàn)略,構建了超大資源池,通過CloudFabric 3.0超融合數(shù)據(jù)中心網(wǎng)絡的智能化機制,實現(xiàn)了多數(shù)據(jù)中心資源通過跨數(shù)據(jù)中心大二層網(wǎng)絡拉通,并遵循集團‘統(tǒng)籌規(guī)劃、集中管理、資源共享、按需服務、彈性伸縮’‘五化’的戰(zhàn)略。實現(xiàn)了一朵云融合多域,統(tǒng)一監(jiān)控、運維、管理。
在超大規(guī)模資源池格局形成后,云南移動通過華為的iMaster NCE 控制器來納管所有的數(shù)據(jù)中心網(wǎng)絡,所有的租戶資源的分配,業(yè)務的上下線,在一個控制平面就能完成。
在數(shù)據(jù)中心網(wǎng)絡的接入層,部署了100GE超寬帶寬的框式交換機,保證了流量突發(fā)時的帶寬需求,為后期的增加大流量業(yè)務做好了準備。
同時將CloudFabric 3.0超融合數(shù)據(jù)中心網(wǎng)絡的智能化機制引入了業(yè)務部署和網(wǎng)絡運維,實現(xiàn)端到端智能化的業(yè)務部署,部署周期從天縮短到分鐘級;針對網(wǎng)絡故障,可以進行從感知到定位最后解決的5分鐘閉環(huán)操作。
于桃談到,基于華為CloudFabric3.0,云南移動網(wǎng)絡數(shù)字化轉型的效果實現(xiàn)了三升和三降。
三升:
- 業(yè)務部署效率提升
- 智能部署系統(tǒng)讓網(wǎng)絡開局效率提升了50%;
提升IT效能
SDN網(wǎng)絡上層業(yè)務與底層設施解耦,業(yè)務的遷移變更用戶沒有任何感知,用戶體驗得到提升;
設備利用率提升
網(wǎng)絡資源虛擬化,控制器統(tǒng)一分配,通過資源的池化實現(xiàn)設備的利用率上升。
三降:
- TCO(總體成本)降低
- 資源池化和按需取用,實現(xiàn)TCO大幅降低;
風險降低
智能運維,業(yè)務狀態(tài)和轉發(fā)路徑實時感知,實現(xiàn)網(wǎng)絡健康度檢查,故障快速處理,大幅降低業(yè)務系統(tǒng)風險,保障業(yè)務7×24小時在線;
用戶投訴降低
新的SDN方案上線以來平穩(wěn)無故障運行,實現(xiàn)網(wǎng)絡0故障、0投訴的突破。
云南移動在基于新基建開展產(chǎn)品創(chuàng)新、服務創(chuàng)新和模式創(chuàng)新的過程中,華為CloudFabric數(shù)據(jù)中心網(wǎng)絡方案為云南移動提供了強大的助力。未來展望,云南移動將攜手華為,在自動駕駛網(wǎng)絡(ADN)領域深化合作。在全生命周期自動化、全無損以太網(wǎng)以及全網(wǎng)智能運維領域深化合作,持續(xù)云網(wǎng)融合,加速智慧IT轉型。