中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當前的位置是:  首頁 > 新聞 > 國內 >
 首頁 > 新聞 > 國內 >

零宕機方案 vSphere Fault Tolerance

2016-12-14 11:33:31   作者:   來源:CTI論壇   評論:0  點擊:


  Google 的工程師大牛 Jeff Dean 說過:“如果你有一萬臺計算機在運行,那么每天一定會有電腦死機發(fā)生。”事實上的確如此,無論服務器設計得有多可靠,總是有宕機的可能性存在,哪怕是 IBM 號稱永不宕機的大型機 (z 系列主機,z 代表 zero down time)。所以數據中心的管理員們一直在尋找提高系統(tǒng)可靠性的解決方案,最常見的就是雙機熱備方案。
  VMware vCenter 就能夠提供高可靠的集群 (Cluster) 方案,在 vSphere 集群中,任何一臺服務器發(fā)生嚴重故障了(如系統(tǒng)宕機、網絡故障、存儲失聯等),上面運行的工作負載就會被 vCenter 轉移到其他正常運行的服務器繼續(xù)運行。這種高可靠架構可以滿足絕大多數業(yè)務的需求,在共享存儲或 vSAN 上都能實現 RPO=0 的效果,但是需要一點時間在其他服務器上重啟相關應用和服務,所以 RTO>0。
  漲姿勢:RTO 和 RPO
  在設計高可靠系統(tǒng)時經常涉及到 RTO 和 RPO 兩個指標:
  • RTO (Recovery Time Objective) 就是企業(yè)能容忍的恢復時間。災難發(fā)生后,從 IT 系統(tǒng)宕機導致業(yè)務停頓,到 IT 系統(tǒng)恢復至可以恢復業(yè)務運營之間的時間。
  • RPO (Recovery Point Objective) 可簡單地描述為企業(yè)能容忍的最大數據丟失量。假設系統(tǒng)一天做一次備份,如果第二天出現錯誤,那從備份完成后到錯誤出現時所寫入的數據都無法挽回了,從上一次備份到發(fā)生錯誤之間的時間就是 RPO。
  但是還是有一部分關鍵應用不允許有任何中斷,要求達到 RTO=0 的高可靠性,這時候就可以采用 vSphere Fault Tolerance 容錯技術。
  FT 工作原理
  FT 技術的工作原理是把需要保護的虛機運行在主服務器上,指定集群中的另一臺服務器為備份,vSphere 在備份服務器上也創(chuàng)建一個跟受保護虛機一模一樣的虛機。主虛機和備份虛機的數據和狀態(tài)是完全一致的,通過 vLockStep (virtual Lockstep) 技術來保證兩臺虛機的同步運行。vSphere 通過網絡把主虛機的 FT 日志 (FT Logging) 傳遞給備份虛機,保證兩臺虛機在同一時間內處理相同的指令,并且處理相同的非確定性事件,如網絡數據包、用戶輸入、硬件時鐘等,這些非確定性事件在物理機上幾乎是無法同步的,但是虛機的所有硬件和 I/O 輸入都是由 vSphere 來控制的,所以就可以做到。
  漲姿勢:Lockstep 技術
  Lockstep 技術是容錯計算機 (Fault Tolerance Computer) 的關鍵實現技術之一,通過使用相同的、冗余的硬件組件來保持多個 CPU、內存精確的同步,在正確的相同時鐘周期內執(zhí)行相同的指令。該技術能夠保證發(fā)現任何錯誤,即使短暫的錯誤,系統(tǒng)也能在不間斷處理和不損失數據的情況下恢復正常運行。
  vSphere 把發(fā)送給主虛機的網絡數據包也完全復制給備份虛機,備份虛機執(zhí)行跟主虛機完全一致的指令流,按照相同的順序來對網絡服務請求做出響應,產生完全一致的運算結果。唯一的區(qū)別在于,主虛機對外的輸出是實際生效的,磁盤寫操作會提交給硬盤、網絡數據包會被發(fā)送出去;備份虛機的所有對外輸出都會被 vSphere 屏蔽,外界不會感知到備份虛機的存在。
\
  只有當主虛機失效時 (主服務發(fā)生故障),備份虛機才會真正生效。因為兩個虛機的 CPU 指令順列、內存狀態(tài)都是完全一致的,vSphere 馬上進行故障轉移 (failover),即刻讓備份虛機變成新的主虛機, 所有的 TCP 網絡連接都沒有中斷,虛機中的應用可以繼續(xù)運行。對外界用戶而言,受保護的虛機完全沒有中斷運行,實現了 RPO=0 和 RTO=0 的最高等級容錯。為了繼續(xù)保護新的主虛機,vSphere 會在集群中尋找一臺合適的服務器作為新的備份服務器,然后在上面復制一個新的備份虛機出來,從而形成新的容錯保護機制。
\
  換一個角度,我們也可以把 FT 技術看作是一種特殊的 vMotion。vMotion 的過程是把虛機的內存逐塊地復制到另一臺服務器上,在復制的過程中虛機還在正常運行,所以內存還在被不斷的改寫,最后一塊被復制的內存被稱之 vMotion checkpoint,這塊內存復制完成之后虛機就被完全切換到新的服務器上運行,從而完成 vMotion 的整個過程。FT 技術則是持續(xù)地復制 checkpoint 內存塊,正常情況下并不結束這一操作,只有當故障轉移時,才真正完成 vMotion 操作。
  FT 適用條件
  FT 技術不要求對應用進行改寫,或是對操作系統(tǒng)進行特殊的配置,所以一般的應用可以很方便地使用 FT 技術來進行保護。vSphere 6.0 可以保護的虛機最多可以有 4 個 vCPU、64 GB 內存,不超過這個資源限制的應用都可以采用 FT 技術來保護。而且這是 vSphere 標準版就內置的功能,不用采購額外的軟件許可證,凡是 vSphere 的用戶都可以隨時激活對于虛機的 FT 保護。
  FT 的工作機制要求主備虛機之間進行同步,只有等備份虛機上的同步操作完成之后,主虛機上的數據包傳輸才會真正完成。對于網絡上的用戶而言,發(fā)給主虛機的網絡請求就有一個額外的延遲,一般這個延遲從幾毫秒到幾百毫秒不等,一個低速的 FT 日志同步網絡(如1GB)可能加劇這種等待,搭建 vSphere FT 環(huán)境要求主備服務器之間是專用的 10GB 高速低延遲同步網絡,以保證主備服務器之間的 FT 日志同步速度,否則就會給受保護的應用帶來嚴重的性能影響。所以 FT 技術不適用于對于延遲敏感的應用或者是實時應用,也不適用于對于內存進行大量修改的應用(因為會產生大量的 FT 日志同步)。
  傳統(tǒng)的容錯計算是由昂貴的專用服務器實現的,現在 vSphere 在普通的 x86 服務器上就能實現同樣的功能,容錯計算終于成為一種大家都用得起的技術。

相關熱詞搜索: VMware vCenter 零宕機

上一篇:Asterisk課堂-IAX2 介紹

下一篇:最后一頁

專題

沁源县| 包头市| 家居| 太白县| 闽清县| 长岛县| 布拖县| 金门县| 遂川县| 民丰县| 安达市| 新干县| 于田县| 潜江市| 绥滨县| 临泽县| 黑龙江省| 河北省| 尼勒克县| 高碑店市| 太康县| 南投县| 云梦县| 调兵山市| 沁水县| 株洲市| 长春市| 德兴市| 保靖县| 密云县| 阳朔县| 分宜县| 永泰县| 镶黄旗| 彰武县| 香港| 嘉义县| 潼南县| 龙井市| 来安县| 娄烦县|