圖4 團隊協(xié)作
從產品設計之初,我們就會和產品經(jīng)歷及研發(fā)團隊共同討論系統(tǒng)架構設計,確保開發(fā)團隊將要實現(xiàn)的是高可用性、高可擴展性及高可維護性的產品。產品測試階段,我們也會和測試團隊保持密切的溝通,使測試環(huán)境能夠最大程度模擬生產環(huán)境的各種場景,以保證我們產品經(jīng)過了完整有效的測試。系統(tǒng)上線前,我們還會和各個團隊評估整個產品的可維護性,并確定應用的容量規(guī)劃及其故障轉移策略,確保SE團隊充分了解如何在生產環(huán)境中維護該項產品。由于不同的團隊可能在不同的國家和地區(qū),所以只有更緊密的全球化協(xié)作,才能為用戶提供一個高可用性、高可維護性的全球化產品。
產品上線以后,才是產品整個生命周期的開始,我們需要確保產品在其設計的生命周期內,都能夠按照我們的預期提供高可用性的服務。所以在日常維護中,我們會和產品及研發(fā)團隊一同分析產品運行狀態(tài),分析總結各種故障,不斷的修正已有的Bug,提供新功能的建議與意見。根據(jù)各地用戶分布及產品的運行狀態(tài),修正我們的容量規(guī)劃及故障轉移策略,進一步提升用戶體驗。
結語
以上只是雅虎在超大規(guī)模應用運維體系的簡單概述,并沒有太多的技術細節(jié),瑾作拋磚引玉之用。雅虎全球運維團隊的工程師利用他們的智慧,不斷創(chuàng)新,一一應對各種挑戰(zhàn),完成一個個不可能完成的任務。