“我們不僅僅關註運維,同時還關註開發、測試和評估,從而提供一體化的解決方案來滿足產品線快速迭代的技術需求。最終我們期望通過基於統一的資源池,提供統一接入、開發測試、彈性調度、分級發佈、監控評估等標準化的解決方案來支撐貼吧、社區、搜索、移動雲等各個產品線。這是OXP平臺的整體定位”5月17日,百度Lamp基礎技術、XP私有雲平臺和貼吧基礎設施負責人許立強在第50期百度技術沙龍現場上說。
  雲計算並不是一個新話題,但是在中國的發展依然不溫不火,隨著AWS的入華,人們對雲計算,尤其是私有雲的關註再次升溫。本期的百度技術沙龍,許立強就百度在私有雲架構的資源管理、分級發佈和彈性服務的方面的成果與經驗與聽眾進行了分享互動。
  “我們要把通用服務做成專業服務,把服務運維起來,形成一個品牌管理它,同時提供一些開發輔助支持它。”百度Lamp基礎技術負責人許立強說。
  百度雲架構的資源管理:兼顧性能與成本
  在活動中,許立強首先與我們分享了百度雲架構資源管理的發展歷程。
  在服務器資源管理領域,Google 公司的軟件系統Borg最負盛名,而使用LXC的應用容器引擎Docker則自2013年以來頗受業界追捧。在服務器資源管理領域,百度對業界之前的成功經驗既有借鑒學習,也有著眼於自身問題的調整創新。
  在開始階段,雲服務的資源管理主要面臨兩點問題,即既要做到支持混合部署,還要避免程序之間相互影響、搶占資源。在多種可選方案中,Cgroup技術以其操作系統級別的虛擬化機制、極低的性能損耗和相對經濟的實現成本成為了百度最終選擇的資源管理方案。
  隨著運算與流量的承載量日益上升和用戶數量的激增,服務器的資源分配等一系列問題逐漸浮出水面,。2012年,百度自主推出了ArkOn資源分配算法,實現了空閑優先、Group打散的資源分配方式;2013和2014年,百度引入了namespace和Matrix架構,加強了資源隔離,完善了用戶權限認證,進一步完善了百度雲架構的資源管理問題。
  “從技術上來說,第一個就是資源隔離,第二個就是資源的管理和調度,這就是我們對資源管理的總結”,許立強說。
  百度雲架構的分級發佈:需求驅動,化繁為簡
  “分級發佈在大的互聯網當中真的是必備的東西,所以百度雲服務必須要支持。也許你覺得做分級發佈並不難,但是結合雲架構來做的時候,分級發佈真的是整個體系中的難點”,在談到雲架構分級發佈的問題時,許立強說。
  在百度雲架構運行初期,由於小產品線更新迭代少,分級發佈與系統底層動態擴容實現之間的衝突是當時面臨的主要問題。對此,百度的技術團隊選擇了整包部署與產品線鎖相結合的解決方案,隨後的實踐證明,這一組合方案不但在思路上化繁為簡,在執行上也效率極高。
  隨著大規模產品線的引入,產品線的更新迭代速度大大加快,多模塊並行發佈成為必需。2012年,百度針對之前的分級發佈策略做出了相應的調整,由整包發佈改為按模塊劃分的增量發佈,由產品線鎖變為模塊鎖與文件鎖,由串行更新改為模塊並行分級發佈。2014年,隨著集群規模的擴大,擴容和上線無法並行,為解決這一問題,百度再次引入了追單系統,從而實現了系統事實上的並行。
  “整包很理想,現實很骨感”,談起百度雲架構發展的歷程,許立強笑著對聽眾們說。
  百度雲架構的彈性服務:自動化的步進式實現
  在實現雲架構彈性服務方面,百度同樣經歷的長時間的探索。首先面臨的就是機器故障的處理問題,快速膨脹的業務量對服務器的穩定性提出了極高的要求,而人工介入處理時間長,成本高,已經不再適用,故障處理得自動化勢在必行。監控——報警——處理的故障解決思路看起來雖然簡單,但如何判斷是死機還是網絡抖動?故障機器是否直接下線?這些問題在系統自動化的實現中都是難以剋服的問題。對此,百度引入了故障自動下線——container自動遷移——Runtime自動重啟的三步處理方案,實現了錯誤的自動處理。
  如何提升資源利用率,同時提升系統穩定性,這是雲架構彈性服務中的另一關鍵性難點。由於業務資源利用率波動性大,又直接受到流量、性能等多方面因素影響,如何實時分配系統資源就成為解決這一問題的關鍵。 對此,百度提出了“彈性伸縮”與“自動屏蔽異常處理”的策略,一方面使業務隨著性能、流量的變化自動伸縮調整,另一方面保證偶爾出現的故障被及時隔離,不影響整體架構和雲端業務正常運作。
  “業務的實時監控和決策數據有了,異常調度已經做到自動化了,但是彈性伸縮還沒有做到自動化。”許立強表示,百度將繼續探索與推動雲架構彈性服務的發展。
  百度技術沙龍是百度每月組織的一項技術開放交流活動,至今已經舉辦50期。致力於以“技術開放”的心態,分享行業領先的技術理念和技術實踐。秉承“暢想、交流、爭鳴、聚會”的理念,為互聯網工程師、軟件開發者提供一個快速學習和不斷成長的平臺。這種倡導變革與分享、踐行技術開放的行動得到了業內專家們的認可,他們認為,百度技術沙龍能夠有效推動中國互聯網的技術發展與行業創新。
  來源:泡泡網
  【打印】【頂部】【關閉】
     (原標題:用實踐檢驗真理 百度私有雲架構經驗分享)
創作者介紹

泡湯

ya90yaxxdx 發表在 痞客邦 PIXNET 留言(0) 人氣()