背景:中國聯通(tōng)作(zuò)為(wèi)一個(gè)有(yǒu)IT曆史背景的公司,和(hé)現今其他靠IT驅動的服務業公司一樣有(yǒu)一定的曆史包袱。由于整個(gè)IT系統漸進發展,産生(shēng)了新老系統并存、資源分散、設備異構、軟件環境異構等諸多(duō)問題。孤島式的IT資源 |
背景:中國聯通(tōng)作(zuò)為(wèi)一個(gè)有(yǒu)IT曆史背景的公司,和(hé)現今其他靠IT驅動的服務業公司一樣有(yǒu)一定的曆史包袱。由于整個(gè)IT系統漸進發展,産生(shēng)了新老系統并存、資源分散、設備異構、軟件環境異構等諸多(duō)問題。孤島式的IT資源和(hé)IT能力服務制(zhì)約了企業轉型現代化服務業發展之路。随着雲計(jì)算(suàn)出現,一定程度上(shàng)解決了資源孤島、共享的問題,但(dàn)是依然存在物理(lǐ)機資源調度的缺位,且現今虛拟機顆粒度的資源也收到了一定程度的挑戰,從業務發展上(shàng)來(lái)說今後的IT資源一定是物理(lǐ)、虛拟、容器(qì)(進程級)資源相互并存的。
IT業務驅動的企業需要尋找一條IT向I3能力,即創新性、信息化、集成化的IT能力的IT綜合治理(lǐ)轉型之路。
近年來(lái)随着中國聯通(tōng)IT系統的大(dà)數(shù)據應用的不斷上(shàng)升,聯通(tōng)自身的IT資源在現在大(dà)數(shù)據應用發展的強大(dà)需求下面臨極大(dà)壓力。大(dà)數(shù)據中心3000餘台服務器(qì)設備中有(yǒu)77%是純物理(lǐ)機使用,傳統的IT資源管理(lǐ)方式造成了物理(lǐ)集群之間(jiān)無法共享資源,從而造成有(yǒu)限資源的浪費。聯通(tōng)IT系統集中化進程中,能力開(kāi)放、服務能力供給側不足也成為(wèi)了随之而來(lái)的問題。所以,在聯通(tōng)資源共享、服務化、開(kāi)放化層面,需要一個(gè)統一的解決方案。
CU-DCOS發展
因此在2016年4月啓動了CU-DCOS項目,旨在解決聯通(tōng)IT治理(lǐ)和(hé)能力開(kāi)放等問題。經過初期的技(jì)術(shù)方案設計(jì),在驗證了多(duō)種開(kāi)源技(jì)術(shù)和(hé)商業化産品後,完成了技(jì)術(shù)路線的選擇,确定了CU-DCOS的基礎架構。
2016年8月份啓動了CU-DCOS平台開(kāi)發,經過近 6個(gè)月的研發和(hé)測試,突破了關鍵技(jì)術(shù)43項,完成了9大(dà)功能、56小(xiǎo)功能的門(mén)戶開(kāi)發,通(tōng)過了技(jì)術(shù)測試和(hé)業務測試共59項。在2017年1月推出了CU-DCOS1.0平台。之後在多(duō)個(gè)業務系統嘗試落地使用,并仍在持續進行(xíng)産品化叠代研發。
現今,CU-DCOS平台已能夠面向企業用戶提供40餘種服務能力,其中包括大(dà)數(shù)據、數(shù)據庫、中間(jiān)件以及技(jì)術(shù)、應用等服務,已能夠面向開(kāi)發運維流程提供DevOps服務。為(wèi)中國聯通(tōng)公共創新大(dà)數(shù)據能力開(kāi)放平台、中國聯通(tōng)PaaS平台以及中國聯通(tōng)牛人(rén)部落實驗室提供架構支撐和(hé)資源優化,大(dà)幅提升IT資源應用效率。
CU-DCOS能力平台利用其架構特質,對以下IT環節進行(xíng)了優化:
低(dī)運營成本:用戶能夠通(tōng)過共享網絡、存儲、CPU內(nèi)存等計(jì)算(suàn)資源,在業務高(gāo)峰期通(tōng)過彈性擴容方式有(yǒu)效的應對業務峰值,在業務波谷期将資源分享給其他用戶,有(yǒu)效的節約了成本。
簡化設備運維:在原有(yǒu)的IT體(tǐ)系中,研發團隊既需要維護應用程序,同時(shí)還(hái)要維護基礎設施。在CU-DCOS平台架構中,開(kāi)發人(rén)員面對的将是第三方開(kāi)發或自定義的API和(hé)URL,底層硬件對于開(kāi)發人(rén)員透明(míng)化了,技(jì)術(shù)團隊無需再關注運維工作(zuò),能夠更加專注于應用系統開(kāi)發。
提升可(kě)維護性:微服務應用将調用多(duō)種平台的能力服務,組成最終的應用邏輯。目前,例如登陸鑒權服務,雲數(shù)據庫服務等,在安全性、可(kě)用性、性能方面都進行(xíng)了大(dà)量優化,通(tōng)過直接集成平台提供的服務,能夠有(yǒu)效的降低(dī)開(kāi)發成本,同時(shí)使得(de)應用的運維過程變得(de)更加清晰,有(yǒu)效的提升了應用的可(kě)維護性。
更快的開(kāi)發速度:創新項目由于人(rén)員與資金等問題,不可(kě)能每個(gè)産品線都同時(shí)進行(xíng),通(tōng)過CU-DCOS平台,能夠很(hěn)快進行(xíng)産品開(kāi)發的速度,把工作(zuò)重點放在業務實現上(shàng),把産品更快的推向市場(chǎng)。
CU-DCOS技(jì)術(shù)創新
CU-DCOS平台旨在通(tōng)過新一代的雲計(jì)算(suàn)架構——容器(qì)技(jì)術(shù),解決IT面臨的實際問題,完成IT資源的集中管理(lǐ)的新一代平台系統。
該平台不僅驗證了以容器(qì)為(wèi)基礎的PaaS平台從模式、到技(jì)術(shù)的可(kě)行(xíng)性,同時(shí)在行(xíng)業內(nèi)首次實現了面向大(dà)數(shù)據、物理(lǐ)資源彈性調度、多(duō)租戶管理(lǐ)的“資源+數(shù)據+能力“的平台架構,在滿足公司數(shù)據管控要求前提下,實現了大(dà)數(shù)據能力的開(kāi)放。
創新的獨立式技(jì)術(shù)架構:使用Kubernets+Mesos+Docker 的架構模式,集成了該領域領先開(kāi)源技(jì)術(shù),發揮了每個(gè)開(kāi)源模塊的先天優勢,相較單獨開(kāi)源軟件更适用于聯通(tōng)生(shēng)産業務。在有(yǒu)效管理(lǐ)容器(qì)化應用的同時(shí),通(tōng)過Mesos的框架資源調度功能,解決了物理(lǐ)資源完全按需共享的技(jì)術(shù)難題。
自動化細粒度擴縮容管理(lǐ):獨創的根據資源使用率阈值自動觸發和(hé)根據時(shí)間(jiān)周期性觸發的自動擴縮容能力,搭配業務量越大(dà)占資源越多(duō)、無業務不占資源的細粒度資源調度模式,将傳統的物理(lǐ)節點業務部署方式轉變為(wèi)容器(qì)集群管理(lǐ)模式,根據業務需求“一鍵式”增減服務節點數(shù)量。
資源的統一管理(lǐ):面向中國聯通(tōng)“兩地三中心”的跨地域、跨網絡的物理(lǐ)節點,CU-DCOS平台可(kě)以實現統一管理(lǐ)調度,各應用能力“按需、按時(shí)”自動化資源分配,提高(gāo)IT資源利用率,降低(dī)運營成本。
創新的大(dà)數(shù)據服務:CU-DCOS團隊為(wèi)了滿足對Hadoop生(shēng)态體(tǐ)系需求,創新性的研發了基于Myriad的自動化多(duō)集群多(duō)租戶的Hadoop框架。經測試性能穩定,支持多(duō)種Yarn生(shēng)态軟件如Hive、Spark等,并能夠做(zuò)到計(jì)算(suàn)存儲分離,本地計(jì)算(suàn),細顆粒度調度,資源預留、超售、搶占等計(jì)算(suàn)資源的多(duō)元分配方案。
持續集成/持續交付能力:CU-DCOS平台具有(yǒu)的DevOps能力支持快速叠代開(kāi)發,從源代碼到上(shàng)線全部在系統內(nèi)流轉,當完成叠代上(shàng)線時(shí),業務應用已經封裝為(wèi)容器(qì)鏡像并推送到私庫,用戶可(kě)實現不同版本應用的灰度發布,滾動升級。有(yǒu)效降低(dī)了業務割接和(hé)升級過程中出現的故障率,同時(shí)為(wèi)服務供給側提供了便捷的研發環境和(hé)供給通(tōng)道(dào)。
統一服務網關:以Gateway方式實現統一服務路由功能,針對不同的租戶,實現服務能力化,需求差異化,針對不同需求,提供服務發現功能,讓應用之間(jiān)無縫實現業務上(shàng)下遊串聯,真正的做(zuò)到全流程自動化能力部署。同時(shí)優化了現有(yǒu)技(jì)術(shù)大(dà)大(dà)提高(gāo)了服務發現和(hé)路由轉送的流程,縮短(duǎn)了56%的有(yǒu)效響應時(shí)間(jiān)。
多(duō)實例持久化存儲:CU-DCOS平台提供了多(duō)副本、高(gāo)可(kě)用、可(kě)共享的分布式存儲,為(wèi)容器(qì)增加了持久化存儲的能力,解決了容器(qì)長期以來(lái)有(yǒu)狀态部分的問題。在保證數(shù)據安全的前提下實現了容器(qì)調度的自動化管理(lǐ),優化了代碼保證多(duō)個(gè)實例都能成功挂載并穩定運行(xíng)。
落地應用
聯通(tōng)研究院的CU-DCOS平台面向企業內(nèi)部,已服務支撐以下系統:
支撐了中國聯通(tōng)公共創新大(dà)數(shù)據能力開(kāi)放平台,為(wèi)平台提供底層IT資源的整體(tǐ)調度、集群的動态擴縮容部署、大(dà)數(shù)據應用的容器(qì)化管理(lǐ)和(hé)編排以及統一的大(dà)數(shù)據服務開(kāi)放等。實現了快速部署、秒(miǎo)級停啓各類應用,支持多(duō)種大(dà)數(shù)據服務的集群部署、負載均衡、災難恢複和(hé)彈性伸縮,為(wèi)公共、專業、創新等各類應用的快速部署提供快速支撐。目前已成為(wèi)公司開(kāi)源技(jì)術(shù)與業務轉型相結合的創新型示範項目,相比于傳統的分配方式部署時(shí)間(jiān)節省了80%以上(shàng),集群間(jiān)資源利用率之差不超過10%,可(kě)靠性大(dà)幅度提升。
支撐中國聯通(tōng)PaaS平台的基礎架構,支撐整體(tǐ)PaaS平台的資源調度和(hé)整合以及容器(qì)化封裝PaaS能力和(hé)編排調度等能力。目前已完成了全部15種PaaS能力的封裝,可(kě)對外提供服務。PaaS平台上(shàng)的數(shù)十個(gè)O域、M域應用已經完成CU-DCOS整體(tǐ)遷移,并且運行(xíng)穩定。
支撐中國聯通(tōng)牛人(rén)部落實驗室的基礎架構,目前已應用于百餘台設備并利用CU-DCOS進行(xíng)統一的部署和(hé)資源調度。實現了大(dà)規模集群資源的動态管理(lǐ)、靈活的資源控制(zhì)策略和(hé)應用安裝部署。成功搭建了開(kāi)放式實驗環境,滿足中國聯通(tōng)IT實驗室的需要。
CU-DCOS的投入應用,将以其創新的技(jì)術(shù)架構,全面支持中國聯通(tōng)實際管理(lǐ)、生(shēng)産流程,并在中國聯通(tōng)首次實現以物理(lǐ)資源統一管理(lǐ)調度,各應用能力“按需、按時(shí)”分配資源,大(dà)幅提高(gāo)IT資源利用率,降低(dī)運營成本。
來(lái)自開(kāi)源、走向開(kāi)源
CU-DCOS項目一路走來(lái),其中的核心技(jì)術(shù)均來(lái)源于開(kāi)源社區(qū),這也是從技(jì)術(shù)選型階段就定下的基調,基于開(kāi)源技(jì)術(shù)獲得(de)更大(dà)成長空(kōng)間(jiān)。
我們也本着來(lái)自開(kāi)源、走向開(kāi)源的宗旨,積極與多(duō)個(gè)開(kāi)源社區(qū)互動,提交過多(duō)項提議、代碼,在KubeCon和(hé)MesosCon進行(xíng)演講和(hé)演示,與Mesosphere深度合作(zuò)。并建立了Github項目:https://github.com/chinaunicomRI/。CU-DCOS團隊也積極為(wèi)開(kāi)源社區(qū)貢獻一份力量。
作(zuò)者簡介 :
張呈宇:
碩士,中國聯通(tōng)研究院工程師(shī),主要從事大(dà)數(shù)據、雲計(jì)算(suàn)IaaS、容器(qì)技(jì)術(shù)等方面的研發工作(zuò)。
魏進武:
博士,副教授/高(gāo)級工程師(shī),現為(wèi)中國聯通(tōng)研究院大(dà)數(shù)據研究中心主任。負責中國聯通(tōng)研發項目50餘項。獲省部級科技(jì)進步一等獎2項,發表學術(shù)論文40餘篇,獲專利20餘項。從事的研究領域為(wèi)大(dà)數(shù)據、雲計(jì)算(suàn)以及電(diàn)信IT系統的設計(jì)及研發等。
全天候聚焦IaaS/PaaS/SaaS最新技(jì)術(shù)動态,深度挖掘技(jì)術(shù)大(dà)咖第一手實踐,及時(shí)推送雲行(xíng)業重大(dà)新聞,一鍵關注,總覽國內(nèi)外雲計(jì)算(suàn)大(dà)勢!