IT服務(wù)管理(ITSM,ITServiceManagement)是以服務(wù)的形式為客戶提供價(jià)值的一組特定的組織能力,用于向客戶以服務(wù)的方式提供價(jià)值。其核心思想是IT組織的主要工作就是提供低成本、高質(zhì)量的IT服務(wù)。這種IT服務(wù)是IT組織通過合適的人員、流程和信息技術(shù)來完成的,即IT服務(wù)管理的實(shí)施離不開三大要素:人、流程和技術(shù)。IT服務(wù)管理系統(tǒng)就是其中的技術(shù)要素,本質(zhì)是通過系統(tǒng)的建設(shè),實(shí)現(xiàn)IT服務(wù)管理流程的自動化、電子化并監(jiān)測服務(wù)的質(zhì)量。
【摘要】IT服務(wù)管理系統(tǒng)是IT服務(wù)管理的三大要素之一。隨著云資源池的建設(shè),原來的IT服務(wù)管理系統(tǒng)需要調(diào)整優(yōu)化。在IT服務(wù)管理系統(tǒng)的現(xiàn)狀診斷基礎(chǔ)上,分析了云計(jì)算環(huán)境下資源池的建設(shè)和運(yùn)營在流程支撐、資源動態(tài)調(diào)度、運(yùn)行監(jiān)控、容量管理等方面給原來的IT服務(wù)管理系統(tǒng)帶來的挑戰(zhàn),優(yōu)化了IT服務(wù)管理系統(tǒng)的功能架構(gòu),增強(qiáng)了系統(tǒng)能力,并提出分步實(shí)施的策略。
【關(guān)鍵詞】IT服務(wù)管理,CMDB資源池
1IT服務(wù)管理系統(tǒng)現(xiàn)狀
中國電信從2008年底開始制定中國電信服務(wù)體系并逐步推進(jìn),目前已經(jīng)建設(shè)了集團(tuán)和省公司兩級的IT服務(wù)管理系統(tǒng)(簡稱ITSM系統(tǒng)),主要包括服務(wù)管理域、監(jiān)視管理域和采集管理域的功能,其系統(tǒng)功能架構(gòu)如圖1所示:
。1)IT服務(wù)管理域功能:支持所有IT服務(wù)管理流程的管理功能,并提供服務(wù)流程全過程的實(shí)時(shí)監(jiān)控、閉環(huán)管理和量化考核;同時(shí),還實(shí)現(xiàn)IT資產(chǎn)及配置數(shù)據(jù)(CMDB,ConfigurationManagementDatabase)的存儲、共享、訪問和管理,為IT監(jiān)控系統(tǒng)和相關(guān)的IT服務(wù)管理流程提供配置項(xiàng)信息及其關(guān)聯(lián)關(guān)系的存儲、分析、訪問、同步的功能和數(shù)據(jù)管理功能。
(2)監(jiān)視管理域功能主要包括以下三個(gè)層面的監(jiān)控功能:
1)端到端的業(yè)務(wù)服務(wù)流程監(jiān)控:主要以電信提供的業(yè)務(wù)服務(wù)視角作為監(jiān)控的對象,如CMDB新裝/退訂/停復(fù)機(jī)服務(wù)的流程,提供業(yè)務(wù)全流程運(yùn)行狀態(tài)和質(zhì)量情況監(jiān)測,從而主動發(fā)現(xiàn)業(yè)務(wù)流程潛在的性能和可用性問題;
2)應(yīng)用軟件監(jiān)控:實(shí)現(xiàn)應(yīng)用軟件(進(jìn)程、進(jìn)程池、接口和數(shù)據(jù)文件等)的監(jiān)控管理,通過對應(yīng)用軟件的告警、性能、配置數(shù)據(jù)的集中采集、處理和展現(xiàn),及時(shí)發(fā)現(xiàn)系統(tǒng)應(yīng)用軟件運(yùn)行狀態(tài)的異常;
3)IT基礎(chǔ)設(shè)施監(jiān)控:實(shí)現(xiàn)所有主機(jī)、操作系統(tǒng)、存儲、備份、數(shù)據(jù)庫、中間件、網(wǎng)絡(luò)等IT基礎(chǔ)設(shè)施的集中監(jiān)控管理,結(jié)合CMDB中配置項(xiàng)以及配置項(xiàng)之間的關(guān)聯(lián)關(guān)系信息,實(shí)現(xiàn)對MBOSS域IT基礎(chǔ)設(shè)施的拓?fù)湔故、綜合告警和集中性能監(jiān)視。
。3)采集管理域:主要采集被管對象包括基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的相關(guān)性能、告警和配置信息上傳給上層監(jiān)控功能。
中國電信通過集團(tuán)和省兩級IT服務(wù)系統(tǒng)的建設(shè),實(shí)現(xiàn)了包括:IT需求、事件和服務(wù)請求等運(yùn)維流程的固化支撐;IT基礎(chǔ)設(shè)施和MBOSS核心系統(tǒng)配置梳理及入庫;IT基礎(chǔ)設(shè)施全面監(jiān)控及關(guān)鍵業(yè)務(wù)流程的端對端監(jiān)控。同時(shí),還提高了主動運(yùn)維能力和運(yùn)維效率,保障了服務(wù)質(zhì)量。
2云資源池環(huán)境下對ITSM系統(tǒng)挑戰(zhàn)
隨著云計(jì)算的快速發(fā)展,中國電信加快了云計(jì)算的研究和應(yīng)用。中國電信采用云計(jì)算技術(shù)整合內(nèi)部IT系統(tǒng)的基礎(chǔ)設(shè)施和應(yīng)用架構(gòu),2011年集團(tuán)和省建設(shè)了支撐MBOSS的PC服務(wù)器資源池,并將逐步完成可遷移應(yīng)用,如CRM系統(tǒng)(客戶關(guān)系管理系統(tǒng))的Web、APP層向PC資源池的遷移,以提高基礎(chǔ)設(shè)施共享水平及應(yīng)用系統(tǒng)彈性,降低IT總體擁有成本。
資源池環(huán)境的變化運(yùn)營和建設(shè)從流程上、資源使用方式上,給原來的IT服務(wù)管理系統(tǒng)帶來了挑戰(zhàn),主要表現(xiàn)在以下方面:
。1)流程支撐:需要支持自助式資源申請、擴(kuò)容、回收流程的固化和自動流轉(zhuǎn)。
。2)CMDB管理:原有ITSM系統(tǒng)中的CMDB模型只考慮物理資源以及與應(yīng)用和業(yè)務(wù)的關(guān)聯(lián)關(guān)系管理,而引入虛擬化技術(shù)建設(shè)資源池以后,需要支持新的管理對象以及新對象之間的關(guān)聯(lián)關(guān)系管理,如虛擬集群、宿主機(jī)、虛擬機(jī)、虛擬網(wǎng)絡(luò)、虛擬交流機(jī)、虛擬數(shù)據(jù)存儲等的管理對象以及它們之間關(guān)系管理;更為復(fù)雜的情況是由于系統(tǒng)自身的一些特點(diǎn)如CRM系統(tǒng),目前的數(shù)據(jù)庫應(yīng)用仍很長一段時(shí)間內(nèi)部署在原Unix服務(wù)器上,而應(yīng)用服務(wù)器和Web服務(wù)器應(yīng)用將部署到虛擬機(jī)環(huán)境上,這樣從業(yè)務(wù)系統(tǒng)的視角中就能體現(xiàn)出物理資源和虛擬資源共存的關(guān)聯(lián)關(guān)系管理。
。3)資源快速部署和按需動態(tài)伸縮能力:要求能通過虛擬機(jī)模板進(jìn)行虛擬資源的快速部署和就緒,并可根據(jù)需要在應(yīng)用繁忙時(shí)動態(tài)增加計(jì)算資源、空閑時(shí)釋放計(jì)算資源,還能進(jìn)行資源池內(nèi)的計(jì)算資源動態(tài)遷移,高效穩(wěn)定運(yùn)行并充分利用計(jì)算資源。
。4)監(jiān)控管理能力:在原來的物理資源監(jiān)控的基礎(chǔ)上要增加資源池虛擬資源的各種關(guān)鍵指標(biāo),如CPU性能(如CPU使用率、CPU沖突率、CPU沖突時(shí)間)、內(nèi)存性能(如內(nèi)存使用率、內(nèi)存沖突率、內(nèi)存需求數(shù)量)、存儲性能(如磁盤使用率、磁盤I/O速率、命令時(shí)延)、網(wǎng)絡(luò)性能(如網(wǎng)絡(luò)I/O速率、丟包率)和告警信息進(jìn)行監(jiān)控,及時(shí)發(fā)現(xiàn)異常并采取主動預(yù)防措施。
。5)容量管理能力:從資源池整體的容量角度,監(jiān)視當(dāng)前資源池的容量及其使用量,形成統(tǒng)一集中視圖,從而對資源池被管對象容量數(shù)據(jù)信息(資源區(qū)、集群、宿主機(jī)、虛擬機(jī)的容量情況等)進(jìn)行統(tǒng)一管理,及時(shí)了解被管對象容量狀況。在容量將被用盡前通過人性化展現(xiàn)方式及時(shí)通告運(yùn)維人員,為容量規(guī)劃提供主要的數(shù)據(jù)支持。
綜合以上方面可以看出,在這種資源池運(yùn)行環(huán)境下,流程支撐、監(jiān)控管理、資源動態(tài)調(diào)度以及容量管理要求方面,原來ITSM系統(tǒng)的能力已經(jīng)不能滿足資源池環(huán)境下的運(yùn)營,急需提升能力。
3云資源池環(huán)境下的IT服務(wù)管理系統(tǒng)能力設(shè)計(jì)
根據(jù)資源池的運(yùn)營和管理要求,支持資源池管理的IT服務(wù)管理系統(tǒng)功能架構(gòu)設(shè)計(jì)如圖2所示。
。1)采集與控制域:在原來采集域的基礎(chǔ)上增強(qiáng)采集能力,新增了對資源池的控制功能。通過屏蔽不同虛擬化廠商的資源池接口的差異性,并接應(yīng)監(jiān)視管理域和資源調(diào)度域的要求,對性能數(shù)據(jù)、告警數(shù)據(jù)、配置數(shù)據(jù)等進(jìn)行采集和分析處理,再將數(shù)據(jù)進(jìn)行存儲和轉(zhuǎn)發(fā),負(fù)責(zé)建立、維護(hù)和斷開資源調(diào)度域與被管對象的通道以及操作控制執(zhí)行結(jié)果的反饋。
。2)監(jiān)視管理域:增強(qiáng)的采集管理、性能管理、告警管理等功能主要是針對資源池的新的管理對象和管理關(guān)系的要求,采集新的性能指標(biāo)、告警指標(biāo)并設(shè)置動態(tài)的閥值,再判別性能能否滿足要求,為健康管理和容量監(jiān)視等分析優(yōu)化工作提供必要的數(shù)據(jù);拓?fù)涔芾硇枰獜臉I(yè)務(wù)系統(tǒng)的角度能展示業(yè)務(wù)-應(yīng)用-物理/虛擬資源的關(guān)聯(lián)關(guān)系,并能基于這種關(guān)聯(lián)關(guān)系實(shí)現(xiàn)告警關(guān)聯(lián)和故障定位,監(jiān)視管理域的拓?fù)涔芾砉δ懿粌H需要在各被管對象上展現(xiàn)配置數(shù)據(jù),還需要展示關(guān)聯(lián)的健康、容量和性能負(fù)載數(shù)據(jù)。
1)新增的健康度管理功能:主要是針對資源池的資源共享特性,對歷史性能數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,采用自學(xué)習(xí)手段計(jì)算出資源池中的資源區(qū)、集群、宿主機(jī)、虛擬機(jī)在各時(shí)間點(diǎn)上的正常動態(tài)閥值區(qū)間,監(jiān)控系統(tǒng)通過當(dāng)前的性能數(shù)據(jù)與該時(shí)間點(diǎn)的閥值區(qū)間進(jìn)行對比,判斷發(fā)現(xiàn)潛在的健康性問題,要求動態(tài)區(qū)間由歷史數(shù)據(jù)統(tǒng)計(jì)生成,因此不必再對各監(jiān)控對象手工設(shè)定其閥值范圍,既保證了監(jiān)視的準(zhǔn)確性又降低了人工成本;
2)新增的容量監(jiān)視功能:主要根據(jù)資源池的資源容量及其使用量形成集中的視圖,從而對資源池被管對象容量數(shù)據(jù)信息(資源區(qū)、集群、宿主機(jī)、虛擬機(jī)的容量情況等)進(jìn)行統(tǒng)一管理,及時(shí)了解被管對象容量狀況,在容量將被用盡前通過人性化展現(xiàn)方式及時(shí)通告運(yùn)維人員,為容量規(guī)劃提供主要的數(shù)據(jù)支持;
3)告警管理:通過對來自資源池的告警信息進(jìn)行統(tǒng)一處理,以便快速確認(rèn)故障,縮短排障時(shí)間,為及時(shí)恢復(fù)業(yè)務(wù)運(yùn)行打下了良好的基礎(chǔ),資源池的告警來源主要包括性能閥值告警、容量預(yù)警及資源池被管對象的狀態(tài)故障告警;
4)拓?fù)涔芾恚焊鶕?jù)資源池被管對象的基礎(chǔ)信息及其內(nèi)部關(guān)聯(lián)關(guān)系生成不同的拓?fù)湟晥D,并通過這些拓?fù)湟晥D完成對被管對象的監(jiān)測。監(jiān)視管理域與服務(wù)管理域的拓?fù)涔芾砉δ艿膮^(qū)別在于能形成業(yè)務(wù)系統(tǒng)視角的業(yè)務(wù)、應(yīng)用與物理資源和軟件資源的拓?fù)潢P(guān)系。
。3)資源部署與調(diào)度域:屬于新增功能,是通過對包括虛擬資源和被虛擬化管理軟件管理的物理資源(包括宿主機(jī)、存儲以及網(wǎng)絡(luò))的管理,根據(jù)需求實(shí)現(xiàn)基于策略或模版的資源部署和調(diào)度,實(shí)現(xiàn)資源的生命周期管理。資源調(diào)度功能域包括資源發(fā)現(xiàn)及資源封裝、資源部署調(diào)度和模板管理功能。
1)資源封裝實(shí)現(xiàn)對物理資源、虛擬層的統(tǒng)一管理,屏蔽底層硬件及虛擬化異構(gòu),整合系統(tǒng)中所有可用資源,實(shí)現(xiàn)對資源的發(fā)現(xiàn)和資源信息的綜合管理;
2)資源部署調(diào)度是對物理和虛擬資源的信息實(shí)現(xiàn)動態(tài)、彈性、按需的流程化及自動化調(diào)度,按照策略自動進(jìn)行資源部署和操作,并可根據(jù)應(yīng)用、服務(wù)的負(fù)載情況動態(tài)分配資源,對提供服務(wù)的資源提供可靠性保障策略,調(diào)度策略應(yīng)至少支持高可用調(diào)度策略、負(fù)載平衡調(diào)度策略和電源節(jié)省調(diào)度策略等;
3)模板管理提供從創(chuàng)建、發(fā)布、激活、掛起、撤銷到刪除的模板生命周期管理,可為快速部署資源提供支撐。
4系統(tǒng)演進(jìn)策略
原有的ITSM系統(tǒng)要實(shí)現(xiàn)對資源池的管理,需結(jié)合原有系統(tǒng)能力、實(shí)現(xiàn)難度、投資保護(hù)逐步對ITSM實(shí)現(xiàn)升級,分步實(shí)施可考慮以下演進(jìn)策略:
。1)增強(qiáng)ITSM系統(tǒng)的監(jiān)視管理功能,實(shí)現(xiàn)對資源池的監(jiān)視管理,并利用原虛擬化廠商的管理軟件實(shí)現(xiàn)對資源池的操作管理。
對原ITSM系統(tǒng)的服務(wù)管理域、監(jiān)視管理域和采集與控制管理域進(jìn)行改造,是將資源池的宿主機(jī)、虛擬機(jī)、虛擬網(wǎng)絡(luò)等對象的性能、配置和告警信息納入ITSM進(jìn)行管理及初步的容量管理能力,同時(shí)對資源的申請、修改和回收流程在ITSM系統(tǒng)中進(jìn)行固化;考慮到資源池操作的復(fù)雜性,同時(shí)考慮省公司在資源池建設(shè)初期都是以虛擬化廠商的產(chǎn)品為主,所以該階段對資源池操作仍將依賴原虛擬化廠商管理軟件如VMware的vCenter等。在這種環(huán)境下,資源池管理員需要在ITSM系統(tǒng)接收資源申請單,并根據(jù)對資源池操作結(jié)果,在ITSM系統(tǒng)進(jìn)行人工回單。
。2)新增資源調(diào)度域功能,實(shí)現(xiàn)對異構(gòu)資源池的統(tǒng)一部署和調(diào)度管理。
在ITSM系統(tǒng)實(shí)現(xiàn)資源池監(jiān)視的基礎(chǔ)上,新增資源調(diào)度域功能和操作控制功能,通過廠商提供的API實(shí)現(xiàn)對資源池操作控制,包括模版管理、策略管理和部署調(diào)度功能;本階段應(yīng)要求ITSM系統(tǒng)能屏蔽多廠家資源池接口的差異性,實(shí)現(xiàn)對多制式下資源池的統(tǒng)一管理和調(diào)度。
5結(jié)束語
資源池的運(yùn)營對原來IT服務(wù)管理體系的流程和技術(shù)手段帶來了新的挑戰(zhàn),應(yīng)該適時(shí)調(diào)整IT服務(wù)管理流程,并適應(yīng)資源池管理要求,逐步完善和補(bǔ)充ITSM系統(tǒng)的流程支撐能力、資源部署和動態(tài)調(diào)度、運(yùn)行監(jiān)控、容量管理和流程支撐能力,將資源池的運(yùn)營管理納入統(tǒng)一的IT服務(wù)管理體系中,提供更好的服務(wù)質(zhì)量。
參考文獻(xiàn):
[1]陳春華,梁奐.全業(yè)務(wù)電信運(yùn)營商的IT服務(wù)管理實(shí)踐探討[J].電信科學(xué),2011(3):118-125.
[2]陳春華,李軍,梁奐,等.資源池環(huán)境下的IT服務(wù)管理實(shí)施策略[J].電信科學(xué),2012(9):142-147.
[3]JanvanBon.IT服務(wù)管理——基于ITIL的全球最佳實(shí)踐[M].章斌,譯.北京:清華大學(xué)出版社,2006.
[4]PeterBrooks.IT服務(wù)管理指標(biāo)[M].豐祖軍,譯.北京:清華大學(xué)出版社,2008.
轉(zhuǎn)載請注明來自:http://www.jinnzone.com/jisuanjiwangluolw/26516.html