IT服務(wù)管理(ITSM,ITServiceManagement)是以服務(wù)的形式為客戶提供價(jià)值的一組特定的組織能力,用于向客戶以服務(wù)的方式提供價(jià)值。其核心思想是IT組織的主要工作就是提供低成本、高質(zhì)量的IT服務(wù)。這種IT服務(wù)是IT組織通過(guò)合適的人員、流程和信息技術(shù)來(lái)完成的,即IT服務(wù)管理的實(shí)施離不開(kāi)三大要素:人、流程和技術(shù)。IT服務(wù)管理系統(tǒng)就是其中的技術(shù)要素,本質(zhì)是通過(guò)系統(tǒng)的建設(shè),實(shí)現(xiàn)IT服務(wù)管理流程的自動(dòng)化、電子化并監(jiān)測(cè)服務(wù)的質(zhì)量。
【摘要】IT服務(wù)管理系統(tǒng)是IT服務(wù)管理的三大要素之一。隨著云資源池的建設(shè),原來(lái)的IT服務(wù)管理系統(tǒng)需要調(diào)整優(yōu)化。在IT服務(wù)管理系統(tǒng)的現(xiàn)狀診斷基礎(chǔ)上,分析了云計(jì)算環(huán)境下資源池的建設(shè)和運(yùn)營(yíng)在流程支撐、資源動(dòng)態(tài)調(diào)度、運(yùn)行監(jiān)控、容量管理等方面給原來(lái)的IT服務(wù)管理系統(tǒng)帶來(lái)的挑戰(zhàn),優(yōu)化了IT服務(wù)管理系統(tǒng)的功能架構(gòu),增強(qiáng)了系統(tǒng)能力,并提出分步實(shí)施的策略。
【關(guān)鍵詞】IT服務(wù)管理,CMDB資源池
1IT服務(wù)管理系統(tǒng)現(xiàn)狀
中國(guó)電信從2008年底開(kāi)始制定中國(guó)電信服務(wù)體系并逐步推進(jìn),目前已經(jīng)建設(shè)了集團(tuán)和省公司兩級(jí)的IT服務(wù)管理系統(tǒng)(簡(jiǎn)稱ITSM系統(tǒng)),主要包括服務(wù)管理域、監(jiān)視管理域和采集管理域的功能,其系統(tǒng)功能架構(gòu)如圖1所示:
。1)IT服務(wù)管理域功能:支持所有IT服務(wù)管理流程的管理功能,并提供服務(wù)流程全過(guò)程的實(shí)時(shí)監(jiān)控、閉環(huán)管理和量化考核;同時(shí),還實(shí)現(xiàn)IT資產(chǎn)及配置數(shù)據(jù)(CMDB,ConfigurationManagementDatabase)的存儲(chǔ)、共享、訪問(wèn)和管理,為IT監(jiān)控系統(tǒng)和相關(guān)的IT服務(wù)管理流程提供配置項(xiàng)信息及其關(guān)聯(lián)關(guān)系的存儲(chǔ)、分析、訪問(wèn)、同步的功能和數(shù)據(jù)管理功能。
。2)監(jiān)視管理域功能主要包括以下三個(gè)層面的監(jiān)控功能:
1)端到端的業(yè)務(wù)服務(wù)流程監(jiān)控:主要以電信提供的業(yè)務(wù)服務(wù)視角作為監(jiān)控的對(duì)象,如CMDB新裝/退訂/停復(fù)機(jī)服務(wù)的流程,提供業(yè)務(wù)全流程運(yùn)行狀態(tài)和質(zhì)量情況監(jiān)測(cè),從而主動(dòng)發(fā)現(xiàn)業(yè)務(wù)流程潛在的性能和可用性問(wèn)題;
2)應(yīng)用軟件監(jiān)控:實(shí)現(xiàn)應(yīng)用軟件(進(jìn)程、進(jìn)程池、接口和數(shù)據(jù)文件等)的監(jiān)控管理,通過(guò)對(duì)應(yīng)用軟件的告警、性能、配置數(shù)據(jù)的集中采集、處理和展現(xiàn),及時(shí)發(fā)現(xiàn)系統(tǒng)應(yīng)用軟件運(yùn)行狀態(tài)的異常;
3)IT基礎(chǔ)設(shè)施監(jiān)控:實(shí)現(xiàn)所有主機(jī)、操作系統(tǒng)、存儲(chǔ)、備份、數(shù)據(jù)庫(kù)、中間件、網(wǎng)絡(luò)等IT基礎(chǔ)設(shè)施的集中監(jiān)控管理,結(jié)合CMDB中配置項(xiàng)以及配置項(xiàng)之間的關(guān)聯(lián)關(guān)系信息,實(shí)現(xiàn)對(duì)MBOSS域IT基礎(chǔ)設(shè)施的拓?fù)湔故、綜合告警和集中性能監(jiān)視。
(3)采集管理域:主要采集被管對(duì)象包括基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的相關(guān)性能、告警和配置信息上傳給上層監(jiān)控功能。
中國(guó)電信通過(guò)集團(tuán)和省兩級(jí)IT服務(wù)系統(tǒng)的建設(shè),實(shí)現(xiàn)了包括:IT需求、事件和服務(wù)請(qǐng)求等運(yùn)維流程的固化支撐;IT基礎(chǔ)設(shè)施和MBOSS核心系統(tǒng)配置梳理及入庫(kù);IT基礎(chǔ)設(shè)施全面監(jiān)控及關(guān)鍵業(yè)務(wù)流程的端對(duì)端監(jiān)控。同時(shí),還提高了主動(dòng)運(yùn)維能力和運(yùn)維效率,保障了服務(wù)質(zhì)量。
2云資源池環(huán)境下對(duì)ITSM系統(tǒng)挑戰(zhàn)
隨著云計(jì)算的快速發(fā)展,中國(guó)電信加快了云計(jì)算的研究和應(yīng)用。中國(guó)電信采用云計(jì)算技術(shù)整合內(nèi)部IT系統(tǒng)的基礎(chǔ)設(shè)施和應(yīng)用架構(gòu),2011年集團(tuán)和省建設(shè)了支撐MBOSS的PC服務(wù)器資源池,并將逐步完成可遷移應(yīng)用,如CRM系統(tǒng)(客戶關(guān)系管理系統(tǒng))的Web、APP層向PC資源池的遷移,以提高基礎(chǔ)設(shè)施共享水平及應(yīng)用系統(tǒng)彈性,降低IT總體擁有成本。
資源池環(huán)境的變化運(yùn)營(yíng)和建設(shè)從流程上、資源使用方式上,給原來(lái)的IT服務(wù)管理系統(tǒng)帶來(lái)了挑戰(zhàn),主要表現(xiàn)在以下方面:
。1)流程支撐:需要支持自助式資源申請(qǐng)、擴(kuò)容、回收流程的固化和自動(dòng)流轉(zhuǎn)。
。2)CMDB管理:原有ITSM系統(tǒng)中的CMDB模型只考慮物理資源以及與應(yīng)用和業(yè)務(wù)的關(guān)聯(lián)關(guān)系管理,而引入虛擬化技術(shù)建設(shè)資源池以后,需要支持新的管理對(duì)象以及新對(duì)象之間的關(guān)聯(lián)關(guān)系管理,如虛擬集群、宿主機(jī)、虛擬機(jī)、虛擬網(wǎng)絡(luò)、虛擬交流機(jī)、虛擬數(shù)據(jù)存儲(chǔ)等的管理對(duì)象以及它們之間關(guān)系管理;更為復(fù)雜的情況是由于系統(tǒng)自身的一些特點(diǎn)如CRM系統(tǒng),目前的數(shù)據(jù)庫(kù)應(yīng)用仍很長(zhǎng)一段時(shí)間內(nèi)部署在原Unix服務(wù)器上,而應(yīng)用服務(wù)器和Web服務(wù)器應(yīng)用將部署到虛擬機(jī)環(huán)境上,這樣從業(yè)務(wù)系統(tǒng)的視角中就能體現(xiàn)出物理資源和虛擬資源共存的關(guān)聯(lián)關(guān)系管理。
。3)資源快速部署和按需動(dòng)態(tài)伸縮能力:要求能通過(guò)虛擬機(jī)模板進(jìn)行虛擬資源的快速部署和就緒,并可根據(jù)需要在應(yīng)用繁忙時(shí)動(dòng)態(tài)增加計(jì)算資源、空閑時(shí)釋放計(jì)算資源,還能進(jìn)行資源池內(nèi)的計(jì)算資源動(dòng)態(tài)遷移,高效穩(wěn)定運(yùn)行并充分利用計(jì)算資源。
。4)監(jiān)控管理能力:在原來(lái)的物理資源監(jiān)控的基礎(chǔ)上要增加資源池虛擬資源的各種關(guān)鍵指標(biāo),如CPU性能(如CPU使用率、CPU沖突率、CPU沖突時(shí)間)、內(nèi)存性能(如內(nèi)存使用率、內(nèi)存沖突率、內(nèi)存需求數(shù)量)、存儲(chǔ)性能(如磁盤使用率、磁盤I/O速率、命令時(shí)延)、網(wǎng)絡(luò)性能(如網(wǎng)絡(luò)I/O速率、丟包率)和告警信息進(jìn)行監(jiān)控,及時(shí)發(fā)現(xiàn)異常并采取主動(dòng)預(yù)防措施。
。5)容量管理能力:從資源池整體的容量角度,監(jiān)視當(dāng)前資源池的容量及其使用量,形成統(tǒng)一集中視圖,從而對(duì)資源池被管對(duì)象容量數(shù)據(jù)信息(資源區(qū)、集群、宿主機(jī)、虛擬機(jī)的容量情況等)進(jìn)行統(tǒng)一管理,及時(shí)了解被管對(duì)象容量狀況。在容量將被用盡前通過(guò)人性化展現(xiàn)方式及時(shí)通告運(yùn)維人員,為容量規(guī)劃提供主要的數(shù)據(jù)支持。
綜合以上方面可以看出,在這種資源池運(yùn)行環(huán)境下,流程支撐、監(jiān)控管理、資源動(dòng)態(tài)調(diào)度以及容量管理要求方面,原來(lái)ITSM系統(tǒng)的能力已經(jīng)不能滿足資源池環(huán)境下的運(yùn)營(yíng),急需提升能力。
3云資源池環(huán)境下的IT服務(wù)管理系統(tǒng)能力設(shè)計(jì)
根據(jù)資源池的運(yùn)營(yíng)和管理要求,支持資源池管理的IT服務(wù)管理系統(tǒng)功能架構(gòu)設(shè)計(jì)如圖2所示。
。1)采集與控制域:在原來(lái)采集域的基礎(chǔ)上增強(qiáng)采集能力,新增了對(duì)資源池的控制功能。通過(guò)屏蔽不同虛擬化廠商的資源池接口的差異性,并接應(yīng)監(jiān)視管理域和資源調(diào)度域的要求,對(duì)性能數(shù)據(jù)、告警數(shù)據(jù)、配置數(shù)據(jù)等進(jìn)行采集和分析處理,再將數(shù)據(jù)進(jìn)行存儲(chǔ)和轉(zhuǎn)發(fā),負(fù)責(zé)建立、維護(hù)和斷開(kāi)資源調(diào)度域與被管對(duì)象的通道以及操作控制執(zhí)行結(jié)果的反饋。
。2)監(jiān)視管理域:增強(qiáng)的采集管理、性能管理、告警管理等功能主要是針對(duì)資源池的新的管理對(duì)象和管理關(guān)系的要求,采集新的性能指標(biāo)、告警指標(biāo)并設(shè)置動(dòng)態(tài)的閥值,再判別性能能否滿足要求,為健康管理和容量監(jiān)視等分析優(yōu)化工作提供必要的數(shù)據(jù);拓?fù)涔芾硇枰獜臉I(yè)務(wù)系統(tǒng)的角度能展示業(yè)務(wù)-應(yīng)用-物理/虛擬資源的關(guān)聯(lián)關(guān)系,并能基于這種關(guān)聯(lián)關(guān)系實(shí)現(xiàn)告警關(guān)聯(lián)和故障定位,監(jiān)視管理域的拓?fù)涔芾砉δ懿粌H需要在各被管對(duì)象上展現(xiàn)配置數(shù)據(jù),還需要展示關(guān)聯(lián)的健康、容量和性能負(fù)載數(shù)據(jù)。
1)新增的健康度管理功能:主要是針對(duì)資源池的資源共享特性,對(duì)歷史性能數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,采用自學(xué)習(xí)手段計(jì)算出資源池中的資源區(qū)、集群、宿主機(jī)、虛擬機(jī)在各時(shí)間點(diǎn)上的正常動(dòng)態(tài)閥值區(qū)間,監(jiān)控系統(tǒng)通過(guò)當(dāng)前的性能數(shù)據(jù)與該時(shí)間點(diǎn)的閥值區(qū)間進(jìn)行對(duì)比,判斷發(fā)現(xiàn)潛在的健康性問(wèn)題,要求動(dòng)態(tài)區(qū)間由歷史數(shù)據(jù)統(tǒng)計(jì)生成,因此不必再對(duì)各監(jiān)控對(duì)象手工設(shè)定其閥值范圍,既保證了監(jiān)視的準(zhǔn)確性又降低了人工成本;
2)新增的容量監(jiān)視功能:主要根據(jù)資源池的資源容量及其使用量形成集中的視圖,從而對(duì)資源池被管對(duì)象容量數(shù)據(jù)信息(資源區(qū)、集群、宿主機(jī)、虛擬機(jī)的容量情況等)進(jìn)行統(tǒng)一管理,及時(shí)了解被管對(duì)象容量狀況,在容量將被用盡前通過(guò)人性化展現(xiàn)方式及時(shí)通告運(yùn)維人員,為容量規(guī)劃提供主要的數(shù)據(jù)支持;
3)告警管理:通過(guò)對(duì)來(lái)自資源池的告警信息進(jìn)行統(tǒng)一處理,以便快速確認(rèn)故障,縮短排障時(shí)間,為及時(shí)恢復(fù)業(yè)務(wù)運(yùn)行打下了良好的基礎(chǔ),資源池的告警來(lái)源主要包括性能閥值告警、容量預(yù)警及資源池被管對(duì)象的狀態(tài)故障告警;
4)拓?fù)涔芾恚焊鶕?jù)資源池被管對(duì)象的基礎(chǔ)信息及其內(nèi)部關(guān)聯(lián)關(guān)系生成不同的拓?fù)湟晥D,并通過(guò)這些拓?fù)湟晥D完成對(duì)被管對(duì)象的監(jiān)測(cè)。監(jiān)視管理域與服務(wù)管理域的拓?fù)涔芾砉δ艿膮^(qū)別在于能形成業(yè)務(wù)系統(tǒng)視角的業(yè)務(wù)、應(yīng)用與物理資源和軟件資源的拓?fù)潢P(guān)系。
。3)資源部署與調(diào)度域:屬于新增功能,是通過(guò)對(duì)包括虛擬資源和被虛擬化管理軟件管理的物理資源(包括宿主機(jī)、存儲(chǔ)以及網(wǎng)絡(luò))的管理,根據(jù)需求實(shí)現(xiàn)基于策略或模版的資源部署和調(diào)度,實(shí)現(xiàn)資源的生命周期管理。資源調(diào)度功能域包括資源發(fā)現(xiàn)及資源封裝、資源部署調(diào)度和模板管理功能。
1)資源封裝實(shí)現(xiàn)對(duì)物理資源、虛擬層的統(tǒng)一管理,屏蔽底層硬件及虛擬化異構(gòu),整合系統(tǒng)中所有可用資源,實(shí)現(xiàn)對(duì)資源的發(fā)現(xiàn)和資源信息的綜合管理;
2)資源部署調(diào)度是對(duì)物理和虛擬資源的信息實(shí)現(xiàn)動(dòng)態(tài)、彈性、按需的流程化及自動(dòng)化調(diào)度,按照策略自動(dòng)進(jìn)行資源部署和操作,并可根據(jù)應(yīng)用、服務(wù)的負(fù)載情況動(dòng)態(tài)分配資源,對(duì)提供服務(wù)的資源提供可靠性保障策略,調(diào)度策略應(yīng)至少支持高可用調(diào)度策略、負(fù)載平衡調(diào)度策略和電源節(jié)省調(diào)度策略等;
3)模板管理提供從創(chuàng)建、發(fā)布、激活、掛起、撤銷到刪除的模板生命周期管理,可為快速部署資源提供支撐。
4系統(tǒng)演進(jìn)策略
原有的ITSM系統(tǒng)要實(shí)現(xiàn)對(duì)資源池的管理,需結(jié)合原有系統(tǒng)能力、實(shí)現(xiàn)難度、投資保護(hù)逐步對(duì)ITSM實(shí)現(xiàn)升級(jí),分步實(shí)施可考慮以下演進(jìn)策略:
。1)增強(qiáng)ITSM系統(tǒng)的監(jiān)視管理功能,實(shí)現(xiàn)對(duì)資源池的監(jiān)視管理,并利用原虛擬化廠商的管理軟件實(shí)現(xiàn)對(duì)資源池的操作管理。
對(duì)原ITSM系統(tǒng)的服務(wù)管理域、監(jiān)視管理域和采集與控制管理域進(jìn)行改造,是將資源池的宿主機(jī)、虛擬機(jī)、虛擬網(wǎng)絡(luò)等對(duì)象的性能、配置和告警信息納入ITSM進(jìn)行管理及初步的容量管理能力,同時(shí)對(duì)資源的申請(qǐng)、修改和回收流程在ITSM系統(tǒng)中進(jìn)行固化;考慮到資源池操作的復(fù)雜性,同時(shí)考慮省公司在資源池建設(shè)初期都是以虛擬化廠商的產(chǎn)品為主,所以該階段對(duì)資源池操作仍將依賴原虛擬化廠商管理軟件如VMware的vCenter等。在這種環(huán)境下,資源池管理員需要在ITSM系統(tǒng)接收資源申請(qǐng)單,并根據(jù)對(duì)資源池操作結(jié)果,在ITSM系統(tǒng)進(jìn)行人工回單。
。2)新增資源調(diào)度域功能,實(shí)現(xiàn)對(duì)異構(gòu)資源池的統(tǒng)一部署和調(diào)度管理。
在ITSM系統(tǒng)實(shí)現(xiàn)資源池監(jiān)視的基礎(chǔ)上,新增資源調(diào)度域功能和操作控制功能,通過(guò)廠商提供的API實(shí)現(xiàn)對(duì)資源池操作控制,包括模版管理、策略管理和部署調(diào)度功能;本階段應(yīng)要求ITSM系統(tǒng)能屏蔽多廠家資源池接口的差異性,實(shí)現(xiàn)對(duì)多制式下資源池的統(tǒng)一管理和調(diào)度。
5結(jié)束語(yǔ)
資源池的運(yùn)營(yíng)對(duì)原來(lái)IT服務(wù)管理體系的流程和技術(shù)手段帶來(lái)了新的挑戰(zhàn),應(yīng)該適時(shí)調(diào)整IT服務(wù)管理流程,并適應(yīng)資源池管理要求,逐步完善和補(bǔ)充ITSM系統(tǒng)的流程支撐能力、資源部署和動(dòng)態(tài)調(diào)度、運(yùn)行監(jiān)控、容量管理和流程支撐能力,將資源池的運(yùn)營(yíng)管理納入統(tǒng)一的IT服務(wù)管理體系中,提供更好的服務(wù)質(zhì)量。
參考文獻(xiàn):
[1]陳春華,梁奐.全業(yè)務(wù)電信運(yùn)營(yíng)商的IT服務(wù)管理實(shí)踐探討[J].電信科學(xué),2011(3):118-125.
[2]陳春華,李軍,梁奐,等.資源池環(huán)境下的IT服務(wù)管理實(shí)施策略[J].電信科學(xué),2012(9):142-147.
[3]JanvanBon.IT服務(wù)管理——基于ITIL的全球最佳實(shí)踐[M].章斌,譯.北京:清華大學(xué)出版社,2006.
[4]PeterBrooks.IT服務(wù)管理指標(biāo)[M].豐祖軍,譯.北京:清華大學(xué)出版社,2008.
轉(zhuǎn)載請(qǐng)注明來(lái)自:http://www.jinnzone.com/jisuanjiwangluolw/26516.html