IT服务流程设计和执行

中国人民大学网络与教育技术中心作为学校的信息化建设职能部门,其角色正在由IT技术提出者向IT服务提供者转变,本文总结以ISO20000标准化体系为指导的IT服务管理体系在中国人民大学的具体实践并着重介绍IT服务管理体系落地过程中的流程设计和执行要点。

ISO/IEC 20000是由国际标准化组织ISO发布的信息业服务标准,由BS15000转变而来,而BS15000则是由英国标准协会(BSI)以ITIL为核心发布的。ISO/IEC20000是一个针对管理流程系统的标准,适合IT服务的提供者,既适用于企事业单位内部的IT部门,也适用于外部的服务提供商。通过ISO/IEC20000的认证,意味着提供服务的IT组织,对ISO/IEC20000中定义的管理流程,具有足够好的管理控制力,图1为ISO20000标准化体系的框架结构图。


图 ISO20000 IT服务管理体系框架

由图1可见,ISO20000的体系框架包含了5大流程,即服务交付流程、控制流程、发布流程、解决流程和关系流程,其中又细分为13个具体的管理流程,分别是服务报告、能力管理、服务持续性与可用性管理、信息安全管理、IT服务预算编制与会计核算、配置管理、变更管理、发布管理、事件管理、问题管理、业务关系管理和供应商管理。

我们在学校内部建设IT服务管理体系的宗旨是:通过使工作可记录、可管理、可控制的规范化流程,对技术手段进行整合、转换和提升,最终向用户提供优质服务。

流程执行的过程,有工作阶段的转移,有工作、审批主体的转移,有对其它流程的启动,还有流程间的信息共享。比如,事件管理中,有一线人员向二线人员递交;需审批时可向相关领导递交,批复后递交回来;还可在事件管理流程中启动问题管理流程;问题管理流程又启动变更、发布管理流程;变更管理流程中启动配置管理流程。

主要管理流程的设计

事件管理、问题管理、配置管理、变更管理和发布管理是ISO20000服务管理体系中的5个核心管理流程,也是我们在日常的运维和服务中使用频率最高的流程。

事件管理

事件管理以解决用户的具体服务请求为目的,当发现故障或收到用户的服务请求时,就进入事件管理流程。我们在实践中坚持使用IT服务管理平台,进行事件处理,以便达到可记录、可回溯、可控制的要求。

事件管理流程依据部门的岗位划分,是一个逐步升级的过程,直至最终解决用户的服务请求。大多数事件通过服务台的电话指导就可以解决,服务台不能立即解决的问题逐步交由现场一线工程师、二线工程师进行解决。对于影响较大,需要部门或学校领导进行决策才能解决的事件,称为重大事件,对此我们制订了详细的"重大事件列表"。

关键绩效指标KPI:单位时段事件数量,事件关闭率、满意率。

问题管理

当事件没有得到根本解决,或同类事件较多时,进入问题管理流程。问题指事件背后未知的原因。

问题一般由二线工程师发起,从事件处理流程发起,或根据监控数据的分析独立发起。

在实践中,我们以业务科室作为问题管理的第一责任人,业务科室认为需要跨部门处理的问题,再上升至中心层面而处理。

问题处理的结果是找到问题所在。通过系统,可记录问题分析和解决方案,包括触发的变更、发布过程。同时,可把整个处理中获得的经验,记录为知识库中知识条目。

关键绩效指标KPI:单位时段问题数量、解决率、问题解决后的事件下降率、知识条目数量、知识库有效使用率。

配置管理

对运维管理的对象,在管理系统中有信息记录,记录其支持运维工作所需信息,称为配置项。配置项集合即设备、系统的台账。

在事件管理、问题管理、变更管理、发布管理流程中,将使用这些信息。

在事件、问题处理中,需要对设备、系统的配置进行更改,进入变更流程。完成变更后,应进入配置管理流程,修改配置项内容,以与实际情况保持一致。

凡是需要对其变更进行记录的设备或系统,应建立相应配置项,以便做好运维工作,如空调、电源、网络交换机、配线架、重要系统所在的服务器、应用系统等。

对变更没有风险,不需通过流程控制的常规性设备、系统变更,可不进入变更流程,而只做配置管理。

关键绩效指标KPI:配置项数量、配置项符合率。

变更管理

变更管理,是在事件、问题处理中,或用户对软件系统的需求变动、增加时,对系统、设备的软硬配置或程序进行改变。

变更管理流程的目的是记录和控制变更的过程,避免风险,并提供从不成功变更状态恢复所需信息。

当变更的影响广泛,风险高时,需要进行重大变更流程控制,需要审批变更方案,提交危机处理预案,事前要进行备份处理等,为此我们制订了详细的"重大变更列表"。

在时间紧急情况下,可简化流程,进行紧急变更流程控制。

关键绩效指标KPI:变更数量、成功率。

发布管理

变更管理中,涉及把信息部署在多个实际运行环境的系统组件中,或用户需要知道情况,需要改变使用方式,需要得到资源和指导培训时,进入发布管理。

由于影响面广,所以在变更管理基础上,要进行进一步的控制,如事前评审,以控制风险。要记录发布信息,以便回溯。发布之后,要验证。并为用户提供需要的信息、资源和培训。

关键绩效指标KPI:发布数量、成功率。

其它流程的设计

上述5大核心管理流程之外的流程称为其他流程。这些流程比前面流程要宏观,不是日常的,但应定期执行,以提高IT服务管理水平。这类工作有时容易被忽略。

业务关系管理、服务级别管理和服务报告

A.业务关系管理

业务关系管理的对象是用户,目的是保持与用户的良好关系,这些用户包括学校各部门和个人用户两种类型,主要手段是沟通。

针对部门用户,我们在各单位均已设置专兼职信息员,负责与中心联系;定期召开全校信息员会议,报告服务、建设情况,收集意见和建议,进行培训;通过信息员会议,了解用户的业务和需求。

针对个人用户,中心提供了满意度回访和用户投诉渠道,以进行良好的沟通。

B.服务级别管理

公布服务目录提供服务范围,服务等级协议(SLAs)来定义服务要求。服务等级协议的起点是中心根据各系统资源、运行状况做出的服务承诺,之后可通过全校信息员会议,协商修订。

C.服务报告

服务报告主要报告履行服务承诺的情况,报告可对进行IT服务工作提供指标性信息,可包括事件处理系统数据,可用性,可持续性统计数据,还有运维中的带宽、速率等检测数据,每学期向信息员会议报告。中心每年度向学校信息化领导小组提交报告。

容量、持续性、可用性管理

A. 容量管理流程关心系统的容量是否够用

如各关键系统的CPU利用率,内存使用率,储存空间,授权用户数;主要网络节点的上联链路带宽及高峰使用率,数据交换能力等。

我们对核心机房空调、电源、网络主干、重要应用系统进行不间断自动监测;在重点时段对电子校务系统、校园卡卡系统等进行特别检测。每年提交一次容量分析报告和改进容量状况的管理报告。

关键绩效指标KPI:资源使用率。

B. 持续性管理,强调从中断中恢复的能力。

把重要的系统纳入持续性管理。服务恢复、系统修复工作在事件管理流程中,有时涉及问题管理流程。体系规定,对纳入持续性管理的系统,要有数据故障恢复计划。

每遇到中断事故要进行持续性记录,并在汇总表中记录。每年度,可结合项目申报和规划做一次分析和改进持续性状况的规划报告。

特别是,对重要系统,要提供冗余备份设备、配件,对数据进行备份。体系规定,对纳入持续性管理的系统,要有数据备份计划。通过流程执行,可保证数据备份的按计划进行。

关键绩效指标KPI:年度服务中断次数,年度累计中断时间,本年度最长持续服务时间。

C. 可用性管理,主要关心可用率,比如网络主干的可用率。利用事件记录信息,对关键系统、设备进行定期考察,每年制定一次分析和改进可用性状况的《可用性管理报告》。

关键绩效指标KPI:可用率、5年以上和高故障设备数量、比例。

信息安全管理

日常工作中,中心对一般信息安全事件进行记录和处理;对安全系统进行运维;提供安全服务和资源;进行安全培训。

安全方针和组织机构建设。中心制订和监督执行安全制度、策略,其中包括网络与信息安全等级划分和保护。中心会同相关部门制订、修订安全紧急处理预案。重大安全事件来临时,需要协调网络、系统和应用等部门及相关用户进行处理。

定期通过安全事件分析安全趋势,对信息资产进行风险评估,采取改善措施,消除各系统的安全隐患。

在其它系统的流程执行过程中,考虑安全因素,比如,安全部门可通过变更流程记录、检查督促重要系统的密码变更。

关键绩效指标KPI:安全事件发生数量、安全事件解决率、安全隐患排除数量。

财务管理

财务管理的目的是提高中心员工的成本意识,平衡成本、用户需求和质量的关系。

流程规定除执行国家、学校的规章制度,执行已审批国家、学校项目外、对中心支配资金执行审批制度和按月做财务报告制度。

新项目应为用户增加有价值的服务,或对系统的容量、可用性、可持续性提升起重要作用。学校应依据各流程提供的报告,进行资金使用方向的决策。

定期统计全中心的项目和内部财务支出的总体数额和结构,结合项目完成后的验收、总结、记录、评估各项目的成本和完成目标的效果。

供应商管理

记录供应商的联系方式,了解其产品、服务内容。

对招标过程和合同签订过程进行记录,进行情况通报,由申报者、技术委员会和行政领导参与审议和审批等流程控制。

保管合同等资料。

组织相关科室进行工程验收。没有验收的系统和楼宇布线系统,如果纳入正常运维工作,将由中心负担施工方应负担的质量成本。

根据配置管理中包含的购置时间、合同号等资产信息,申请维修、培训、升级等服务,必要时根据合同与供应商进行商务、法律交涉。

通过对以往工作的总结,评价、记录服务商实际提供服务、产品的质量。

参考文献

【1】《ITIL白皮书》左天祖 主编
【2】《ISO20000-2实施指南 中文版》刘青 译
【3】《实施IT治理:方法论、模型、全球最佳实践》,Gad J Selig著,中治研国际信息技术研究院译 中国经济出版社