卓豪丨八个关键指标,助力企业IT建设!

来源:财讯网 2023-01-30 15:42:10
A+ A-

人们常说“要改进,首先就要衡量”,但是很少有人能提出究竟应该以何标准来进行衡量?

随着IT帮助软件报表功能的不断发展,可对数百种指标进行测量和监控。但这并不意味着您需要对所有这些指标进行衡量,您只需要关注这些对您的服务交付有提升价值的指标和指标进行衡量即可。

本文为您介绍对每个IT服务都具有关键的八个指标,这些指标可以帮助实现基本的IT帮助目标,例如业务连续、机构的生产力、以及使服务可以在预算内合理交付。

它们是

1、营业时间损失

2、变更成功率

3、基础架构稳定

4、工单容量趋势

5、首次呼叫解决率

6、SLA合规率

7、每工单成本

8、软件资产利用率

1、营业时间损失

2010年9月份,维珍航空出现了航空服务上的一次噩梦,大约有5万名乘客滞留,100余航班停飞。而造成此次事件的根本原因在于托管其应用系统的固态硬盘服务器设施出现故障,在随后的数天内,又有400多架次航班出现延误或重新计划。这对维珍航空的在线值机与预定系统造成严重影响。

尽管在SLA的约束下要求立即恢复服务,但恢复服务仍旧花费了11个小时的时间,此外因切换到应急硬件上,又造成10个小时的数据迁移动作。此时,损害已不可避免的产生。尽管11个小时对于维珍当年的IT服务可用影响乎其,但就业务损失而言,此次故障为维珍造成了约1000万美元的损失。

最小化业务运营时间损失的建议

■合理规划和执行业务应用的升级、服务器迁移以及任何IT变更流程;

■拥有一个明确且定义清晰的CMDB,来识别关键故障点、了解网络中的CI关系模型,识别变更失败的级联影响范围;

■针对SLA违反风险及对业务运营时间和收入造成的损失,持续对IT团队进行教育;

■评估IT帮助过去的表现,获得预测和处理中断的洞察力。

许多因素都会造成业务运营时间的损失,根据Gartner的预测和分析,80%影响关键任务服务的中断,为人员和流程问题所引起,其中50%由变更/发布/配置集成过程引发,需要引起IT管理者的注意。

ManageEngine ServiceDesk Plus符合SLA服务级别,确保用户满意

●快速灵活地创建SLA,指定条件并配置相应的响应时间和解决时间。

●提供多级升级策略,有效地追踪SLA的违规情况,确保服务团队的服务质量。

●在用户自助门户,显示事件的状态和处理进度。或通过邮件通知用户。

●通过调查问卷,获得用户的反馈,了解用户满意度。

2、变更成功率

在特定的时间范围内成功的变更数量与执行的所有变更的比率,从而实现更高百分比的变更成功实施。

对于失败的变更没有明确定义,它基本上是任何未能达到变更目的或未能按照计划完成的变更。

在2011年10月27日,由于变更实施失败,阿达里亚证券交易(ASX)不得不暂停交易4个小时。ASX内部网络的升级(目的在于改善交易的延迟)导致交易系统的支持组件和广播网关之间出现前所未见的连接问题。ASX不得不从其一个灾备点恢复交易服务,最后为了恢复正常,变更在当晚回退。

变更实施失败通常原因在于:

■缺乏相关信息,例如变更的影响、涉及的资产依赖关系、变更的窗口以及目标以及所涉及业务的优先等级;

■团队之间协作不畅,导致变更的实施延迟直致失败;

■变更缺乏最终用户与利益相关者的参与。

获得更高变更成功率:

■指定适当的影响分析,详细的推出计划,列出要完成的任务清单;

■在实施之前,从最终用户和技术员那里收集所有相关信息;

■组建CAB,确保严格的审批过程。

计划外变更

另一个应跟踪以建立有效变更管理流程的帮助指标是计划外的变更数量,计划外的变更一般是紧急情况下执行的。例如,由于故障导致的服务恢复变更,或者需要快速实施以避免故障的变更;另外还有由于法务或业务的迫切要求,与恢复服务无关的变更。

尽管对于IT基础架构中允许的计划外的变更数量没有明确的行业标准数据,但此指标仍旧重要,尤其是其数字出现增长趋势或激增时。计划外变更数量的增加趋势表明变更计划不足,同时也对变更的效率产生质疑。可以藉此分析改进变更管理流程,以确保正确的规划和执行变更。

而变更的激增反应的可能时未能预料的重大事故,这种情况往往反馈了基础架构的不稳定,可能对服务可用产生影响,进而影响业务。

ManageEngine ServiceDesk Plus可以全面地管理IT变更,保证万无一失

●配置变更类型、角色、状态以及模板,轻松管理变更流程。

●从事件和问题记录变更,并跟踪状态。

●配置自动化工作流和通知提醒,增进IT与业务部门的沟通与理解。

●指派、计算和分析变更指标,从而不断优化变更流程。

3、基础架构稳定

高度稳定的基础架构具有高可用、极少中断和低服务中断的特点,从而保持高度稳定的基础设施。

衡量和监控基础设施的稳定,从IT服务可以关注以下内容:

■问题资产减少的百分比

■重大事件数量减少的百分比

问题资产减少的百分比

在每天都需要重启路由器、服务器的基础环境中,保持最大可用和更好的服务质量几乎是不现实的。因此,必需识别和更换此类由问题的资产,来确保业务的连续

有问题的资产可能会反复成为服务中断或故障的原因,通过报表可识别,这些资产往往关联了大量的事件。问题资产数量减少的百分比:在特定时间框架结束时更换的有问题的资产数量/在特定时间框架开始时发现的问题资产的数量。

重大事件数量减少的百分比

稳定的另一个主要迹象是IT基础架构上重复发生的重大事件,这可能导致服务中断或服务水下降。重大事件,顾名思义,即影响范围广泛,使业务蒙受关键功能故障的高影响、高紧急度事件。

减少重大事件数量,可以通过有效的根本原因分析(RCA)和减少问题积压来实现。确定根本原因并找到解决方案,可以减少重大事件的发生,减少IT服务的工单数,从而可以反应出架构的稳定

减少问题积压的技巧:

■快速发起RCA,越早越好。RCA越早启动,识别根源原因的机会也就越大;

■快速完成调查,更快的确定根源问题,IT团队可以更快的修复和解决问题,从来确保重大事件不再发生;

另外,管理者也可用衡量这些行动,例如在识别问题后启动根本原因分析,以及完成根本原因分析所用的时间。

ManageEngine ServiceDesk Plus中的资产管理模块包含多种功能,例如:多种扫描资产的方法;基于代理和无代理的方法,条形码扫描,网络扫描等,帮助您导入所有资产。

4、工单容量趋势

IT帮助在特定时间框架下的工单数,优化事件和服务请求的数量,使IT团队更好的处理好工单负载。

怎样处理工单容量趋势:

■识别高峰和低谷以优化资源管理和技术员的工作量;

■构建更优的人员配置模型;

■为IT服务团队设计培训课程;

■分析服务请求模式,并提前计划资产和软件许可;

■验证任何附加的资源申请;

IT服务应注意工单量上的一些趋势,离散的工单尖峰:一个突然出现的工单容量尖峰,可能预示着:

■一个业务活动的高峰期

■IT部署导致的

■服务中断或不可用

■常见问题咨询

■IT中断

■假期后的密码重置请求

逐步的上升趋势:工单生成趋势的上升,可能需要关注:

■机构规模的扩大,导致工单量的增长,需要服务以更为有效的方式为最终用户提供服务

■需要支持更多业务功能,此时服务可以通过了解用户的需求以及期望,合理定义服务规则,让IT帮助团队有序的应对工单增长所带来的负荷

■基础设施稳定下降,问题资产或逾期资产的增多,会导致工单量的增长,这可以帮助IT团队及时识别问题以及资产与问题的相关,进而淘汰问题资产或升级资产来解决问题

ManageEngine ServiceDesk Plus帮助您管理控制工单的整个生命周期。从工单的创建到关闭,您可以有效监控工单处理流程,改善IT服务。

5、首次呼叫解决率

由第一级支持(首次呼叫或联系服务)解决事件的百分比,目标:拥有更高的FCRR。

客户关系指标的一项研究表明,较高的首次呼叫解决率通常与较高的客户满意度相关。服务质量衡量小组的研究,也证实了该观点,FCR每提高1%,客户或最终用户的满意度也会随之提高。同时不可忽视的是,首次呼叫解决也与工单的成本有关。

此外,IT帮助的技术员人员也可能在没有准确解决方案的情况下关闭工单,此类情况可以使解决率上升,但是客户满意度会出现急剧下降。

这里有三个技术阶段,可以让您的IT帮助团队在首次呼叫时完成工单的解决。

第一阶段:学环境

■采集特定环境的知识内容;

■适用采集到的内容补充知识库,创建相关文章;

■定期生成有关经验教训、成就、克服障碍部分的IT服务绩效报告;

■邀请专家评估绩效;

■创建一个操作手册,清晰明确说明支持流程、关键环境信息以及复杂故障的解决程序。

第二阶段:

对第一阶段的工作生成报告以验证其是否有效,并确定要改进的领域。您可以从以下报告开始:

■每个坐席接听电话的占比;

■每个坐席、每小时接听电话的数量;

均通话时间-按坐席人员;

■未关闭的工单,它们被转去了哪里?

■这些被转出的工单,都是谁接收了?

第三阶段:优化

建立明确的流程,保持并提高首次呼叫解决率。该阶段不仅仅帮助您提供FCRR,同时也可以确保工单的正确解决,而不仅仅只是关闭。

此外,若FCRR出现滑下降的趋势,可能的主要原因:

■请求人减少或是系统信息不足;

■技术员人员能力水不达要求;

■知识传递和共享渠道不畅;

根据MetricNet的基准水,全球服务均净FCRR为74%。高级别服务中常见的因素主要是训练有素的代理的存在、知识管理工具的可用以及远程桌面管理工具等的存在。可以参考以下提示来改进FCRR:

■向技术人员传达FCRR的重要;

■针对特定主题,为一级技术人员设计培训计划,帮助更快的解决问题;

■为技术员维护专业的解决方案和知识文章,且权限仅限于技术员;

■在创建自定义表单时,尽可能的设计采集足够的信息,避免周转延迟;

■根据工单参数,将工单自动转派给对应的支持组或人员。

6、SLA合规率

在协议的SLA时间内所解决的事件百分比,保持最大化的SLA合规率。

追踪SLA的合规率级别可以帮助IT帮助

■确定服务水是真实且可实现的;

■根据与最终用户协定的服务水检查服务能;

■确定IT帮助应改进的领域、优势及劣势。

若技术员在没有适当的解决方案情况下关闭工单,仅仅是为了避免SLA的违反,这种情况下SLA的表现虽然较高,但最终用户的满意度水必然受到影响。

SLA合规率可能会因为各种原因而导致降低,但是,也务必注意以下可能

■您的服务团队是否了解业务需求,这可能会导致无法满足业务需求的服务级别协议,或者故障单并未按照正确的分类或优先级指派而导致违法

SLA;

■对于影响关键任务服务的中断风险及其业务响应,是否缺乏适当的沟通;

在上述场景下,IT服务团队必需了解业务的真实需求,并酌情重新制定SLA。

案例场景:当出现SLA无法提供帮助时

SLA及SLA合规对于确保业务的连续至关重要,然而来自一家水泥制造企业的案例强调了,SLA还需谨慎设计。

该企业的帮助无法即时响应卡车的调度问题,但在所设计的SLA内确实又解决了此问题。但不幸的是,水泥硬化在一小时内将会开始,也就是卡车必需在1小时内将制造的水泥运送至目的地。而企业的帮助并未意识到此点,也并未在设计SLA时考虑这些因素。结果就是,服务并未违反SLA,而水泥出现硬化,影响企业业务。

另一个需要引起足够重视的就是不断降低的SLA合规率。

造成合规率下降趋势的原因可能有:

■不切合实际的服务水协议;

■缺乏对SLA及违反SLA风险的认识;

■缺乏适当的监控和升级措施;

■缺乏技术专长;

■未分配工单、延迟或错误的工单分派。

保持SLA合规率可以参考以下措施:

■根据业务需求以及IT的能力设置切合实际的SLA;

■向业务和技术人员传达SLA和违反SLA的风险;

■设置必要的升级规则;

■自动化工单的分配过程;

■为技术员设置必要的培训计划。

7、每工单成本

IT支持每月的运营成本除以月工单量,保持低程度的每工单成本。

根据MetricNet, 以下为2014年工单的均成本基准。

行业标准 – 高密度环境下的每工单成本

行业标准 – 低密度环境下的每工单成本

不同密度下的情况可以看出,服务请求的成本会高于事件的成本。这是因为事件通常需要更短的时间去解决,而服务则相对需要花费较长时间。因此工单的成本很大程度上会受到工单类型的影响。

在大多数的机构中,IT往往被认为是成本中心,而且通常是在财务紧张期间被后前削减预算的。而即使IT支出减少,IT支持仍旧需要保持高效。每工单的成本是一个关键的服务能指标,可以帮助IT支持分析其在给定的预算框架内处理工单的效率。目标是始终保持每张工单的最佳成本水

但是,需要注意的是,高于均水不一定是坏事,低于均水也不一定是好事。

上图的场景可能意味着IT服务团队正在牺牲服务的质量来换取低的工单成本,这会导致客户满意度水的降低,形成恶循环。

优化工单成本的关键因素是能够快速解决工单,减少不必要的升级,可参考以下建议:

■分析服务请求模式,提前规划资产和许可证的采购,减少关闭服务请求所需的时间;

■识别高峰和低谷以优化资源管理和技术人员的工作量;

■对工单进行正确的分类及优先排序,减少错误的工单分派,帮助提供快速的解决方案;

■构建可用、有效的知识库。

8、软件资产利用率

企业实际使用的软件产品和许可证的百分比,最大化软件投资的ROI(投资回报)。

软件许可是IT支出的重要组成部分,因此跟踪软件的利用率非常重要。然而,这也是在IT服务中讨论最少的指标之一。

为便于管理,我们可以将其分为:

■第一类:最需要关注的软件,即具有高的业务影响、许可成本或合规风险的。

■第二类:需要较少关注的,如免费软件,AdobeReader等。

■第三类:禁止的软件和恶意软件。

使用量与计拥有的软件的比率

该指标有助于识别对组织没有任何价值的软件采购支出。理想的情况下,该比率应接1,这意味着所有购买的软件都得到了有效的利用,从而确保了最大的投资回报率。而如果第一类软件大量出现在未使用的列表中,则意味着软件资产支出的主要部分是闲置软件。

未分配许可证与许可证数的比率

该指标有助于分析特定软件的许可证利用率,帮助IT团队提前计划许可证的购买。为获得最大的ROI,该比率应尽可能的小。较高的比率意味着软件存在过度的许可,这也是没有回报的闲置资产。

许可合规率

另一个可能给组织带来成本的重要软件资产管理指标就是许可的合规率了,保持最大的合规,可以使您的组织免受行政处罚和罚款。参考以下技巧来实现最大的合规

■跟踪所有软件安装和许可购买;

■将许可分配到每个软件安装,以查证许可过度、适量或缺少的软件;

■为软件购买合适的许可类型,例如为核心软件购买永久许可,避免许可到期而引起的合规问题;

■对合规和审计准备情况进行正式的内部评估。

采用三步预审计来却得最大的合规

01第一步:差距分析

■向供应商索取供应给您组织的所有软件程序清单;

■识别并确定企业正在使用但不在供应商提供的列表中的软件;

02第二步:合规分析

检查软件安装数与为每个软件所购买的许可数,确定许可过量或许可不足。

03第三步:软件许可优化

综合前述信息,重新规划您的软件购买,优化合规

写在最后

这里我们列出的8个服务重要指标,它对于确保业务连续、提高组织生产力以及在预算内按时保质交付服务是重要的,它可以帮助您建立起一套衡量引擎,以不断驱动和提高您的服务绩效。

此外,在此之前,您还应了解IT帮助所支持的业务,使IT帮助的目标与业务目标保持一致,而后确定对这些帮助目标至关重要的指标和指标,然后开始不断进行衡量。

ManageEngine ServiceDesk Plus从根本上转变了IT部门的工作模式,它为IT问题的处理提供超强的可视和集中控制力,将IT服务管理从救火式的抢修模式升级为针对IT的隐患预防,避免组织机构业务经历宕机等严重事故,提高整个IT团队的生产效率,进而改善最终用户的满意度。

10年来,ServiceDesk Plus已经帮助数以百万计的IT人员、最终用户和利益相关者提升和优化IT服务质量。

官方网站可免费下载软件试用:https://www.manageengine.cn

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:kj005
文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com

相关新闻

精彩推荐