《空气和水》ITMS 系列 -- 运维人员
人是目的,而非手段
运维软件服务的是运维人员,管好 IT 资源也是为了给用户更好的信息化体验
现状
H 所面对的客户,目前有这样一些困境
- 与维护的 IT 资源数量,和服务的信息化用户相比,运维人员相对缺失
- 除较少的编内人员,还可能会有代维、驻厂等三方人员,且这些人流动性高,水平一般
- 与校内的其它部门相比,信网中心与教育教学的相关性较低,分到的经费,得到的关注都可能有限
- 部门一把手可能是空降的,并不一能具备相关的专业知识。但却又是能分这块不大的蛋糕的人
我们把软件的使用者分为三类,希望能够站在不同的角度去思考功能设计
管理员 Admin
关键词: 知识 经验
网在心中,手拿把掐。不一定是部门的领导,但是技术绝对的大头
运维软件要想能落地,转起来,首先要去讨好这些人,取得他们的信赖,哄着他们把心中的网,记录到系统中,即所谓的 CMDB
- 基本信息: 管理 IP,访问凭据
- 资产信息: 合同,维保,备件,配件
- 归属信息: 资源谁用的,子网划给了谁,域名谁申请的,策略为谁服务
- 地理信息: 园区,机房,机柜信息资源与所在位置
- 综合布线: 从用户接入的 AP 或面板网口,到园区网出口,一些是可以通过 DP 协议计算的,更多的如这个接口出去连到哪个楼的哪个房间,是人工录入的
- IP 地址规划
- 出口配额
还有要管好 IT 资源所需要的经验和知识,不仅限于知识库,还有结合自身情况,适应部门运行的各种细化的设置
- 告警相关: 细化的阈值,自定的等级,何时发通知,要不要升级
- 看板与报表: 定制实用的看板,配置周期性报表
- 常用信息: 快速故障恢复
- 实用信息: 实用工具,实用命令
这些信息记在心中,停留在纸上,都没有录入系统能发挥更大的价值。信网中心,人来人往,唯有电子化、信息化才能最大限度的共享信息,分享价值。信息化中心自身的信息化,本就该是其它部门的标杆模范
这样的管理员是行业中的中流砥柱,与他们站在一起,倾听他们的需求,是好的运维软件替客户着想,为客户分忧的前提
在这些信息的收集上,真应该向游戏学习。你做对了什么,立刻就给正反馈,引导用户不断地按照游戏策划设想的那样去玩这个游戏。反观运维软件,又想从管理员那些套取大量信息,又没有明确及时的正反馈,这软件怎么能落地?怎么能真正在运维工作中发挥作用呢?怎么能产生用户粘性呢?
运维人员 Operator
关键词: 时间 绩效
虽说我们希望系统或软件替人去完成那些简单、机械、重复、低价值的工作,但诸如设备上下架、布线、出现场等还是要人工的。运维软件的价值,就是把系统先把能做的都做了,然后再所谓的 人在回路
工作台
H 倾向于在真正干活的时候,系统提供一个工作台看板。这类似游戏中的任务板,任务板上没有任务,或者看板中一片绿,说明万事大吉,我可以继续摸鱼。任务板上有任务了,那我就开始干活
任务也应该是由系统判断后,精心处理且分门别类的呈现在工作台上。每一种分类的任务不能太多,会给人一种虱子多了不痒,债多了不愁的懈怠感。H 见了太多的客户,告警列表里躺着几百几千条,从最近到一年前发生的,未处理未恢复的告警。
可能分类有
- 告警: 现在而今眼目下,你的什么东西出问题了。系统已经帮你排除了 a, b, c…几种原因,还剩 d, e, f…种可能;也自动的按照 1, 2, 3…尝试恢复,但未能成功,需要你来介入一下。这些告警应该有一个合理的严重等级,可以是根据事件类型,影响范围,影响对象(大领导办公室的 AP,就影响一个人,但你说比不比宿舍楼的重要吧)。常用的事件等级有 CRITICAL, ERROR, WARNING, INFO 等。但可能还不够,归于某一等级的告警还是太多。还有许多帮助给事件排出个一二三顺序的方法,后面详见事件及告警篇
- 信息完善: 有一条链路可能变动了,确认一下;有一颗 AP 可能更换了,确认一下
- 提醒: 某些资产维保要到期了;机柜的空间容量不够了;某些软件的授权要到期了,你也不希望到时候全校分不到地址吧
统一处理带来方便考核
分类带来知识积累、效率与专精
领导 Leader
关键词: 容量 业绩
领导从宏观的角度看问题,自然可以看成是各种模拟经营类游戏的玩家。试想,哪个模拟经营类游戏没有几个面板,告诉玩家你的资源现在有多少,用了多少,运行得多平稳高效,达到了多大规模,服务了多少用户,助力了多少发展,(击败了百分之多少的同行)。系统就应该提供这些情绪价值
- 大屏: 精心设计的,突出容量、用量
- 报表: 月度的、季度的、年度的
- 总结: 面向最终用户的,能让他们体会到信网中心和重要性,体会到中心领导的高瞻远瞩和辛勤付出