系统维护
02 维护流程(闭环)
维护团队应制定运维管理目标,建立完整的运维管理制度和程序。明确管理组织架构和责任,运维团队应根据职责、工作范围和工作任务配备响应的人力、财务、物资和办公资源。
A级数据中心应24小时值班,B级和C级数据中心宜按照电子信息设备负载的重要性确定值班时间。运维人员应按照巡检计划、周期、规定线路对基础设施系统及运行环境进行巡检,巡检记录及时、完整、真实、清晰。
A级数据中心每日现场巡检次数不应少于2次,B级和C级数据中心每日现场巡检次数不应少于1次。
预防性维护
清除机柜内外综合布线系统上的灰尘。检查综合布线纤架的平镇都,如果发生变形、支架螺丝脱落等与安 装图纸不相符的情况应立即修复。检查双绞线、配线架、跳线、机柜上的标识标签,将脱落的标识标 签补全,将粘连不牢固的标签固定好,更换有损伤的标识标签。变更后的跳线,应及时记录变更状态。
预测性维护
数据中心维护周期内,使用性能测试仪对重要铜缆信道和未使用的光 纤信道进行检测;正在使用的光纤信道,容易受磨损和灰尘影响,不进行检测。
故障维修
确认故障现象,初步判定故障所发生的位置(精确至链路/信道),并将故障缩小至综合布线范围,通知相应的部门维修。
专业人员未到达前,根据预案使用备品备件进行线路应急修复,优先 保障信息传输,再交给维护人员予以完善的修复。
对故障情况及时进行记录,记录手段包括文字及故障位置的照片。这 些记录需长期保存,并定期进行统计和分析,确定综合布线系统的整 改计划。
故障排除过程中,现场运维人员的综合布线水平对于排除故障至关重 要。应加强对机房管理人员进行综合布线水平和故障排除技能的反复 训练,备足所需的备品备件、应急工具等。同时可为专业维护人员修 复线路提供有价值的参考意见。
工单开启
用户端发现故障后可通过电话或线上填单等方式进行报修,如有监控中心,告警信息会在自动发送至云端或运维服务器。
工作分配
接到告警或保修信息后,分配相关专业运维工程师进行故障判断和分析。如遇到紧急事件或运维工程师未解决相关故障,相关问题将升级至专家组进行判断并提供相关解决方案。
解决方案
轻微或一般故障可远程解决,运维工程师或专家组将在线解答或电话指导。
严重或紧急事件无法远程解决,运维工程师、原厂工程师或专家组按照规定的时间上门排查故障,进行维修、更换等操作。
工单结束
故障排除后,运维人员应记录故障原因、解决方法、完成时间等相关信息。用户端可采用线上确认、电话确认等方式,结束排障事件。
我们将本着故障处理优先原则,力争提供低成本高质量的维护方案,做到故障处理的一线服务标准。
参与评论 (0)