数据中心自动化运维管理及平台的建设   

作者: 时晓磊 徐 彦   时间:2021-11-06 14:14:37  来源:  阅读次数:36次 ]

   天津市普迅电力信息技术有限公司 天津市 300308

    摘 要:随着科学技术的发展,信息技术交换传输、统计分析、存储备份数据中心等,在信息建设中十分重要。加强数据中心管理,实现数据中心运维管理自动化,可以有效节约实际人力成本。基于此,文章就数据中心自动化运维管理与平台建设展开分析,希望能促进数据中心管理工作开展。

  关键词:数据中心;自动化;运维管理;平台建设前言:

  自动化运维即自动化软件在计算机中的操作与控制过程。随着自动化技术的应用,其可以有效提高运维效率,减少人为操作时间。运维操作期间,联合自动化技术与科学管理方法,认真遵照运维规则,可以确保计算机数据中心进行自我维护与管理。

  1 运维自动化内容与工具

  1.1 内容

  计算机运维发展历程十分漫长,当前已经发展为海量数据中心,且逐渐实现运维自动化状态,以大数据为基础,加强计算机运维自动化管理,逐渐变成运维人员解决的主要问题。在日常检查、配置变更与软件安装运维期间,自动化管理逐渐替代传统人工操作。借助运维自动化能消除运维中的延迟情况,避免延迟运维工作中的延迟情况。此外,运维自动化系统可以帮助运维人员重复日常工作,便于在节省时间期间,不断提升实际工作效率。

  另外,自动化运维能提前预测故障,便于帮助运维人员预防消防隐患发生。

  1.2 工具

  企业运营期间,自动化工具应用能实现运维自动化,具体包含运维监控、诊断优化、运维流程自动化等工具。

  (1)自动监控:现阶段,很多企业运维系统日渐完善,但运维人员和被管理者数量比例日渐失衡,且难以及时发现其中的风险与故障。监控自动化可以对工作期间的业务运行、计算机组件、处理效率等情况进行主动监控,便于及时发现运行故障,接着将故障信息传到用户手中,便于提前进行故障预警。

  (2)变更自动检测配置:因运维对象数量较多,变更量很大,频率相对较高,运维人员工作任务大,故而使得很多流程与制度执行难以落实。且若计算机设备配置参数改变,很容易导致变更流程,然后将信息传到运维人员手中,借助自动化测试可以有效帮助运维人员查找和维护配置。

  (3)自动提示待维护事件:传统计算机运维期间,运维对象引起的事件,因事件分级不合理,故而导致工作人员难以及时发现紧急事项。为了确保维护实现自动化,运维人员应借助监控系统服务管理平台,传递相关信息,便于提升管理透明性,当遇到突发事故期间,系统会及时发现并开启报警信息,接着将上述信息传到运维技术人员手中。

  (4)自动生成维护记录:技术人员应定期检查和维护计算机设备运维系统与硬件配置,再者,还应定期做好计算机系统运行状况信息采集和分析,借助系统阶段性监督和归纳,定期提供运维系统应用情况和分析汇报。

  2 自动化运维管理应提升的功能

  (1)自动监控:在自动化运维管理逐渐普及和运维系统快速发展中,运维人员越来越不能满足实际管理需求,更加难以及时发现其中存在的风险,故而使得后果越来越严重。所以,自动运行与维护监测工作开展,有助于数据分析与评估操作风险,然后将结果报告传到管理员手中。

  (2)变更配置:具体操作与维护期间,随着工作任务的增加,使得软件配置中出现很多信息遗漏,基于此,有必要自动检测并更改实际配置,具体可以让操作与维护人员利用远程控制模式,对软件配置与设置信息进行检查,若情况不同,一定要借助远程配置法更改软件配置触发器,便于开展自动化操作。

  (3)自动提示:维修与作业工作十分复杂,实际操作对维护与操作人员要求较高。操作维护管理期间,自动维护与操作平台应合理划分任务类型,同时遵照实际流程执行各项任务。但实际应用期间,经常会发生维护平台故障与自动操作故障。随着故障的产生,自动运行维护平台会及时将报警信息传到操作人员手中,便于对员工问题进行合理指导。

  (4)自动记录维护:为了有效追踪自动化运维系统,除了要认真记录各项生成数据外,操作人员日常检查期间应认真记录检验过程。具体操作期间,维护人员应利用维护记录掌握不同故障与解决方案,便于提高自动化操作与维护平台可靠性。

  3 数据中心自动化运维平台建设

  3.1 自动化运维的创建

  (1)运维自动化管理平台的创建:创建运维自动化管理系统,能促进计算机运维管理自动化,借助自动化运维管理系统,还能及时采集并处理系统故障。运维管理平台能实时管理并监控计算机设备。借助监控海量网络与服务器等不同节点情况,可以准确预测故障并对故障位点进行合理定位。

  (2)系统故障自动触发流程的创建:运维自动化平台工作期间,碰到设备故障问题,系统会自动发出警报信息,在汇报故障期间,不管是系统还是人工汇报,都要避免在系统屏幕中使用红色标识。在获得故障信息之后,运维人员需要遵循步骤进行操作。

  所以,企业应提前创建流程化故障处理机制,当遇到异常设备问题,会立即触及相关事件,接着及时将流程处理程序发送到运维人员手中,保证运维人员及时按照实际流程开展各项工作,从而不断提高实际运维效率。

  (3)创建规范事件跟踪流程:为了确保计算机运维自动化管理,应先创建流程化事故和时间处理机制,借助表格工具记录异常故障情况,同时定期总结记录信息,利用总结分析寻找故障发生原因。结合相关实践,创建事件流程化与处理机制,减少不规范操作,认真执行计算机运维操作,全面降低系统故障概率。

  (4)创建运维关键流程:信息技术运维管理者需要为运维部门制定最佳工作流程与职责,再者还应给出工作流程内涵,说明各项关键流程对企业建设的意义,同时,积极创建事件处理机制。

  另外,设置运维关键流程自动化期间,应优先处理紧急事件,然后处理常规事件,针对特殊运维人员,应按照一定优先次序,提升事件处理质量与效率。

  3.2 自动化运维平台建设方法


本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除! 快速论文发表网(www.ksfbw.com)本中心和国内数百家期刊杂志社有良好的合作关系,可以帮客户代发论文投稿.

投稿邮箱:ksfbw@126.com
客服Q  Q: 论文发表在线咨询82702382
联系电话:15295038833

本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除!

广告推荐

文章评论

共有 0 位网友发表了评论

阅读排行

推荐文章

最新文章