税务系统某单位信息系统集中监控管理项目

解决方案&成功案例 > 安全 > 税务系统某单位信息系统集中监控管理项目

项目背景

随着税务系统某单位IT机房规模不断扩大、业务量逐渐增大、数据量爆发式增加,对机房的运维管理也变得越来越重要。一旦IT基础设施资源出现问题,没有及时得到妥善解决,将会造成严重的损失,因此加强IT机房运维管理,保证7*24小时基础资源正常运行,避免各种故障发生,优化改进传统运维模式,提高IT服务的及时性和满意度成为当务之急。

本项目计划针对机房基础设施资源建设一套完备的监控管理和优化服务系统,7*24小时检测基础设施运行状态及各种资源状态信息。运维管理人员可以依靠流程管理系统及时排除故障,控制运维质量,提高服务水平,避免造成重大损失。


解决方案

解决方案目的

本方案通过对机房动力环境、硬件、软件、系统、应用、网络等设施进行全面监控,结合自动化运维技术,及时发现并解决问题。通过底层融合的多种数据源,构筑大数据分析平台,基于统计、合规等分析,把数据变成有价值的信息;融合机器学习算法生成智能决策系统,完善自动化运维技术,保障机房设备安全,提高基础设施可用性,确保机房内部网络系统安全、高效运行,确保业务安全、稳定运行。 


      充分考虑系统建设的过程特点及产品生命周期,使系统具有高度可扩充性及可维护性,适应用户机房及监控设备的扩建、搬迁、撤销、扩充、低维护成本等要求,需建设一套稳定、经济、先进、实用的通信/计算机信息系统综合安全监控与管理系统。

通过信息系统集中监控管理平台实现“集中监控、集中维护、统一管理”的维护管理模式,将机房硬件设备、软件、系统、应用、网络、UPS电源、空调设备、温湿度监测等设施在统一平台上实现集中监控及对外报警;结合机房管理制度对所有信息、报警事件进行记录,通过报表管理程序进行查询、确认、排序、打印等操作,通过系统及时、准确、全面反映与掌握机房的运行状态,保证各业务系统正常运行并达成如下目标:

1、强化主动监控,实现集中管理

以实施资源可用性监控为主线,构建统一集成的机房设施资源及应用服务监控平台,能够主动、及时发现问题并调度资源解决问题,形成机房运维管理的主动服务模式。

2、帮助定位故障,快速恢复系统运行

建立集中告警分析及展示平台,提供灵活、自动化的事件处理能力。当故障发生时可以快速定位,发现故障原因并调度资源快速恢复系统服务,缩短故障解决时间,降低维护成本,提高系统整体可用性。

3、掌握基础资源质量与效率,合理利用资源

通过信息系统集中监控管理平台,实时了解机房全部资源的负载与使用情况,根据需要从整体角度考虑资源使用,并根据业务高峰期调剂业务系统对资源的使用。

4、规范运行管理,有序开展维护

参照机房运维规范对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化、管理过程规范化。根据相关制度进行运行维护管理,对内完善流程、加强管理,对外提高服务质量、提高工作效率。

5、共享运维经验,完善知识库

把运维过程中产生的丰富经验进行总结积累,形成有效的知识库并建立知识共享机制,提供信息共享和交流平台,有效提高机房运维人员的业务能力、技术能力和解决实际问题能力。

解决方案实现

监控管理平台结构

监控管理平台采用“集中管理、统一控制”的模式实现硬件、软件、系统、业务等集中管理、统一控制。对机房设备信息及业务信息进行实时采集、分析、处理、存储、联动、管理和控制,包括:服务器、存储、虚拟化、操作系统、数据库、中间件、环境检测、负载均衡、UPS电源、空调设备、温湿度监测等。

监控管理平台部署在机房监控中心控制室,与各设备、软件、应用等通过相应的采集方式实现数据采集和控制管理,在后台进行数据关联分析,并在前端进行大屏幕展示和相应的报警处理。


主要流程

1、监控服务器将采集的数据存入数据库进行信息过滤、综合、分类、分级等预处理,再经过关联分析处理后将信息发送给上层网络和系统资源管理层进行统一呈现;对发现的问题发送给事件处理平台处理。

9.png

2、自定义Trigger实现告警,支持对告警的确认、清除等操作,方便运维人员协同工作。到达预警值自动发送邮件或短信给管理员或运维人员。

3、各类型的 TopN 报表,能有效帮助用户预警、评估服务器、网络设备的容量和可持续能力。

4、提供丰富视图以支撑各种运维场景,方便运维人员实现简单、快捷的运维,包括系统首页、资源分组视图、资源详细信息视图等。

      监控方案按照分布式架构设计主要分三层:最底层为基础设施资源层,主要是机房网络的各种设备、软件、应用等;第二层为数据模型层,进行数据的采集、存储和分析,建立分析模型;第三层为应用层,根据数据分析给出分析报表,进行监控预警以及资源的大屏视图显示,满足运维人员、相关领导等不同角色的信息查询和展示需求。

方案架构图

10.png

图1 基础资源监控架构简图


监控管理平台拓扑

11.png

图2 基础资源监控实际部署图


关于中铁信
了解中铁信 企业资质 联系我们
产品介绍
自主产品 代理品牌
解决方案
解决方案
成功案例
成功案例
人才招聘
人才招聘