为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > IT综合运维管理系统技术方案

IT综合运维管理系统技术方案

2019-10-10 30页 doc 331KB 35阅读

用户头像 个人认证

橙子到此一游

暂无简介

举报
IT综合运维管理系统技术方案IT综合运维管理系统技术方欢迎阅读欢迎阅读欢迎阅读案目 录第1章项目概况 91.1.项目总体背景 91.2.项目的总体思路 9整体思路 9建设与管理范围 9达到的效果 101.3.综合运维管理系统 11系统简述 11架构和功能 12第2章需求分析 132.1.总体要求 132.2.需求分析 142.3.建设目标 14第3章整体架构设计 153.1.实施范围 153.2.网络系统管理模式 163.3.统一的网络系统解决方案蓝图 16代理方式与无代理方式结合的设计 16数据库设计考虑 173.4.平台总体设计 17设计要求 17结...
IT综合运维管理系统技术方案
IT综合运维管理系统技术方欢迎阅读欢迎阅读欢迎阅读案目 录第1章项目概况 91.1.项目总体背景 91.2.项目的总体思路 9整体思路 9建设与管理范围 9达到的效果 101.3.综合运维管理系统 11系统简述 11架构和功能 12第2章需求分析 132.1.总体要求 132.2.需求分析 142.3.建设目标 14第3章整体架构 153.1.实施范围 153.2.网络系统管理模式 163.3.统一的网络系统解决蓝图 16代理方式与无代理方式结合的设计 16数据库设计考虑 173.4.平台总体设计 17设计要求 17结合BTIM的平台总体设计 18信息系统综合网管系统系统软件的选型 19设计要求 19数据采集层技术设计 203.5.数据管理层技术设计 20设计要求 20数据管理层技术设计 213.6.其他技术设计 21设计要求 21相关技术设计 223.7.平台功能扩展设计(接口方面的设计) 25第4章综合管理系统功能 264.1.综合网管系统架构图 264.2.综合监控 27综合监控的优势和亮点 27管理监控与值班监控的功能 28设备运行的功能 29线路流量的功能 29峰值流量的功能 30环境监控的功能 30告警总览的功能 31服务总览的功能 314.3.网络拓扑管理 32网络拓扑管理的优势和亮点 32自动发现生成网络物理拓扑图 33基于IE的拓扑浏览 37拓扑图监视 41网络拓扑图编辑 43常用工具的集成 44性能排序 45图例管理 474.4.网络监控管理 48网络监控管理的优势和亮点 48网络监控管理详细介绍 48设备负载一览的功能 50线路流量一览的功能 50性能分析的功能 51端口流量分析的功能 52交换机用户连接信息的功能 53交换机VLAN分布表的功能 53其他网络监控功能 544.5.设备面板管理 54设备面板图管理 54网元配置参数备份 55自动识别堆叠式设备 55关闭/打开端口 55划分,VLAN自动辨识 55更改VLAN 55端口状态 56端口下联设备 56设备支持 564.6.接入管理管理 56地址管理 57安全管理 614.7.数据流分析 67功能描述 67数据流分析的优势 67功能实现 68功能特点 724.8.主机系统服务资源管理 73系统和通用应用数据采集 74主机管理 77数据库管理 80中间件管理 83应用管理 88系统和通用应用故障管理 89告警管理通知方式 93数据传输安全管理 944.9.业务管理 95业务结构 95业务运行管理 97业务安全管理 99业务使用与流量分析 100根原因分析 102业务报表 104用户模拟体验功能 1044.10.存储管理 106存储管理的优势和亮点 106部署方式 107产品特性 1084.11.虚拟化管理 112虚拟化管理的优势和亮点 112部署方式 112产品特性 1134.12.故障告警管理 119故障管理的优势和亮点 119故障管理详细介绍 120基线数据管理的功能 123告警日志查询的功能 124辅助查询的功能 125干扰设置的功能 125其他告警 1264.13.报表管理 128报表管理的优势和亮点 128报表内容说明 129报表展现类别说明 129报表提供方式 1304.14.机房管理 1334.15.统一监控平台 134服务拓扑展现功能说明 134运行展现功能说明 134告警展现功能说明 1374.16.系统管理 137系统管理的优势和亮点 137用户管理的功能 137用户操作审计的功能 138当前在线用户的功能 139当前用户编辑的功能 139网管邮件发送帐号的功能 140第5章综合运维系统功能 1405.1.建设思路 1405.2.系统概述 1405.3.平台架构 1415.4.基于ITIL功能模块 142自助服务平台 142服务台 143事件管理 143问题管理 145变更管理 146发布管理 147资产配置管理 149作业管理 152知识管理 152服务级别管理 153排班管理 1545.5.运维系统功能 155门户平台 155接口管理 155流程设计 156报表设计 158流程监控 1595.6.硬件&基础软件 160硬件构成 160故障恢复 161第6章项目管理与实施计划 1626.1.项目总则 1626.2.项目组织机构 162组织架构保证 162人员稳定 1636.3.项目进度计划 1636.4.项目范围内容 1646.5.项目实施地点 1646.6.项目进度管理 1646.7.项目变更管理 1646.8.项目质量管理 1656.9.服务内容 1666.10.项目管理 1676.11.项目交付成果 1676.12.实施准备 1696.13.实施人员清单 1716.14.实施工作进度计划 1736.15.实施技术资料 174第7章培训方案 1767.1.培训总论 1767.2.培训内容 176培训课程表 176课程内容简介 176培训资费 179第8章售后服务与日常运维方案 1808.1.服务宗旨 1808.2.北塔软件售后技术支持服务提供的内容 1808.3.北塔软件售后服务网点 182项目概况项目总体背景随着某院信息化建设的快速发展,在新一代运载研保条件信息化项目完成后,拥有多台Windows服务器,多台用于高性能计算的Linux服务器、多个应用系统、多台网络路由交换设备以及近千台终端。面对如此庞大数据量的应用系统和信息设备,依靠某院信息中心目前的运行维护队伍,进行服务器及网络系统的状态监控、配置管理、故障修复、应用维护,还要包括系统开发和后续系统建设,是根本无法完成的,将极大的影响信息化系统的稳定可靠运行能力。尤其是配置管理和状态监控完成依靠人格经验和手工记录完成,造成系统变更不受控制、故障无法预警等问题,严重的甚至影响应用系统的稳定运行,对科研生产带来严重的影响。另一方面,自从开展新一轮军工一级保密资格认证工作,按照新标准保密工作工作量成倍增加,如涉密人员流动频繁;信息系统的普及产生多种形式涉密载体,涉密设备和载体如何账物相符管理难度较大,协作配套项目多,协作单位的交流保护核心技术;日常的保密#管理制度#落实程度等等。依靠传统两三个管理人员,纸质账本登记的方式难以为继,需要通过信息化的手段,提高保密日常管理工作效率和监督的检查的能力。基于以上原因,需要部署信息系统运行维护管理系统,完成运维管理、效率评估、设备状态实时监控、配置变更统一受控、客户端信息集成管理和技术服务标准、流程化等功能。项目的总体思路整体思路项目要在整体统一规划的基础上,采取分阶段、分步骤的策略对现有的信息系统综合网管系统进行建设,实现某院的网络设备的集中监管和维护,通过集中部署管理方式、实现对网络设备的集中监管,全面建成实现某院一体化统一信息系统综合网管系统平台,实现整个院所IT基础设施的集中监控、集中管理和集中维护,全面提高某院IT基础设施运行、管理和维护水平。建设与管理范围此次综合运维管理系统建设范围覆盖某院整体IT信息设备,系统部署在某院本部。达到的效果某院综合运维管理系统的全面建设,将为某院基于信息化系统的各项业务和工作的顺利开展提供坚实的技术支撑,为科研项目的生产和管理活动提供良好环境和坚实的基础保障,IT部门作为项目成果的使用者、管理者和直接受益者,将从不同角度和层面感受到项目所产生的变革,具体价值体现为:给予IT部门一个全局化的管理视角,能够杜绝信息系统运转过程中的黑箱现象,避免管理死角的出现。通过简单直观的图形管控手段替代传统上不直观、不友好的管理界面,通过图形、动画、数据等多媒体手段的集成全方位展现整体信息系统动态运转情况,让管理人员对信息系统的运行情况做到全局掌握和实时了解,及时发现异常或问题,从而迅速介入和及时处理,做到问题早发现、早解决,提高对电力超高压检修信息系统运行管理质量和保障能力。提供对多厂商、跨平台异构IT系统的统一管理支持,由管理平台屏蔽它们的底层差异性,采取统一的管理维护方式,从而简化管理、降低管理难度,避免重复投资导致的资金浪费,实现经济好省。管理覆盖全面,实现对某院构成的各要素、各环节进行全面监控,主要是数据交换平台(网络)、安全,管理平台开放的体系架构和高度的可扩展性不但能够充分满足当前的管理需要,而且能够充分适应未来管理发展的变化,快速实现对新技术、产品的支持和适应,保护现有投资,实现向后兼容性。提供丰富的展现和分析手段,资源使用、系统负荷压力分布一目了然,为有效评估和科学评价提供帮助,确保资源的分配与使用更加科学合理;提高IT部门响应速度和支持保障能力,具备从容应对各种突发事件的能力,通过统一平台的主动检测监控,实现各种问题的及时发现、分析、定位并提供一系列管理手段帮助实现故障的快速诊断和精确定位,帮助管理维护人员迅速锁定故障根原因,从而采取正确的措施迅速排障,最大限度降低故障对业务运转的影响;为多部门、多专业进行高效协同提供统一平台,使不同岗位和专业的管理人员,各司其职,相互协调,相互监督,运转流畅,使信息运维管理工作步入管理化、管理科学化和办公现代化的轨道;详实的运行维护数据为推行量化的精细管理奠定了基础,解决了IT部门进行有效绩效考评的困难,为上级部门和主管领导客观评价IT部门的工作成效提供了有力的论据,也有助于IT部门客观检查、审视自身工作,总结成绩、经验,发现不足,制定改进计划,持续改进、提高和优化信息管理维护工作;准确掌握问题、故障的多发点,从设计、运行、管理等多环节切入寻找影响系统正常、稳定和可靠运转的关键因素,为深入优化、升级、改造提供有力的数据支持,从而确保信息管理和决策的科学性。集成安全管理,统一管理监控入口,及时捕捉影响系统安全的各种风险因素,提高信息系统整体安全性和坚固性;变被动的响应为主动监控;变事后修复为事前预防;变复杂操作维护为简单管理;变孤立分散管理为集中统一管理;全面扭转IT部门在运维工作中被动局面,借助于统一信息内网监管平台的有力支撑,有力推动某院IT部门朝着“全面实现以预防为主、修复为辅的主动式管理”的目标迈进。该项目建设完成后,将会对某院运行维护和管理水平的整体提高发挥积极的推动和促进作用,做到故障早发现、早解决,确保计算机网络连续、可靠、安全运行,降低发生故障的可能性,提高信息运维部门的运行管理水平和服务保障能力,为信息运维综合监管系统的持续建设与深入应用提供强有力的支持与保障。综合运维管理系统基于对上面内容的理解,在充分沟通、仔细调研的基础上,我们本次为某院推荐上海北塔公司的BTIM信息系统综合网管系统。系统简述BTIM为基于DOTNET平台运行的应用系统,采用了业界最新的DOTNET2.0框架及开发平台;系统采用B/S架构开发的应用系统,采用了业界最先进的WEB2.0技术,通过Ajax技术和WebService技术,实现了在浏览器上页面的局部更新,提供更好的部署和使用体验;BTIM-IE客户端采用运行于IE7.0的jscript开发语言,大大提高IE客户端操作的响应速度;BTIM通过O/RMapping技术和缓存技术,能够自动适用不同数据库之间差异性,优化数据访问速度。BTIM是一套全中文网络资源管理系统,是一套“基于网络平台、面向客户应用”的网络设备资源与应用服务资源、全中文、通用的管理软件,具有先进性、实用性、易用性和安全性的特点。为了确保某院安全、高效、稳定地运行,提高管理水平,满足客户日益增长的服务需要,提供最安全最周到的服务保障,树立自己的行业形象,结合现今行业发展水平,利用先进技术,采用安全可靠的设计方案,将监控系统集成化,流程化。架构和功能BTIM系统主要功能架构包括对象层、对象采集层、数据处理层、数据展现层、外部接口等。BTIM系统框架图如下:BTIM系统的管理对象包括:网络设备、安全设备、机房环境、主机系统、数据库系统、应用系统、其他等,BTIM系统数据采集的方式多种多样,支持分布式主动轮询或被动接受的方式采集数据,支持标准的SNMP、RMON、Syslog、WMI、Telnet等的数据采集,支持数据库接口采集,支持应用API接口采集等多种方式,支持集成第三方管理平台组件进行数据采集,还可以根据用户的要求定制相应的接口,将相应系统的信息纳入网络管理系统中,形成统一管理。BTIM系统采用开放的数据存储平台SQLserver来进行网管系统的数据存储,能够保存半年以上的历史故障数据和性能数据以便生成相应的趋势分析报告。BTIM系统能够针对告警事件提供灵活的过滤,提供对告警级别、告警类别、告警消息等配置的能力,告警划分成几种颜色,提供多种工具和方法定位问题的根源。BTIM系统的性能数据采集能够支持秒级单位的采样周期。BTIM能够提供原始采样频率的数据。BTIM系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。BTIM系统通过Web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和运维管理流程。BTIM系统标准的Syslog、Telnet、API等接口,可以将安全管理系统、相关环境的管理数据,纳入BTIM系统中实现集中管理。需求分析总体要求结合项目特点综合运维管理系统要求如下:实时掌握网络性能数据和故障信息,其中性能数据的获取时间不高于5分钟,告警数据的获取时间不高于30秒。按时间段(天/周/月/季度/年)统计分析网络运行情况,支持设备性能和链路性能图表。实现全园区系统汇总运行的统计分析,例如CPU平均使用情况、内存最大使用情况等。分析数据可以层层下钻,看到各个网络设备相关指标的分析情况。也可以分析某段时间内不同区域不同指标的情况。实时监控、展现网络设备关键指标的变化情况。支持统一告警台视图展现,可将监控的所有的内容所产生的事件汇总到统一的展现界面,并可通过事件的点击追溯到事故资源的详细指标信息中。核心网络实时监控和分析展现是对核心网络数据深入统计分析,更好地了解核心网络系统的运行状况、分析异常数据变动的原始数据原因。核心网络分析展现通过数据抽取对业务数据进行分析结果展现,同时提供分析所需要的细粒度数据和汇总数据。网络实时监控和分析展现能按时间段(天/周/月/季度/年)统计分析网络指标的情况,分析数据可在时间维度逐层向下查看详细数据。(1)系统需提供多种统计分析手段,如排序、同比、环比等而无需输入任何分析公式(2)监控信息刷新频率可以按照用户的需要进行灵活调整(3)满足实时抽取关键数据,按日批量和增量抽取明细数据(4)监控信息刷新频率可以按照用户的需要进行灵活调整需求分析根据需求来看,实际运维工作中是有一些管理工具进行监控工作。但是从实际运维管理工作需求角度出发,现有的管理工具存在较多的问题,这种问题体现在工具相互之间缺乏关联性,工具的非定制性导致采集数据和某院的实际运维工作存在较大的偏差,因此对于综合运维管理系统需求集中体现在以下几个方面:1)所有IT设备均纳入综合运维管理系统管理综合运维管理系统首先需要的是将某院所有IT设备均纳入管理,这是运维工作管理的基础和核心。只有当所有设备都在管理范围内,对其进行的监控、告警、统计、分析、报表才有实际意义。目前某院虽然有了一些监控工具,但从实际情况来看,并未将所有设备纳入监控范围,从监控本身角度存在较大的缺失。2)全面增强的基础监控KPI某院网络管理系统必须摆脱依赖于原有工具来开展运维工作的情况,需要根据某院自身运维管理工作特点,有目的有计划的展开各类管理对象的专题分析,比如网络设备监控、链路监控、服务器监控、数据库监控等,通过梳理现有的监控指标尤其是全国范围内用户对上述设备的管理指标,建立健全某院对基础监控的KPI库,将各类风险纳入到综合运维管理系统中,实现综合运维管理系统及时、快速、有效的对各类故障进行事前可知、事中可控、事后可查的目标。建设目标根据某院局现状和需求进行统筹规划,本着“从实际需要出发,保护已有投资”的原则,将目前已有的、针对网络的分散式监控管理系统,以及数据处理中心的动力集中到一个统一的监控系统,并以适当的形式进行集中展现,为运维人员进行系统、设备的监控、故障定位、故障诊断和解决等运维工作提供信息来源。实现集中统一的事件监控、集中统一的性能监控,从而实现综合运维管理系统的各项业务功能要求。利用综合运维管理系统全面主动反映某院个业务系统的运行健康情况,通过多种分析手段为合理有效地分配各运维人员和值班人员的人员调度,为制定设备升级、扩容方案提供决策支持。通过综合运维管理系统对业务核心数据进行分析和实时监控,并实现丰富、科学、美观的展示。整体架构设计本技术实施方案的目标是使用BTIM运维管理系统为某院建立一个统一的信息系统综合网管系统,具体来说包括:1.建立起以BTIM为主体的网络运维管理系统:最终的综合信息系统综合网管系统应能够很好的满足某院信息网络系统管理的实际需求,具备良好的实用性,能够提供强大的故障监测和故障信息处理平台。平台能够实现目前某院对全公司网络系统的管理原则,实现网络综合监测管理模式。能够根据各级管理运行管理范围和责任划分实际情况,灵活定义和界定检测管理的边界,根据实际需求选择和定义对相关检测信息的显示形式和统计方法。对网络核心环节能够实现全面的检测和状态管理。对网络设备的跨厂家、跨平台的统一管理;网络产品管理进行监控,以及运行值班管理等功能;提供了较快速的故障告警信息;能针对各厂家产品提供统一的管理界面;提供了较丰富和实用的管理工具;提供了被监视设备的故障日志;操作方便,能够提供大量的网络设备的性能和状态的真实数据、方便实用的事件统计功能;能对这些系统提供的数据进行整理和分析,结合运行考核办法,制订应用于某院各级运行管理的数据集。根据某院对网络综合管理与监控平台的要求,结合某院网络的实际情况及一些客观的因素:广域网带宽、设备性能、设备数量、管理策略(如设置历史记录、告警等)等,BTIM信息系统综合网管系统采用集中部署设计。实施范围本次BTIM信息系统综合网管系统总体技术实施方案范围为某院。在某院本部部署一套核心的BTIM运维管理系统,共3个逻辑组件(可以根据服务器的性能装在一台服务器上),包括:·BTIM数据采集器及BTIM管理平台·BTIMWeb-Server服务器·BTIM数据库(SQLserver),可以使用客户已有的数据库服务器本方案采用统一的管理,我们以某院本部信息中心作为整个系统的网络中枢,管理某院的核心网络。通过BTIM系统,可以实现跨厂商的网络产品管理、服务器管理、应用系统管理、告警事件管理、日志管理、用户管理、流量分析管理、报表分析管理、机房监控管理等。对于各种事件和日志,有收集、统计、告警、处理、分析等功能,管理数据采用安全的协议和方式在统一平台上实现共享。所有功能实现均非互不相关的对立功能软件的堆砌,真正实现了某院建设信息系统综合网管系统的需求。网络系统管理模式在现实的IT组织中,运行维护的管理模式可能是以上四种基础模式形态中的一种或几种的组合方式。对某院来讲,可以从以下几个方面来评估现状,或协助制定未来的管理模型:控制(Control)-Wherearedecisionsmade?单一控制或多点控制(SingleorMultiple)某院:采用单一控制方式,其优点是统一入口,集中管理。执行(Execution)-Wherethemanagementfunctionexecuted?单一执行主体或多个执行主体(SingleorMultiple)某院:采用单一执行主体方式统一的网络系统解决方案蓝图企业信息化管理是一个多元化的工程体系。它不是一蹴而就的,而是一个循序渐进,不断完善、改进的过程。考虑到某院业务的扩展和网络管理系统、流程管理系统的不断完善,基于对系统管理需求和管理模式的分析,我们制定了如下的设计原则:集中管理。基于集中管理系统的高效性,某院可以采用某院管理总控,统一制定并部署管理角色与职责、管理策略,考核指标由某院统一制定并强制执行。代理方式与无代理方式结合的设计针对某院这样一个大规模的网络系统管理平台,管理范围大,技术要求高,单独采用任何一种方式很难满足其架构设计的需要。考虑到代理方式和无代理方式的优缺点,建议采用两种方式结合的部署方式,大规模部署用无代理方式,深入监控需求用代理方式。通过SNMP协议能够获取详细信息的管理对象。两种方式结合所带来的益处是:1.兼顾安全与效率2.兼顾深度与广度3.兼顾可靠性与安全性数据库设计考虑数据库宏观设计在北塔的方案中,建议某院采用SQLserver数据库的来存储全公司的性能和告警数据,并作为日后进行流程管理的重要基础。数据库详细设计在统一数据库中,需要为告警事件、流程管理、资产和配置、可用性与性能等不同的系统监控信息分别分配一组表空间,以实现数据的物理隔离,并有助于提高应用的访问速度。每一组表空间的大小可以根据某院采集点和采集频度进行估算。从性能和灵活性角度考虑,可以将数据库中的各种监控数据所存储的表按月进行分区,每个分区分别占用不同的表空间。这样做的好处是向表中插入数据时索引的更新速度较快,且可以较快地生成跨月的报表,同时又能较快地摘除过期数据。每一张表按照时间和最常用的一到两个监控维度字段建立索引,索引也按照表的分区分段存放在不同的表空间中,这样可以使最常生成的报表获得最快的查询速度,且生成的索引较小。平台总体设计设计要求某院信息网络信息系统综合网管系统为总部集中式管理。以某院作为整个系统的管理中枢,能够实现对网络系统的状态检测,建立一个安全、高效、先进的监控体系。·平台管理应具有企业级管理能力,管理平台能够对所有管理结点进行配置和监测数据同步。所有管理工作以良好直观的界面实现,支持远程管理。·管理功能集成于一个管理平台,统一于一个管理图形界面。可监测和管理网络,形成一套统一的网络状态管理体系。·对于各种事件和日志,有收集、统计、告警、处理、分析等功能,能够提供规范的数据传输接口和API接口,能针对重要的应用进行二次开发。·监测代理软件不应影响操作系统及应用程序的正常运行,对系统资源的消耗少。·提供基于业务应用角度的监控,实现快速的故障诊断。·能采用安全的协议和方式实现对不同安全等级区域中设备和应用系统的监测和管理。·具有自身安全性控制,包括用户访问权限、数据安全控制、通信协议安全等,用户必须具有分权管理功能。·有很好的可扩展性,可以随着应用规模和管理需求的增加而不断扩展,并保证不同阶段实施的管理功能和结构的完整和统一,保护投资,并能够提供长期的技术支持。结合BTIM的平台总体设计根据某院对网络综合管理与监控平台的要求,结合某院网络的实际情况及一些客观的因素:广域网带宽、设备性能、设备数量、管理策略(如设置历史记录、告警等)等,BTIM信息系统综合网管系统采用集中部署设计。通过BTIM系统,可以实现跨厂商的网络产品管理、告警事件管理、日志管理、用户管理、流量分析管理、报表分析管理等。对于各种事件和日志,有收集、统计、告警、处理、分析等功能,管理数据采用安全的协议和方式在统一平台上实现共享,所有功能实现均非互不相关的对立功能软件的堆砌。BTIM层次化管理功能具有很强的安全性控制,包括用户访问权限、设备管理权限、功能管理权限、数据安全存储和传输等。同时提供基于业务应用角度的监控,配合强大的告警事件管理功能,实现快速的故障诊断和恢复处理。各平台有很好的可扩展性,提供规范的数据传输接口和API接口,针对重要的应用可以进行二次开发,可以随着某院的应用规模和管理需求的增加而不断扩展,并在不同阶段实施保持管理功能和结构的完整和统一。数据采集采取某院与下属单位分步取数,层层递进分析的方法。上述所有功能实现的基础是由BTIM系统自动生成的真实物理拓扑图,所有的操作都是以拓扑图为核心展开的,所有功能是统一系统平台上支持数据综合分析的统一管理,而非割裂的几个分产品的堆砌,实现了BTIM统一网络运维管理的特性。通过采用BTIM运维管理系统统一的管理,我们以某院本部信息中心作为整个系统的网络中枢,管理某院的核心网络设备。信息系统综合网管系统模块配置设计·本方案中平台应用软件配置为BTIM运维管理系统BTIM运维管理系统为分布式、多层架构的系统,支持部署多个数据采集器来进行信息系统综合网管系统的数据采集和处理。信息系统综合网管系统系统软件的选型操作系统:数据库服务器和应用服务器采用Windows2003Server或Windows2008Server操作系统,可分布部署的信息采集器则根据采集技术的要求选取操作系统,本项目使用Windows2003Server或Windows2008Server作为BTIM管理平台的操作系统和作为数据库的操作系统。数据库系统:本项目采用SQLSERVER或ORACLE作为数据库管理软件。数据采集层技术设计设计要求数据采集应考虑以下的性能因素:·数据采集模块具有良好的健壮性和容错性,采集模块之间互相独立,网络异常恢复后能自动恢复采样。·数据采集不能对监测对象的性能有过多的影响。能在一定范围内根据系统运行情况调整采样策略。·数据采集、传输必须使用安全、可靠的技术手段,对现有的各类应用业务的安全不产生影响。·对网络设备最小数据采样周期不大于10S,对主机系统最小数据采样周期不大于30S,对数据库和中间件最小数据采样周期不大于60S,要求提供各类采集指标最小数据采样周期。(最大采样周期要求可参照平台监控管理范围与主要指标要求中相关部分要求)·要求平台能够根据适应应用系统状态监测的不同需求,支持采用代理、非代理型二种采集模式对主机系统、应用系统和有关中间件状态进行监测。数据采集应考虑以下安全因素:·在进行数据采集时对于高权限用户账户信息应全部采用有效的加密方法进行传输和存储,并对特定IP、MAC地址访问控制,以保障被测设备和系统的安全;·对重要的设备和系统必须采用加密的登录过程(即SSH),保障远程登录的安全性;数据采集、传输、存储、读取应支持HTTPS和SSH加密协议。用户登录系统除通过不同的用户名和密码进行身份和权限控制外,还应可设定系统只允许通过指定的IP地址进行远程登录。·对网络系统的数据采集应依托网络进行,对专用设备的监控应通过现有传感设备进行,最终通过网络传输和存储。数据采集层技术设计BTIM系统提供分布式的数据采集器,支持分散、多个安装在网络的不同位置,从BTIM管理平台下载数据采集和监视的规则,接受自动处理调度、上传采集数据、数据处理结果与告警策略监视,从而动态、全面地收集整个网络的信息。网络管理人员可以在各网络合适的交换位置上安装BTIM分布式数据采集器,对全网信息进行不间断的收集和处理,即缓解了网络数据采集带来的压力,同时由于BTIM分布式数据采集器本身也可以处理一些数据,这样无疑大大提高了BTIM系统整体的运行效率。BTIM分布式数据采集器具有良好的健壮性和容错性,各采集器之间互相独立,在网络异常恢复后能自动恢复采样。数据采集可以单独/批量进行手工调整采样策略和采样间隔。BTIM的数据采集、传输使用SNMPv3、SSH、HTTPS等安全、可靠的方式,对现有的各类应用业务的安全不产生影响。BTIM分布式数据采集器对网络设备类最小数据采样周期为10S,对主机系统类最小数据采样周期为15S,对数据库和中间件最小数据采样周期为60S。BTIM支持采用代理、非代理型二种采集模式对主机系统、应用系统和有关中间件状态进行监测。BTIM分布式数据采集器在进行数据采集时对于高权限用户账户信息采用SNMPv3、SSH、HTTPS等有效的加密方法进行传输和存储,并对特定IP、MAC地址进行访问控制,保障了被测设备和系统的安全;对重要的设备和系统采用加密的登录过程(SSH),保障远程登录的安全性;数据采集、传输、存储、读取支持HTTPS和SSH加密协议。用户登录系统除通过不同的用户名和密码进行身份和权限控制外,还可设定系统只允许通过指定的IP地址、MAC地址和交换机端口进行远程登录。BTIM分布式数据采集器对网络系统的数据采集依托网络进行,对专用设备的监控可以通过与现有传感设备进行联动,最终通过网络传输和存储。BTIM系统提供开放的平台架构和标准的API,能够根据用户的实际需求,自定义用户专用系统或设备的数据采集监测器和监测脚本。数据管理层技术设计设计要求数据管理层的要求包括:·能够适应不同的监控内容和采样策略,有合理的数据文件结构,避免采样时的数据文件争用。数据库参数配置尽量合理,高效。·要求数据库运行无明显瓶颈,满足某院目前被监控系统的采样数据写入和应用层查询的需求,并留有适当可扩充的冗余。数据库支持为本系统自身所监控。·平台提供完备的备份策略,提供有效的数据备份方案及相应的数据恢复、迁移方案,要求可行性高。数据管理层技术设计BTIM的数据管理平台支持数据复用与信息一致化,所有功能采用统一底层结构,以资产为中心共享数据,保持不同功能项之间数据的一致性,数据采集采用北塔特殊的算法,达到最大的数据复用效果,避免数据的重复采集,减少网际数据流压力,在相同管理数据流压力下提高管理功能效率,能够适应不同的监控内容和采样策略。保证了数据库运行无明显瓶颈,满足某院目前被监控系统的采样数据写入和应用层查询的需求,并留有适当可扩充的冗余。数据库支持为本系统自身所监控。BTIM运维管理系统具有完善的系统纠错恢复安全机制和自动诊断报警能力,运行稳定可靠。BTIM提供多种自动备份工具,能够定时备份数据库和配置文件。BTIM可以通过在主机安装防火墙和防病毒软件的方式来保证自身主机的安全。其他技术设计设计要求·操作日志系统提供操作日志记录,对系统事件(登录、查询)和采集等操作进行记录。·接口平台必须留有标准的外部程序接口,具备二次开发能力,可以根据要求对用户的具体网络监测需求进行定制开发。采用开放的API和模块化设计,能够实现网络管理资源整合,以保证整个系统与其他系统之间的无缝连接。必须提供多种方式的数据输入输出。·权限设置系统提供分级的权限设置体系、用户分级不少于以下四类。·超级用户:是用户权限分配和系统监控的根节点。负责添加和配置采集端,增加/删除被监控对象;·系统级监控员:由超级用户定义和配置,负责管理和监控某一类系统的管理员:如综合业务管理及监控系统管理用户、主机监控用户、数据库监控用户等。·应用系统级管理员:由超级用户定义和配置,负责管理和监控单个应用系统。应用系统管理员具有监控数据库、专用防火墙和其所部属的中间件资源的监控权限。·普通状态监控用户:由上述两种用户在各自权限范围内定义,对某单个设备或某个基础应用系统进行监控,并且存在时效限制。·要求能够在上述四类的基础上对具体的监测对象在添加设备、删除设备、添加监测点,删除监测点等等操作权限分等级设置;能够对具体的监测对象在设备、监测点的数据处理权限分等级设置,并具备较好权限组合能力。·监测信息展示系统支持投影、声音等多媒体展现方式,用于监控结果的宏观展示。信息展示要求包括:·统一访问门户(portal)用于向用户提供基于WEB的统一网管访问入口,使用户能够在统一登录、统一认证的情况下,方便的实现对应用系统管理系统、网络管理系统的访问和管理。·统一访问门户预留与其他网络管理平台、应用系统管理、安全管理平台等系统集成的端口。·根据用户的实际应用和管理需求,能够在各级管理区域中(或跨区域),由用户自定义业务系统或设备的监测视图并进行集中展示。·自动通知功能系统能根据警告事件的级别通过声音告警、电话告警等方式主动通知运维人员。相关技术设计·操作日志BTIM提供完备的操作日志管理、故障日志管理,支持按不同时段、不同对象查寻日志,支持日志打印输出、报表输出。BTIM可以记录和查询系统管理员和日常操作员的所有操作,信息包括用户名称、用户登录时间、操作内容等;BTIM提供有关该设备的最近故障日志查询,可以查询某台设备或所有设备某时段或所有时段日志记录,日志可以打印输出。·接口BTIM运维管理系统留有标准的外部程序接口,具备二次开发能力,可以根据要求对用户的具体网络监测需求进行定制开发。BTIM采用开放的API和模块化设计,能够实现网络管理资源整合,以保证整个系统与其他系统之间的无缝连接。提供多种方式的数据输入输出。BTIM系统提供的标准接口如下:直接数据库共享:BTIM系统采用SQLServer、Oracle等大型数据库,支持其他系统直接访问该数据库中的各种表格数据,实现数据共享。ORMapping数据共享:BTIM通过ORMapping机制将关系型数据库中的数据映射为面向对象的实例,外部系统可以通过引用数据定义,通过ORMapping机制直接以对象的形式获得数据。应用程序接口(API)BTIM采用组件式开发,具有良好的开放式接口,外部系统可以通过调用系统提供API接口,访问BTIM系统的功能。HTTP(WebService)BTIM基于B/S架构的应用系统,在Web服务器上提供了各种WebService,支持通过SOAP协议进行功能调用和数据访问。宿主/脚本方式BTIM系统支持各种流行的脚本语言(Jscript等),支持用户的二次开发操作、数据导出、功能调用。UDP数据接收、SYSLOG、TRAPWeb链接方式SNMPXML文件传输或文件共享Socket数据流方式WMITELNET等等。·权限设置BTIM运维管理系统具有用户组和角色的定义,可以提供灵活的、分级的权限设置体系,可根据用户需求设置多种分级方式,如:·超级用户:是用户权限分配和系统监控的根节点。负责添加和配置采集端,增加/删除被监控对象;·系统级监控员:由超级用户定义和配置,负责管理和监控某一类系统的管理员:如综合业务管理及监控系统管理用户、主机监控用户、数据库监控用户等。·应用系统级管理员:由超级用户定义和配置,负责管理和监控单个应用系统。应用系统管理员具有监控数据库、专用防火墙和其所部属的中间件资源的监控权限。·普通状态监控用户:由上述两种用户在各自权限范围内定义,对某单个设备或某个基础应用系统进行监控,并且存在时效限制。BTIM运维管理系统的权限管理支持在上述四类的基础上对具体的监测对象在添加设备、删除设备、添加监测点,删除监测点等等操作权限分等级设置;能够对具体的监测对象在设备、监测点的数据处理权限分等级设置,并具备较好权限组合能力。具体来说,BTIM用户管理可以按照用户的不同职能来进行权限的划分:用户A可以管理三台交换机,用户B可以管理五台交换机和一台防火墙,并可按照具体功能进行划分,其中用户A可以对其管理的设备进行相关操作,用户B不可以对其管理的设备进行相关操作。使用BTIM的用户管理可以很容易的实现上述要求。BTIM持对重要设备监控,可以根据设备的重要程度将被管设备分为不同的组,通过设置权限,每个管理员只需看见他所关心的设备。每当设备出现故障,就能清楚的发现是哪台设备发生的,并能查看详细故障信息。·监测信息展示BTIM运维管理系统支持液晶电视、投影、声音等多媒体展现方式,用于监控结果的宏观展示。BTIM为完全B/S架构,向用户提供基于WEB的统一网管访问入口,使用户能够在统一登录、统一认证的情况下,方便的实现对应用系统管理系统、网络管理系统的访问和管理。满足某院统一访问门户(portal)的需求。BTIM提供标准接口,可以与其他网络管理平台、安全管理平台等系统进行集成。BTIM提供根据用户的实际应用和管理需求,在各级管理区域中(或跨区域),由用户自定义业务系统或设备的监测视图并进行集中展示。·自动通知功能BTIM运维管理系统提供独立的事件告警输出管理,支持手机短消息、多媒体语音提示、弹出窗口、拓扑图标指示、电子邮件、打印机输出等告警方式。同时支持分时段告警,支持告警输出与第三方程序联动,支持直接的故障源网络隔离操作。平台功能扩展设计(接口方面的设计)BTIM平台功能扩展接口:BTIM运维管理系统留有标准的外部程序接口,可以方便的调用其他系统信息交互的系统,北塔公司提供源代码级的二次开发能力,可以根据要求对用户的具体网络监测需求进行定制开发。BTIM运维管理系统为基于DOTNET平台运行的应用系统,采用了业界最新的DOTNET2.0框架及开发平台;系统采用B/S架构开发的应用系统,架构为多层架构。在BTIM系统中,分为BTIM分布式数据采集器(在本项目中该采集器是和BTIM管理平台整合在一起)、BTIM管理平台、BTSM管理平台、BTIMWeb-Server服务器(在本项目中,该服务器是和BTSM管理平台整合在一起的)和BTIM数据库(Oracle),每个部分都可以独立安装在不同的服务器或pc机上。BTIM系统还提供跨地域、层次化的统一管理。透过使用BTIM产品的管理平台,可以在用户上级单位网络管理中心直接调阅各下属单位的网络实时物理拓扑结构(如远程设备的当前负载情况,端口状态,故障日志等等),实现全网运行率统计、配置和监控数据的上传下发、告警信息发送、全网IP地址联动、报表下发等管理功能。各个层次的相对独立性,上级部门在需要时可以对下级部门进行管理,保证了整个网络管理的统一性和完整性。在了解信息的深度与广度上与本地管理非常接近。BTIM系统采用开放的API和高度模块化设计,能够实现网络管理资源整合,构建更为完善的自动化网络管理平台,以保证整个系统与其他系统之间的无缝连接。与此同时,BTIM系统还提供了多种方式的数据输出,默认使用MS-SQL数据库作为数据存储,可以方便的将用户所关心的数据录入数据库中,方便用户进行二次开发。BTIM管理平台能够提供多种方式进行数据接口,主要标准接口如下:·直接数据库共享:BTIM系统采用SQLServer、Oracle等大型数据库,支持其他系统直接访问该数据库中的各种表格数据,实现数据共享。·ORMapping数据共享:BTIM通过ORMapping机制将关系型数据库中的数据映射为面向对象的实例,外部系统可以通过引用数据定义,通过ORMapping机制直接以对象的形式获得数据。·应用程序接口(API)BTIM采用组件式开发,具有良好的开放式接口,外部系统可以通过调用系统提供API接口,访问BTIM系统的功能。·HTTP(WebService)BTIM基于B/S架构的应用系统,在Web服务器上提供了各种WebService,支持通过SOAP协议进行功能调用和数据访问。·宿主/脚本方式BTIM系统支持各种流行的脚本语言(Jscript等),支持用户的二次开发操作、数据导出、功能调用。·UDP数据接收、SYSLOG、TRAP·Web链接方式·SNMP·XML·文件传输或文件共享·Socket数据流方式·WMI·TELNET等等。接口方式的选用原则是适应其它系统现有的接口方式。BTIM在开发和设计时还充分考虑了与第三方软件的联动与配合,通过共享数据库,提供标准参数,第三方软件在支持通用标准数据库的前提下可以很容易的调用BTIM所提供的数据,与BTIM进行有机的配合。综合管理系统功能BTIM系统采用层次化设计,对系统的各个层面进行了建模和抽象,使得各结构层面之间既相互独立,又相互关联,最大程度上提高了系统运行的效率。综合网管系统架构图BTIM平台的架构图如下:从上图,可以直观的看出BTIM模块清晰,层次分明。各模块之间既相互独立,又互相关联,共同实现了对被管对象的集中监控和管理,另外也通过WEB方式为用户进行了统一的展现。综合监控综合监控部分主要是对系统各个监控对象进行快速浏览时使用,适合用户查看管理对象的日常运行情况,操作简单,界面直观明了。通过全网设备负载、线路流量自动TOPN排序,主动告诉用户哪些设备需要关注,全网运行的隐患在哪里。综合监控功能包括:管理监控、值班监控、设备运行、线路流量、峰值流量、环境监控、告警总览、服务总览。综合监控的优势和亮点·综合监控是BTIM系统对所有被管对象的一个综合展示窗口,展现直观方便、关联性强。·支持全网设备负载自动TOPN排序,主动告诉用户哪些设备需要关注,全网运行的隐患在哪里。·提供可配置功能,在一个界面上可以配置多个可视化项目。用户可以配置自己个性化的监控首页,这样就可以让用户把自己最关心的东西,一进系统就能马上看到。·通过业务视图展现各类服务逻辑,并对服务系统的诸多业务关键参数(KPI)进行监控,作为服务管理的基础。·全网线路流量TOPN排序和峰值流量的展现,告诉用户当前网络的主要流量有哪些、在哪里。·全网告警预览。让用户一幕了然了解网络中的问题所在。·自动生成全网设备运行统计率报表。方便用户了解全网的设备运行状况。管理监控与值班监控的功能对于不同的管理人员对于数据指标的查看需求也有区别,BTIM系统提供了详细和简单两种不同的管理信息界面,对于值班员偏重于信息的关联,对于运维人员更偏重于信息指标的完整。对于值班员和管理者需要查询的实时信息也是不同类型,系统按照管理要求提供了快捷值班监控和管理监控两个页面。值班监控可通过定制化配置用户所关心关键指标,并实时数据展现,而管理监控则着重于从网络、服务、业务三个方面呈现实时管理效果。设备运行的功能展现整体系统设备运行情况,并展现CPU/MEM设备TOPN的当前状态线路流量的功能展现整体系统设备运行情况,并展现流量/帧流量设备TOPN的当前状态峰值流量的功能·为用户提供链路中峰值流量、平均流量的一个呈现,让用户实时掌握网络中流量的分布。·该功能可以查看所有线路最近一周的流量信息。页面中可以选择最近一周内的任意一天来查看,以列表形式显示线路名称、平均流量、峰值流量[峰值出现时间]、帧平均流量、峰值帧流量[峰值出现的时间]。环境监控的功能·为用户呈现机房中温湿度和UPS电源设备的实时运行情况。以列表的形式分三列显示探头名称、温度和湿度值、UPS品牌、UPS运行情况等信息。告警总览的功能·让用户实时掌握网络的各种告警信息,让用户可以及时的处理故障。·按告警类型显示未恢复的告警信息。包括告警时刻、设备、告警内容。服务总览的功能·通过鲜明的颜色,可以让用户迅速知道各项服务现在的运行状态是什么。·该界面将服务拓扑图的内容以树状图形式进行展现,本界面按照服务器系统类别和服务类别进行分类,其中?图示为?重要检测点,?为普通检测点,鼠标停留在图示上会出现该图示所代表的内容和具体监控值,所有信息一目了然。网络拓扑管理在网络的平台层管理中,拓扑结构管理是最为核心的管理要素之一,一张准确的拓扑结构图对于了解网络规模、应用分布、故障定位等管理需求有其他管理角度无法取代的特殊地位。网络拓扑管理的优势和亮点·支持逻辑拓扑图,让用户对自己网络的IP子网分布一目了然。还可以自动发现网络中新增设备(IP节点)。且逻辑拓扑图是自动、实时发现的。·支持机房拓扑,让管理人员不需要去机房就可以看到整个机房的运行情况。机房拓扑和网络拓扑、业务拓扑关联,可以方便的互相跳转,进而调用相应的功能。·在大型的网络中,通过节点或线路的定位,可以迅速找到用户想要找的设备和链路。·支持设备端口的VLAN划分,简化部分管理员日常的配置工作。·拓扑生成的时候能够以任意节点为中心发起搜索。·可以真实反映整个网络的运行状态,直观的反映设备的分布情况、负载状况和设备属性以及线路的实时流量。·通过颜色简单明了的告诉用户网络中负载和流量的压力所在,主动告诉用户的关注点在哪里,动态通知用户可能的故障隐患。·自定义设备和链路的中文名称,下标显示,让用户摆脱枯燥的IP地址,更方便快速识别设备的用途。·真实的面板图展示,让用户直观的从图上就可以查看端口流量,关闭、打开端口、端口下联设备,可以迅速定位问题点。自动发现生成网络物理拓扑图拓扑图生成算法BTIM网络运维管理系统中的自动物理拓扑生成功能是精心设计、自主研发完成的功能,能够迅速搜索整个网络内的所有节点,一次性获得网络中所有路由器、交换机、服务器、PC等管理单元的数据。并且能够自动判断并勾画出设备间的冗余连接、备份连接、均衡负载连接等关系,完成网络拓扑发现。通用拓扑生成算法自动物理拓扑生成支持跨厂商设备的通用生成算法,无须用户的人工干预,能够从网管机出发,自动依据网络路由信息、IP地址信息,按照“广度优先”的树结构遍历算法,逐层对网络上的所有IP地址进行扫描与SNMP测试,对于采用SNMP管理协议的各厂商网络产品,包括无线网络产品、网络防火墙、安全产品、打印机、服务器、主机系统,自动查找整个网络的路由设备、网络交换机、电源、打印机以及主机等支持SNMP协议的设备,能自动辨识各生产厂商、设备类型、设备端口信息、设备面版图等信息。在完成网络设备的遍历与发现后,BTIM网络运维管理系统将从各网络设备中读取RFC组织定义的各种标准MIB信息,去伪存真,综合分析、计算各网络设备之间的真实端口连接关系,辨别设备连接线路的类型、连接速率,提供各网络设备之间的准确的连接关系,包括设备间的冗余连接、备份连接、均衡负载连接,从而为用户提供了一份真实的网络物理连接关系图。CDP专用算法BTIM网络运维管理系统还特别针对CISCO厂商所提供的CDP信息开发了专用网络拓扑图算法,能够自动根据设备中的CDP信息,采取“深度优先”的树结构遍历算法,逐个节点进行分析处理,并同时建立各设备之间的物理连接关系,逐步完成网络拓扑图的构造。灵活的拓扑图发现条件除了自动拓扑生成外,BTIM网络运维管理系统还为管理人员提供了增加搜索网段、添加指定IP地址以及过滤的网段等功能,可实现跨互联网的不同区域局域网的管理,方便管理人员进一步调整网络管理范围和提高网络遍历速度;同时支持将指定的设备类型进行过滤(系统已经预定义了部分设备名单,用户可以根据网络上的实际情况进行补充和调整),去除那些支持SNMP但非管理人员所必须关注的各种设备,提高网络管理效率。逻辑拓扑发现BTIM网络运维管理系统不仅能够提供强大的物理拓扑图展现,还可以通过拓扑添加、子图、缩略图的形势实现逻辑拓扑展现,按照用户自己定义的逻辑连接关系自定义逻辑拓扑图连接方式,并且能够按照不同的系统应用提供系统应用拓扑图。拓扑图添加BTIM网络运维管理系统在自动拓扑的基础上,作为日常运维产品中以网络维护为主的理念,专门提供了拓扑生成和拓扑添加两种工作方式,以适应系统运行中局部的网络变动的需要。拓扑生成是清空原来所有的拓扑图和配置信息,重新开始搜索网络拓扑图。拓扑添加则是保留物理拓扑图以及配置信息不变的情况下,将新搜索发现的网络设备及其之间的连接关系以及与原有设备之间的连接关系添加到物理拓扑图中,从而形成新的、与网络环境一致的物理拓扑图。基于IE的拓扑浏览基于IE的拓扑图查看BTIM网络运维管理系统提供了灵活的拓扑图呈现方式和查看手段。·提供拓扑图背景地图的定制,按照不同地域的真实地图灵活拖动网络
/
本文档为【IT综合运维管理系统技术方案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索