为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 运维管理制度

运维管理制度

2022-10-03 2页 doc 72KB 35阅读

用户头像 个人认证

is_874176

暂无简介

举报
运维管理制度运维管理制度XXXXXX有限公司2014年5月18日A目录前言11、总则12、编制方法23、运维部工作职责23。1系统运维和技术支持23.2。平台信息和技术安全34、运维服务管理系统34.1运维服务管理对象34。2运维系统功能框架44。3运维管理组织构造44.3。1项目负责人44。3.2项目经理44.3。3技术主管54。3.4服务台54。3.5网络管理员64。3。5应用、数据库管理员6终端管理员64。4运维服务流程74。4.1项目运维服务工作流程图74。4。2服务台7事件管理7工单管理74。4.5问题管理84。4。6改正管理8...
运维管理制度
运维XXXXXX有限公司2014年5月18日A目录前言11、总则12、编制方法23、运维部工作职责23。1系统运维和技术支持23.2。平台信息和技术安全34、运维服务管理系统34.1运维服务管理对象34。2运维系统功能框架44。3运维管理组织构造44.3。1项目负责人44。3.2项目经理44.3。3技术主管54。3.4服务台54。3.5网络管理员64。3。5应用、数据库管理员6终端管理员64。4运维服务流程74。4.1项目运维服务工作流程图74。4。2服务台7事件管理7工单管理74。4.5问题管理84。4。6改正管理84。4。7配置管理84。4.8知识库管理84。4.9统计及工作报告95、运维服务内容95。1服务目标95.2IT财产统计服务95.3网络、安全系统运维服务105。4主机、储存系统运维服务105.5数据库系统运维服务115.6中间件运维服务115。7终端、外设运维服务126、应急服务响应举措126。1应急实行基本流程136.2突发事件应急策略137、服务管理制度147.1服务时间147。2行为规范14i001-2办公信息系统共同管理及共同数据互换策略研究运维制度前言本文件是依照《XXXXXX系统共同管理及数据互换策略研究》分任务要求,达成“运维制度”的研究工作。课题组参照国际国内有:ITIL/ISO20000标准GBT28827。1—2012信息技术服务运转保护第1部分:通用要求GBT28827.2-2012信息技术服务运转保护第2部分:交托规范GBT28827。3—2012信息技术服务运转保护第3部分:应急响应规范联合XXX课题应用实行及运维管理的实质状况研究、编制运转保护管理制度,本文分为7章内容分别为:1.总则2。编制方法3。运维部工作职责4。运维服务管理系统5.运维服务内容6.应急服务响应举措7.服务管理制度规范等内容.1、总则第一条为保障XXXX课题信息系统软硬件设备的优秀运转,使参加课题技术人员运维工作制度化、流程化、规范化,特制定本制度。第二条运维管理工作整体目标:立足根本促发展,开辟运维新场面。在办公系统运转推行时期,经过网络、桌面、系统等的运维,促使XXXX课题能够稳固可连续性发展。第三条运维管理制度的合用范围:本项目运维全体人员。1运维管理制度2、编制方法本实行细则包含运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及鉴于流程的管理方法。本实行细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提高门路,表现了对运维服务全过程的系统化管理。3、运维部工作职责3。1系统运维和技术支持依据示范工程实行推动和发展目标,负责系统信息共同管理及共同数据互换策略研究的整体架构、应用系统等技术开发方案拟订和组织开发,保障基础研发平台的稳固性和先进性。(2)负责系统基础研发平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的交流和解决;会同项目实行单位,确认系统信息基础研发设备和软件数目、品牌规格、技术参数,保证课题有效推动实行。(4)系统信息基础研发设备和软件操作规程和应用管理制度的拟订,并负责监察履行。系统信息基础研发中心设备和软件安装、调试和查收,使用培训和维修养护.(6)系统信息基础研发平台平常运转过程中信息安全和技术问题的协调停决,保障网站24小时安全稳固运转。(7)负责研发平台系统管理及设备保密口令的设置和保留,保密口令设置后报课题领导小组存案,保密口令设定后任何人不得任意改正,保密口令每季度更新一次。(8)负责系统信息共同管理及共同数据互换策略研究新程序、新系统和软件改版升级工作。2运维管理制度3。2.平台信息和技术安全履行国家有关网络信息技术安全的法律法例,与通讯管理和网络安全监管部门联系,及时办理基础研发平台信息技术安全方面存在的问题,保证平台安全、稳固、靠谱运转.(2)基础研发平台信息技术安全保密制度和工作流程的拟订,落实信息技术安全保密责任制,履行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人.在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,保证基础研发平台不受病毒和黑客攻击.(4)负责基础研发平台信息技术安全应急办理方案拟订和实行。(5)成立多机备份基础平台信息服务系统体制,一旦主系统碰到故障或受到攻击致使不可以正常运转,能够在最短的时间内替代主系统供应服务.(6)成立基础平台系统集中式权限管理,依照岗位职责设定工作人员操作权限,针对不一样应用系统、终端、操作人员,设置共享数据库信息的接见权限,并设置密码。不一样的操作人员设定不一样的用户名,且按期改换,禁止操作人员泄露密码.4、运维服务管理系统运维服务管理系统规定了运维工作波及的各种实体,以及这些实体间的互相关系。有关的实体依照运维服务管理系统进行有机组织,并协调工作,依照服务协议要求供应不一样级其余IT运维服务.4。1运维服务管理对象运维服务管理对象包含基础设备、应用系统、用户、供应商、以及IT运维部门和人员,详细内容以下:(1)基础设备包含网络、主机系统、储存/备份系统、终端系统、安全系统、以及机房动力环境等.(2)应用系统包含OA办公信息系统、门户网站等应用系统等。用户包含使用如上应用系统的用户。供应商包含基础设备和应用系统的供应商以及IT运维服务的供应商.3运维管理制度(5)运维部门和人员包含内部参加运维活动的有关部门和人员,以及供应运维服务的公司和有关人员。4.2运维系统功能框架依据建设单位的系统构造和业务展开需要,运维项目组将项目的保护框架分为9个详细构成部分,分别为:服务台、时间管理。工单管理、问题管理、改正管理、配置管理、工程师查核、知识库管理、统计、系统管理等9个子项。而详细运维流程将以此为依照展开工作。4。3运维管理组织构造运维项目的运维管理构造位三层模式,详细以下列图所示。由项目负责人与甲方进行业务范围接洽,并将交流结果向下传达。项目经理负责项目的整体运维工作,包含各样制度的拟订和实行.运维工程师则在项目经理的指导下展开保护工作。4.3。1项目负责人职责:负责项目商务、整体协调事宜。职位描绘:1、整体负责建设单位运维项目服务计划的拟订,领导项目经理并安排项目工作,指导项目经理达成详细保护工作,每周听取项目经理的工作报告,负责考核项目经理工作达成状况。2、辅助建设单位达成新增项目的调研、方案设计并指导项目经理进行详细实行。4.3。2项目经理职责:规划、履行、完美信息化项目的运维工作,指导网络、数据库保护工程师展开工作。职位描绘:1、依据公司战略目标,指导部下工程师展开客户服务工作,保证运维工作能够知足客户的实质需要;4运维管理制度2、成立和连续完美运维管理系统,优化运维流程流程,解决运维服务中出现的特别问题;3、规划并提高运维工程师专业服务能力,在整体上提高客户满意度;4、拟订和连续完美绩效查核系统;5、拟订整理运维项目的应急方案系统,并指导运维工程师实行;6、提高自己专业技术,在业务方面赐予网络管理员和数据库管理员指导。4.3。3技术主管职责:应用、国产数据库管理,数据库性能调优,实现应用负载平衡。职位描绘:1.技术主管非项目常驻人员,依据项目需要进行专业方面指导;负责数据库性能剖析与调优,数据库运转状态监控,及时发现异样并快速办理。娴熟掌握国产数据库技术,能够实现部署及调优。掌握国产中间件的工作原理,能够实现部署调优及故障解决。娴熟掌握linux操作系统,部署国产数据库。娴熟掌国产数据库冗灾、数据保护、故障恢复技术.负责应用负载平衡的部署和调试.负责指导数据库工程师管理员展开工作。4.3。4服务台职责:故障电话受理,文档管理.职位描绘负责业务的救援电话的受理工作;故障办理的倡始人,同时进行保护工程师指派,追踪事件办理状态;进行保护故障统计、用户满意度统计、工作报表输出等工作;辅助项目经理,进行文档整理、归类、保留等工作。5运维管理制度4。3。5网络管理员职责:保护建设单位网络系统正常,解决网络有关故障.职位描绘:1、对现有服务器、局域网络及机房、配线间的平常管理保护;2、对信息安全建设提出有关建议,保证网络的安全;3、保证外网光纤线路正常,保证局域网运转正常;4、对网络系统和网络设备的运转状态进行监控;5、娴熟掌握域策略设置、DHCP、DNS、FTP服务器、NTFS权限设置等;6、编写网络部分的应用办理方案并实行。7、工作仔细、仔细,踊跃主动有条理性,拥有优秀的交流能力及团队合作精神.4。3。5应用、数据库管理员职责:保护建设单位业务系统运转正常,解决应用和数据库故障。职位描绘:1、监测业务系统运转状况,应用、数据库性能监督及优化,作必需调整;2、规划不一样数据的生命周期,制定备份、恢复、迁徙和灾备策略,依据业务的需要履行数据变换及迁徙等操作;3、保证应用和数据库系统的安全性、完好性和运转效率。4、负责数据库平台的整体架构及解决方案的拟订和实行;5、工作仔细、仔细,踊跃主动有条理性,拥有优秀的交流能力及团队合作精神.终端管理员职责:保护建设单位桌面系统运转正常,解决终端、外设故障.职位描绘:1、各部门电脑、打印机、传真机的保护;2、对各部门职员进行电脑有关的技术支持及培训工作;3、精晓中标Linux及金山WPS办公软件的使用,能够娴熟使用MSWindows6运维管理制度XP;MSOffice软件,能够制作相应教程对其余部门职工进行培训4。4运维服务流程IT运维服务管理流程波及服务台、事件管理、问题管理、配置管理、改正管理、公布管理、服务级别管理、财务管理、能力管理、可用性管理、服务连续性管理、知识管理及供应商管理等,跟着运维活动的不停深入和连续改良,其余流程可能会逐渐独立并规范。项目运维服务工作流程图服务台服务台是支持运维服务的核心功能,与各个流程联系亲密。所有管理流程都要经过服务台为用户供应单点联系,解答用户的有关问题和需求,或为用户追求相应的支持人员。在本系统中,服务台是接收各样根源服务恳乞降有关信息反应的独一进口和出口,同时服务台还负责一般恳求、经过知识库(历史事件)能够解决的恳求;他也是复杂问题二线办理的桥梁。4。4。3事件管理事件管理流程的主要目标是赶快恢复服务供应并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性等级。事件管理流程往常波及事件的侦测和、事件的分类和支持、事件的检查和诊疗、事件的解决和恢复以及事件的关闭.本系统把所有服务恳乞降报警归纳为事件。事件管理是供应服务台和事件管理者关于事件记录、办理、查问、审查、派发等功能。它也包含经过和第三方监控系统对接,把其发送报警形成事件的功能。4.4。4工单管理工单管理:工单是现场运维、二线支持的任务载体,运维工程依照所接竣工单进行运维工作.工单管理是对工单实现创立、改正、查问阅读、派发、监察等功7运维管理制度能的模块。4.4。5问题管理问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小.问题管理流程包含诊疗事件根根源因和确立问题解决方案所需要的活动,经过适合的控制过程,特别是改正管理和公布管理,负责保证解决方案的实行。问题管理还将保护有关问题、应急方案和解决方案的信息。问题管理是针对已办理事件的遗留问题或办理事件的方案不过治标不治本的不可以完全解决问题而考虑的模块。依据事件、及办理方案,问题办理人经过调查、诊疗并提出最后解决方法。4。4。6改正管理改正管理实现所有基础设备和应用系统的改正,改正管理应记录并对所有要求的改正进行分类,应评估改正恳求的风险、影响和业务利润。其主要目标是以对服务最小的扰乱实现有利的改正。改正管理是要对重要资源的新增、改正、升级等运维活动进行审查的功能,免得这些活动对现有资源的可用性造成没有必需的影响和损坏;同时,他还要实此刻工单中产生的变化进行后审计的功能.4.4。7配置管理配置管理流程负责核实基础设备和应用系统中实行的改正以及配置项之间的关系能否已经被正确记录下来;保证配置管理数据库能够正确地反应现存配置项的实质版本状态。配置管理其实是所有资源的一致管理的功能,包含资源整个生命周期的参数或配置的变化记录的管理。管理信息主要波及分类、型号、版本、地点,状态、有关资料等基本信息还包含核心参数等4。4。8知识库管理知识库管理:知识库是供应给运维人员重要的技术资料内容,他聚集在工作的碰到的典型事例概括总结的知识重点和全面适用资料手册.在本系统中,知识8运维管理制度库管理供应便于使用的人机接口、快速查问的技术手段和保护手段。统计及工作报告运维管理系统供应一线解决率统计、客户满意度统计、按分类的事件汇总统计、工作报告生成的功能,依照必定格式依据事件数据、工单数据、问题数据、配置数据、改正数据能够帮助运维管理者能把运维的所做的工作内容清楚的排列出来。5、运维服务内容5.1服务目标运维项目组供应的运转保护服务包含,信息系统有关的主机设备、操作系统、数据库和储存设备的运转保护服务,保证用户现有的信息系统的正常运转,降低整体管理成本,提高网络信息系统的整体服务水平.同时依据平常保护的数据和记录,供应用户信息系统的整体建设规划和建议,更好的为用户的信息化发展供应有力的保障。用户信息系统的构成主要可分为两类:硬件设备和软件系统。硬件设备包含网络设备、安全设备、主机设备、储存设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。服务项目范围覆盖的信息系统资源以下方面的重点状态及参数指标:运转状态、故障状况配置信息可用性状况及健康状况性能指标5.2IT财产统计服务服务内容包含:硬件设备型号、数目、版本等信息统计记录软件产品型号、版本和补丁等信息统计记录网络构造、网络路由、网络IP地点统计记录综合布线系统构造图的绘制9运维管理制度其余隶属设备的统计记录5.3网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。设备基础性能检测:CPU、内存使用状况监测;设备日记查察;设备SNMP状态;测试Ping,tracert等工具的连通性;网络安全策略应用能否正常;Internet带宽流量的及时监测;网络拓扑链路状态监测;异样网络数据包流量;Dos、ddos等网络攻击状况监测;Internet线路的误码率、丢包率监测;5.4主机、储存系统运维服务供应的主机、储存系统的运维服务包含:主机、储存设备的平常监控,设备的运转状态监控,故障办理,操作系统保护,补丁升级等内容。进行监控管理的内容包含:CPU性能管理;内存使用状况管理;硬盘利用状况管理;系统进度管理;主机性能管理;及时监控主机电源、电扇的使用状况及主机机箱内部温度;监控主机硬盘运转状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运转状况;主机系统文件系统管理;10运维管理制度监控储存互换机设备状态、端口状态、传输速度;监控备份服务进度、备份状况(起止时间、能否成功、犯错告警);监控记录磁盘阵列、磁带库等储存硬件故障提示和告警,并及时解决故障问题;对储存的性能(如高速缓存、光纤通道等)进行监控。5。5数据库系统运维服务供应的数据库运转保护服务是包含主动数据库性能管理,数据库的主动性能管理对系统运维特别重要。经过主动式性能管理可认识数据库的平常运转状态,辨别数据库的性能问题发生在什么地方,有针对性地进行性能优化.同时,亲密注意数据库系统的变化,主动地预防可能发生的问题。进行监控管理的内容包含:数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句.表空间使用信息监测;数据库文件I/0读写状况;Session连结数目监控;数据库监听运转状态监测;查察每天数据备份、数据同步能否正常;报警日记监测;对表和索引进行Analyze,检查表空间碎片;检测数据库后台进度;数据库对象的空间扩展状况监测;5.6中间件运维服务中间件管理是指对TongWeb、等国产中间件的平常保护管理和监控工作,提高对中间件平台事件的剖析解决能力,保证中间件平台连续稳固运转。中间件监控指标包含配置信息管理、故障监控、性能监控.履行线程:监控中间件配置履行线程的安闲数目。JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。11运维管理制度JDBC连结池:连结池的初始容量和最大容量应当设置为相等,而且起码等于履行线程的数目,以防止在运转过程中创立数据库连结所带来的性能耗费.检查中间件日记文件能否有异样报错假如有中间件集群配置,需要检查集群的配置能否正常。5.7终端、外设运维服务负责对终端PC、笔录本以及工作站的操作系统、应用软件和硬件的保护,解决使用人员在应用过程中碰到的问题并进行简单培训,达成打印机等其余外设的故障办理工作。6、应急服务响应举措运维项目组拟订了详细的应急办理方案,整个流程谨慎而有序.但在服务维护过程中,不测状况将难以完好防止.我们将对项目实行的突发风险进行详细分析,而且针对各种突发事件,设计了相应的预防与解决举措,同时供应了完好的应急办理流程。12运维管理制度6。1应急方案实行基本流程发现故障初步判断一般事件突发事件已解决启动应急方案,并通知领导按事件流程办理扩大应急未解决支援报告进度联系技术支持办理已解决突发记录事件未解决应急报告进度联系开发人员或组厂家工程师现场办理已解决报告故障恢复总结,订正应急方案6.2突发事件应急策略1)值班人员平常应做好应急事件的监控工作,关于突发事件应仔细剖析、正确判断故障发生的数据域,负责追踪该事件直至其结束.关于不在运维中心的故障,应在第一时间内通知负责人去现场办理,亲密关注事件流程及进展状况,并做好登记工作上报领导。2)正常状况下,要求值班人员在10分钟内进行事件确认。假如属于一般事件则依照事件流程进行分配办理,不然应快速启动《应急方案》,并严格依照《应急方案》所规定的步骤快速实行应急处理,及时报告上司领导,掌握及时办理状况。3)在办理过程中,如需其余部门去现场支援办理,应及时向上司领导部门报告,协调交流,赶快联系技术工程师或厂家技术支持赶赴现场救助办理。13运维管理制度7、服务管理制度规范7.1服务时间在5*8小时工作时间内设置由专人职责的热线电话,接听内部的服务恳求,并记录服务台事件办理结果。在非工作时间设置有专人7*24小时接听的挪动电话热线,用于解决内部的技术问题以及接听7*24小机遇房监控人员的机房突发状况报告。服务响应时间:故障级别响应时间故障解决时间I级:属于紧迫问题;其详细现象为:10分钟,30分钟内提交故障办理3小时之内系统崩溃致使业务停止、数据丢掉。方案级:属于严重问题;其详细现象为:10分钟,30分钟出现部分零件无效、系统性能降落但能内提交故障办理6小时之内正常运转,不影响正常业务运作.方案III级:属于较严重问题;其详细现象10分钟,30分钟为:出现系统报错或警示,但业务系统内提交故障办理12小时之内能连续运转且性能不受影响。方案IV级:属于一般问题;其详细现象为:10分钟,2小时系统技术功能、安装或配置咨询,或其内提交故障办理24小时之内他明显不影响业务的预定服务。方案7.2行为规范1)恪守用户的各项规章制度,严格依照用户相应的规章制度做事。2)与用户运转保护系统其余部门和环节共同工作,亲密配合,共同展开技术支持工作.3)出现疑难技术、业务问题和重要紧迫状况时,及时向负责人报告.(4)现场技术支持时要精神饱满,衣着得体,辞吐文明,举止隆重.接听电话时要文明礼貌,语言清楚了然,语气和蔼.(5)恪守保密原则。对被支持单位的网络、主机、系统软件、应用软件等14运维管理制度的密码、核心参数、业务数据等负有保密责任,不得任意复制和流传。15
/
本文档为【运维管理制度】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索