为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

软件系统运维指导手册

2020-05-22 3页 doc 168KB 214阅读

用户头像 机构认证

爱赢

公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)

举报
软件系统运维指导手册系统日常维护指导手册目录41、目的42、适用范围43、服务器及数据库概述43.1服务器概述43.2数据库概述54、系统服务程序的详细说明54.1系统服务程序的构成54.2系统服务程序的启动、关闭及维护管理54.2.1dhcp主服务54.2.1.1dhcp主服务说明54.2.1.2dhcp启动、关闭及进程查看方法64.2.1.3配置说明64.2.2dhcp从服务64.2.2.1dhcp从服务说明64.2.2.2dhcp启动、关闭及进程查看方法74.2.2.3配置说明74.2.3web管理模块74.2.3.1web管理模块中主要目...
软件系统运维指导手册
系统日常维护指导手册目录41、目的42、适用范围43、服务器及数据库概述43.1服务器概述43.2数据库概述54、系统服务程序的详细说明54.1系统服务程序的构成54.2系统服务程序的启动、关闭及维护管理54.2.1dhcp主服务54.2.1.1dhcp主服务说明54.2.1.2dhcp启动、关闭及进程查看方法64.2.1.3配置说明64.2.2dhcp从服务64.2.2.1dhcp从服务说明64.2.2.2dhcp启动、关闭及进程查看方法74.2.2.3配置说明74.2.3web管理模块74.2.3.1web管理模块中主要目录说明84.2.5.2web管理模块中各程序说明84.2.5.3web站点启动、关闭及进程查看方法84.2.5.4web日志说明84.2.5.5日常维护95、服务器硬件维护(略)96、linux系统的日常维护96.1定期检查磁盘空间106.2使用top工具监视cpu及内存的使用率106.3定期查看root邮件116.4定期查看系统日志117、备份策略117.1备份方式117.2备份117.3常见故障恢复127.3.1实例故障127.3.2介质故障149、数据库的日常维护149.1检查数据库的基本状况149.1.1检查oracle的进程159.1.2检查oracle监听进程169.1.3检查oracle实例状态179.2检查数据库日志文件179.3检查oracle对象的状态179.3.1检查oracle控制文件状态189.3.2检查oracle在线日志状态189.3.3检查oracle表空间的状态189.3.4检查oracle所有数据文件状态199.3.5检查Oracle所有回滚段的状态199.3.6检查Oracle所有表、索引、存储过程、触发器等对象的状态199.4监控数据库表空间的使用情况(字典管理表空间)209.4.1判断是否需要碎片整理209.4.2判断是否需要扩展表空间219.5查看数据库的连接情况229.6术语解释2210、命令解释1、目的网e通宽带网络运营支撑系统使用的服务器中,服务器均采用redhatlinuxas4操作系统,数据库版本为:oracle10g,随着业务的开展,oracle数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。本手册详细描述了程序模块,linux操作系统,DHCP双机热备、负载平衡及oracle数据库等日常检查的主要步骤,指导现场师对其进行监控和维护。2、适用范围使用者为网e通宽带网络运营支撑系统维护工程师3、服务器及数据库概述3.1服务器概述服务器数量:4台,基本信息如下: 服务器 机器型号 操作系统 安装的模块 主机名 Ip地址 主服务器 DELLPC RedHatlinuxAS4.0 Cm鉴权数据库业务支撑数据库主DHCP服务 oracle01 eth0:192.168.20.60 从服务器 DELLPC RedHatlinuxAS4.0 从DHCP服务 oracle02 eth0:192.168.20.613.2数据库概述数据库软件分别安装在主服务器上。/dev/mapper/VolGroup00-LogVol00逻辑卷上ORACLE_BASE=/opt/oracleORACLE_HOME=/opt/oracle/product/10.2.0ORACLE_SID=oracmts4、系统服务程序的详细说明4.1系统服务程序的构成DHCP主程序: 所在服务器 主服务器(ip:192.168.20.60) 程序名称 Dhcpd 所在目录 /opt/dpcpDHCP从程序: 所在服务器 从服务器(ip:192.168.20.61) 程序名称 Dhcpd 所在目录 /opt/dpcp4.2系统服务程序的启动、关闭及维护管理4.2.1dhcp主服务4.2.1.1dhcp主服务说明 所在目录 程序名称 程序简要说明 /opt/dpcp Dhcpd Dhcp主程序 /etc/dhcpd.conf 主程序的配置文件 /var/state/dhcp/dhcpd.leases 租约数据库 4.2.1.2dhcp启动、关闭及进程查看方法1、启动方法:输入:cd/opt/dpcp./dhcpd即可注意:请首先确认数据库服务正常,数据库监听正常。输出:[root@localhostdhcp]$./dhcpdInternetSystemsConsortiumDHCPServerV3.0.4Copyright2004-2006InternetSystemsConsortium.Allrightsreserved.Forinfo,pleasevisithttp://www.isc.org/sw/dhcp/Wrote1leasestoleasesfile.ListeningonLPF/eth0/00:0c:29:fb:d4:32/192.168.50/24SendingonLPF/eth0/00:0c:29:fb:d4:32/192.168.50/24SendingonSocket/fallback/fallback-net说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。2、关闭方法输入:killpid说明:pid为进程号,可使用进程查看获得。如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。3、进程查看输入:[root@localhostdhcp]#pstree-p|grepdhcp输出:|-dhcpd(4665)4.2.1.3配置说明启动配置文件:etc/dhcpd.conf可使用more或者tail命令查看配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与从服务器的配置文件吻合。配置文件全文如下:##DHCPServerConfigurationfile.#see/usr/share/doc/dhcp*/dhcpd.conf.sample#ddns-update-stylenone;failoverpeer"buptdhcp"{primary;address192.168.20.60;port519;peeraddress192.168.20.61;peerport520;max-response-delay60;max-unacked-updates10;mclt600;split128;loadbalancemaxseconds3;}subnet192.168.20.0netmask255.255.255.0{}#---------------cisico1_cm---------------------------subnet10.10.128.0netmask255.255.240.0{optionrouters10.10.128.1;filename"Disable.cm";next-server192.168.20.60;default-lease-time3600;pool{failoverpeer"buptdhcp";denydynamicbootpclients;range10.10.128.210.10.143.254;}}#---------------cisico1_iad---------------------------shared-networkcisico1_iad{subnet10.8.80.0netmask255.255.255.0{optionrouters10.8.80.1;optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;default-lease-time3600;pool{failoverpeer"buptdhcp";denydynamicbootpclients;range10.8.80.210.8.80.254;}}}#---------------cisico1_cpe---------------------------shared-networkcisico1_cpe{subnet219.234.16.0netmask255.255.248.0{optionrouters219.234.16.1;optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;default-lease-time3600;pool{failoverpeer"buptdhcp";denydynamicbootpclients;range219.234.16.2219.234.23.254;}}}租约数据库/var/state/dhcp/dhcpd.leases可使用more或者tail命令查看记录当前服务器与对方服务器的服务状态与分配的ip租约。示例如下:lease192.168.5.254{starts22007/11/2713:15:22;ends32007/11/2813:15:22;tstp32007/11/2813:15:22;bindingstateactive;nextbindingstatefree;hardwareethernet00:11:1a:07:2e:8e;uid"\001\000\021\032\007.\216";optionagent.remote-id0:11:1a:7:2e:8e;}Dhcp状态如下:failoverpeer"name"state{mystatenormalat2007/11/2713:15:22;peerstatenormalat2007/11/2713:15:22;}4.2.2dhcp从服务4.2.2.1dhcp从服务说明 所在目录 程序名称 程序简要说明 /opt/dpcp Dhcpd Dhcp主程序 /etc/dhcpd.conf 主程序的配置文件 /var/state/dhcp/dhcpd.leases 租约数据库 所在目录 程序名称 程序简要说明 /opt/dpcp Dhcpd Dhcp主程序 /etc/dhcpd.conf 主程序的配置文件 /var/state/dhcp/dhcpd.leases 租约数据库 4.2.2.2dhcp启动、关闭及进程查看方法1、启动方法:输入:cd/opt/dpcp./dhcpd即可注意:请首先确认数据库服务正常,数据库监听正常。输出:[root@localhostdhcp]$./dhcpdInternetSystemsConsortiumDHCPServerV3.0.4Copyright2004-2006InternetSystemsConsortium.Allrightsreserved.Forinfo,pleasevisithttp://www.isc.org/sw/dhcp/Wrote1leasestoleasesfile.ListeningonLPF/eth0/00:0c:29:fb:d4:32/192.168.50/24SendingonLPF/eth0/00:0c:29:fb:d4:32/192.168.50/24SendingonSocket/fallback/fallback-net说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。2、关闭方法输入:killpid说明:pid为进程号,可使用进程查看获得。如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。3、进程查看输入:[root@localhostdhcp]#pstree-p|grepdhcp输出:|-dhcpd(4665)4.2.2.3配置说明启动配置文件:etc/dhcpd.conf可使用more或者tail命令查看.配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与主服务器的配置文件吻合。配置文件全文如下:##DHCPServerConfigurationfile.#see/usr/share/doc/dhcp*/dhcpd.conf.sample#ddns-update-stylenone;failoverpeer"buptdhcp"{secondary;address192.168.20.61;port520;peeraddress192.168.20.60;peerport519;max-response-delay60;max-unacked-updates10;mclt600;#split128;loadbalancemaxseconds3;}subnet192.168.20.0netmask255.255.255.0{}#---------------cisico1_cm---------------------------subnet10.10.128.0netmask255.255.240.0{optionrouters10.10.128.1;filename"Disable.cm";next-server192.168.20.60;default-lease-time3600;pool{failoverpeer"buptdhcp";denydynamicbootpclients;range10.10.128.210.10.143.254;}}#---------------cisico1_iad---------------------------shared-networkcisico1_iad{subnet10.8.80.0netmask255.255.255.0{optionrouters10.8.80.1;optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;default-lease-time3600;pool{failoverpeer"buptdhcp";denydynamicbootpclients;range10.8.80.210.8.80.254;}}}#---------------cisico1_cpe---------------------------shared-networkcisico1_cpe{subnet219.234.16.0netmask255.255.248.0{optionrouters219.234.16.1;optiondomain-name-servers219.150.32.132,219.150.150.150,219.146.0.130;default-lease-time3600;pool{failoverpeer"buptdhcp";denydynamicbootpclients;range219.234.16.2219.234.23.254;}}}租约数据库/var/state/dhcp/dhcpd.leases记录当前服务器与对方服务器的服务状态与分配的ip租约。示例如下:lease192.168.5.254{starts22007/11/2713:15:22;ends32007/11/2813:15:22;tstp32007/11/2813:15:22;bindingstateactive;nextbindingstatefree;hardwareethernet00:11:1a:07:2e:8e;uid"\001\000\021\032\007.\216";optionagent.remote-id0:11:1a:7:2e:8e;}Dhcp状态如下:failoverpeer"name"state{mystatenormalat2007/11/2713:15:22;peerstatenormalat2007/11/2713:15:22;}4.2.3web管理模块4.2.3.1web管理模块中主要目录说明/opt/apache-2.0.52为apache模块所在目录/opt/taiyuan为web程序存储目录4.2.5.2web管理模块中各程序说明命令所在目录:/opt/apache/bin 命令 命令说明 apachectl ApacheHTTP服务器控制接口 httpd Apache超文本传输服务器 ab ApacheHTTP服务器性能测试工具 apxs APache功能扩展工具 dbmmanage 建立和更新DBM形式的基本认证文件 htdigest 建立和更新摘要认证文件 htpasswd 建立和更新基本认证文件 logresolve 将Apache日志文件中的IP地址解析为主机名 rotatelogs 滚动Apache日志而无须终止服务器4.2.5.3web站点启动、关闭及进程查看方法 命令所在目录 命令 命令说明 /opt/apache/bin ./apachectlstart 启动httpd /opt/apache/bin ./apachectlstartssl 启动httpd并加载SSL服务 /opt/apache/bin ./apachectlstop 关闭apache /opt/apache/bin ./apachectlstatus 查看apache的状态4.2.5.4web日志说明Log存放目录为:/opt/apache/logs/opt/apache/logs/access_log为所有访问网站的日志/opt/apache/logs/error_log为错误信息日志/opt/apache/logs/httpd.pid为主进程的pid号/opt/apache/logs/ssl_engine_log为ssl引擎日志,即ssl的运行日志,可以通过查看此日志了解运行状态及错误。/opt/apache/logs/ssl_request_log为ssl请求日志即是哪个ip使用httpsssi协议登录web站点,请求的时间,,访问的页面等。4.2.5.5日常维护维护分为:业务维护及系统维护业务维护就是,利用系统管理员的身份,查看操作日志系统维护是:定期查看系统日志,apache日志等,看是否有运行错误,并定期备份日志。5、服务器硬件维护(略)6、linux系统的日常维护6.1定期检查磁盘空间使用df显示磁盘空间输入:[oracle@localhostserver]$df输出:Filesystem1K-blocksUsedAvailableUse%Mountedon/dev/cciss/c0d0p21079383367612144948432088%//dev/cciss/c0d0p1101086123088355913%/bootnone2073908420739041%/dev/shm/dev/cciss/c0d0p530976636185056292180161%/home说明:这里显示了/、/boot、/home分区挂载的系统分区使用的大小,磁盘空间以k为单位。可以加参数-h[oracle@localhostserver]$df-hFilesystemSizeUsedAvailUse%Mountedon/dev/cciss/c0d0p2103G7.3G91G8%//dev/cciss/c0d0p199M13M82M13%/bootnone2.0G4.0K2.0G1%/dev/shm/dev/cciss/c0d0p530G181M28G1%/home注意:当某空间使用率超过85%时,通过du查看是哪些文件占用的空间比较大例如/home使用了85%cd/home以root用户查看su输入root用户密码[root@localhost/]#du-m--max-depth=1-m是以M大小显示--max-depth=1表示只是一级子目录的大小,如果想查看二级的就写为2找出占用很大的文件,经判断后决定删除或转移。6.2使用top工具监视cpu及内存的使用率每隔5秒,top工具确定哪些进程消耗最多的cpu时间,并按递减顺序在屏幕显示。输入:[oracle@localhost/]$top输出:top-10:52:46up6days,39min,2users,loadaverage:0.12,0.09,0.02Tasks:123total,1running,122sleeping,0stopped,0zombieCpu(s):0.2%us,0.2%sy,0.0%ni,99.3%id,0.4%wa,0.0%hi,0.0%siMem:8247956ktotal,1828612kused,6419344kfree,119476kbuffersSwap:8385920ktotal,0kused,8385920kfree,1526064kcachedPIDUSERPRNIVIRTRESSHRS%CPU%MEMTIME+COMMAND1root1603004552472S0.00.00:01.02init2rootRT0000S0.00.00:01.28migration/03root3419000S0.00.00:00.04ksoftirqd/04rootRT0000S0.00.00:01.28migration/15root3419000S0.00.00:00.04ksoftirqd/16rootRT0000S0.00.00:00.65migration/2说明:当发现个别进程占用率很高,可以通过用“ps–axj|grep进程名”查看这个进程在进行什么操作,如果发现这个进程持续的时间很长,而且非系统必要进程;可以通过“kill–9”进程的PID号,将进程杀死。(不确定情况下,请不要使用);退出top用ctrl+c。6.3定期查看root邮件输入:[oracle@localhostlog]$su-lPassword:[root@localhostroot]#mail输出:1root@localhost.localFriSep816:2318/704"HPInsightManagementAgentsTrapAlarm"N2root@localhost.localFriSep816:2318/684"HPAgentTrapAlert"N3root@localhost.localFriSep816:2319/748"HPInsightManagementAgentsTrapAlarm"说明:前面为N的表示新邮件可以在&后面输入1,代表看第一封信,ctrl+c表示退出查看这封信,h显示所有的如果都看过的邮件,就可以通过d来删除如果删除1-10就用&d1-10这样就会删除1-10的信。6.4定期查看系统日志系统的日志存储于/var/log目录下,需要定期查看,常用日志说明如下:boot.log:该文件记录了系统在引导过程中发生的事件,就是Linux系统开机自检过程显示的信息maillog:该日志文件记录了每一个发送到系统或从系统发出的电子邮件的活动messages:该日志文件是许多进程日志文件的汇总,从该文件可以看出任何入侵企图或成功的入侵lastlog:该日志文件记录最近成功登录的事件和最后一次不成功的登录事件,由login生成wtmp:该日志文件永久记录每个用户登录、注销及系统的启动、停机的事件xferlog:该日志文件记录FTP会话,可以显示出用户向FTP服务器或从服务器拷贝了什么文件cron:该日志文件记录crontab守护进程crond所派生的子进程的动作,前面加上用户、登录时间和PID,以及派生出的进程的动作7、备份策略7.1备份方式为了保证数据库的高安全性,目前我们采用的数据库备份方式为物理备份和逻辑备份相结合的方式,数据库归档模式为自动归档模式。这样当数据库出现故障时,我们就可以利用备份文件与归档方法相结合,作数据库“最新状态”的恢复。7.2备份计划通过自动备份脚本实现每天进行一次热备份及逻辑备份,每周进行一次冷备份。所备份的数据文件存储于磁阵上的硬盘。7.3常见故障恢复我们首先从/opt/oracle/admin/oracmts/bdump下的日志文件判断是什么故障。通过查看v$recover_file来确定哪些文件需要恢复,通过查看v$datafile视图查看文件ID和文件名之间的相关性通过下面的命令查看需要恢复的数据文件的文件ID号:selectfile#,online,errorfromv$recover_file;通过视图返回名字和相应的文件ID:selectname,file#fromv$datafile;通过这些信息,决定对哪些文件进行恢复,及其采用的恢复方式。7.3.1实例故障当oracle实例由于突然断电或者操作系统故障而崩溃时,可以通过输入dbstart即可开启数据库,无须发布恢复命令,oracle会自动执行崩溃恢复,最好启动前后检查日志文件7.3.2介质故障介质故障发生在数据库结构组织出现毁坏时,在这些组织中数据库文件不能进行读写。在数据库打开的情况下,如果是system表空间的数据文件出现介质失败,那么oracle需要在mount状态下恢复其数据文件,如果是其他表空间,可以只对介质失败涉及到的数据文件进行恢复,即在数据库打开的状态下进行恢复。步骤如下:1.确定需要恢复的数据文件2.使数据文件脱机3.拷贝数据文件备份到原目标地址4.恢复表空间或数据文件5.使表空间或数据文件联机例:当出现以下信息时,说明是数据库的system表空间出现了问题。ERROR:ORA-00604:erroroccurredatrecursiveSQLlevel1ORA-01116:errorinopeningdatabasefile1ORA-01110:datafile1:'/opt/oracle/oradata/oracmts/system01.dbf'ORA-27041:unabletoopenfileLinuxError:2:NosuchfileordirectoryAdditionalinformation:3System出现介质失败,表示被误删或被损坏,可以执行如下:1)首先登录SQL*PLUS并启用SYSDBA权限输入::sqlplususer/passwd@oracmts;connect/assysdba;(启动SYSDBA权限)shutdownabort(关闭数据库)startupmount(加载数据库)也可以通过查看视图,确定哪个文件需要恢复SQL>selectfile#,errorfromv$recover_file;FILE#ERROR---------------------------------------------------------------------------1FILENOTFOUND查看v$datafile视图查看对应关系SQL>selectfile#,namefromv$datafile;FILE#----------NAME--------------------------------------------------------------------------------1/opt/oracle/oradata/oracmts/system01.dbf2/opt/oracle/oradata/oracmts/undotbs01.dbf3/opt/oracle/oradata/oracmts/sysaux01.dbfFILE#----------NAME--------------------------------------------------------------------------------4/opt/oracle/oradata/oracmts/users01.dbf知道要恢复的是1(system01.dbf):2)在SQL>提示符下输入alterdatabasedatafile'/opt/oracle/oradata/oracmts/system01.dbf'offline;3)再打开一个终端:将备份数据文件拷贝到原目标地址,即:cp/opt/backup/system01.dbf/opt/oracle/oradata/oracmts/4)然后进行恢复SQL>recoverdatafile1;或recoverdatafile'/opt/oracle/oradata/oracmts/system01.dbf';如果不需要归档日志文件进行恢复,即输出Mediarecoverycomplete.如果需要归档日志文件参与恢复,即输出:ORA-00279:change2246878generatedat07/22/200516:28:13neededforthread1ORA-00289:suggestion:/opt/oracle/oradata/archive/1_167_562355694.dbfORA-00280:change2246878forthread1isinsequence#167Specifylog:{<RET>=suggested|filename|AUTO|CANCEL}输入:auto即可自动完成恢复。输出:ORA-00279:change2366990generatedat07/25/200500:00:09neededforthread1ORA-00289:suggestion:/opt/oracle/oradata/archive/1_185_562355694.dbfORA-00280:change2366990forthread1isinsequence#185ORA-00278:logfile'/opt/oracle/oradata/archive/1_184_562355694.dbf'nolongerneededforthisrecoveryORA-00279:change2375106generatedat07/25/200504:00:54neededforthread1ORA-00289:suggestion:/opt/oracle/oradata/archive/1_186_562355694.dbfORA-00280:change2375106forthread1isinsequence#186ORA-00278:logfile'/opt/oracle/oradata/archive/1_185_562355694.dbf'nolongerneededforthisrecoveryLogapplied.Mediarecoverycomplete.(表示恢复结束)5)在SQL>提示符下输入alterdatabasedatafile'/opt/oracle/oradata/oracmts/system01.dbf'online;6)打开数据库即可,在SQL>提示符下输入alterdatabaseopen其他数据文件恢复方法类似,只需要把数据文件的名字更改即可。注:如果维护工程师没有数据库恢复经验,或判断不出数据库的故障原因,请联系我们的工程师,我们一起协商解决。9、数据库的日常维护9.1检查数据库的基本状况主要介绍如何对数据库的基本情况进行检查,内容共分三部分,分别为:检查oracle的进程;检查oracle监听进程;检查oracle实例状态。9.1.1检查oracle的进程输入:ps-ef|grep"ora_"|grep-vgrep输出:1851085108510?-1Ss5000:00ora_pmon_oracmts1851285128512?-1Ss5000:05ora_psp0_oracmts1851485148514?-1Ss5000:00ora_mman_oracmts1851685168516?-1Ss5000:04ora_dbw0_oracmts1851885188518?-1Ss5000:04ora_lgwr_oracmts1852085208520?-1Ss5000:11ora_ckpt_oracmts1852285228522?-1Ss5000:09ora_smon_oracmts1852485248524?-1Ss5000:00ora_reco_oracmts1852685268526?-1Ss5000:05ora_cjq0_oracmts1852885288528?-1Ss5000:14ora_mmon_oracmts1853085308530?-1Ss5000:05ora_mmnl_oracmts1853285328532?-1Ss5000:00ora_d000_oracmts1853485348534?-1Ss5000:00ora_s000_oracmts1853985398539?-1Ss5000:00ora_arc0_oracmts1854185418541?-1Ss5000:00ora_arc1_oracmts1854585458545?-1Ss5000:00ora_qmnc_oracmts1858085808580?-1Ss5000:00ora_q000_oracmts1858385838583?-1Ss5000:00ora_q001_oracmts说明:在检查oracle的进程命令输出后,输出显示至少应包括以下一些进程:·oracle写数据文件的进程,输出显示为:“ora_dbw0_oracmts”·oracle写日志文件的进程,输出显示为:“ora_lgwr_oracmts”·oracle监听实例状态的进程,输出显示为:“ora_smon_oracmts”·oracle监听客户端连接进程状态的进程,输出显示为:“ora_pmon_oracmts”·oracle进行归档的进程,输出显示为:“ora_arc0_oracmts”·oracle进行检查点的进程,输出显示为:“ora_ckpt_oracmts”·oracle进行恢复的进程,输出显示为:“ora_reco_oracmts”·注:上面进程中的oracmts是数据库的实例名,必须为oracmts,否则为错误。9.1.2检查oracle监听进程输入:lsnrctlstatus输出:LSNRCTLforLinux:Version10.2.0.1.0-Productionon24-OCT-200617:22:28Copyright(c)1991,2005,Oracle.Allrightsreserved.Connectingto(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=oracle02)(PORT=1521)))STATUSoftheLISTENER------------------------AliasLISTENERVersionTNSLSNRforLinux:Version10.2.0.1.0-ProductionStartDate24-OCT-200617:22:23Uptime0days0hr.0min.5secTraceLeveloffSecurityON:LocalOSAuthenticationSNMPONListenerParameterFile/opt/oracle/product/10.2.0/network/admin/listener.oraListenerLogFile/opt/oracle/product/10.2.0/network/log/listener.logListeningEndpointsSummary...(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=oracle02)(PORT=1521)))(DESCRIPTION=(ADDRESS=(PROTOCOL=ipc)(KEY=EXTPROC0)))ServicesSummary...Service"PLSExtProc"has1instance(s).Instance"PLSExtProc",statusUNKNOWN,has1handler(s)forthisservice...Service"oracmts"has1instance(s).Instance"oracmts",statusUNKNOWN,has1handler(s)forthisservice...Thecommandcompletedsuccessfully说明:“ServicesSummary”项表示oracle的监听进程正在监听哪些数据库的实例,输出显示中至少应该有“oracmts”这一项。9.1.3检查oracle实例状态输入:[oracle@localhostoracle]$sqlplus/nologSQL>connect/assysdba;SQL>selectinstance_name,version,status,database_statusfromv$instance;输出:INSTANCE_NAMEVERSIONSTATUSDATABASE_STATUS--------------------------------------------------------------oracmts10.2.0.1.0OPENACTIVE说明:其中“STATUS”表示oracle当前的状态,必须为“OPEN”;“DATABASE_STATUS”表示oracle当前数据库的状态,必须为“ACTIVE”。输入:SQL>archiveloglist;输出:DatabaselogmodeArchiveModeAutomaticarchivalEnabledArchivedestination/opt/oracle/oradata/archiveOldestonlinelogsequence5Nextlogsequencetoarchive7Currentlogsequence7说明:其中Databaselogmode表示oracle当前的归档方式,“ArchiveMode”表示数据库运行在归档模式下,我们数据库必须运行在归档方式下。9.2检查数据库日志文件Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况:·数据库的启动、关闭,启动时的非缺省参数;·数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因;·对数据库进行的某些操作,如创建或删除表空间、增加数据文件;·数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600)输入:cat/opt/oracle/admin/oracmts/bdump/alert_oracmts.log|grep-iora-cat/opt/oracle/admin/oracmts/bdump/alert_oracmts.log|grep-ifailcat/opt/oracle/admin/oracmts/bdump/alert_oracmts.log|grep-ierr说明:查看“ora-”,“fail”,“err”等出错信息。有关“ora-”错误信息,可以到oracle官方网站上查询。9.3检查oracle对象的状态主要介绍检查相关oracle对象的状态,内容包括五个部分,分别为:检查oracle控制文件状态;检查oracle在线日志状态;检查oracle表空间的状态;检查oracle所有数据文件状态;检查Oracle所有回滚段的状态。9.3.1检查oracle控制文件状态输入:SQL>select*fromv$controlfile;输出:STATUSNAMEIS_BLOCK_SIZEFILE_SIZE_BLKS/opt/oracle/oradata/oracmts/control01.ctlNO16384430/opt/oracle/oradata/oracmts/control02.ctlNO16384430/opt/oracle/oradata/oracmts/control03.ctlNO16384430说明:输出结果应该有3条以上(包含3条)的记录,“STATUS”应该为空,状态为空表示控制文件状态正常。9.3.2检查oracle在线日志状态输入:SQL>select*fromv$logfile;输出:GROUP#STATUSTYPEMEMBERIS_3ONLINE/opt/oracle/oradata/oracmts/redo03.logNO2ONLINE/opt/oracle/oradata/oracmts/redo02.logNO1ONLINE/opt/oracle/oradata/oracmts/redo01.logNO说明:其中“STATUS”应该都为“ONLINE”。9.3.3检查oracle表空间的状态输入:SQL>selecttablespace_name,statusfromdba_tablespaces;输出:TABLESPACE_NAMESTATUS---------------------------------------SYSTEMONLINEUNDOTBS1ONLINESYSAUXONLINETEMPONLINEUSERSONLINEAPPTBS01ONLINE说明:其中“STATUS”都应该为“ONLINE”。9.3.4检查oracle所有数据文件状态输入:SQL>selectname,statusfromv$datafile;输出:NAMESTATUS/opt/oracle/oradata/oracmts/system01.dbfSYSTEM/opt/oracle/oradata/oracmts/undotbs01.dbfONLINE/opt/oracle/oradata/oracmts/sysaux01.dbfONLINE/opt/oracle/oradata/oracmts/users01.dbfONLINE/opt/oracle/oradata/oracmts/apptbs01.dbfONLINE说明:输出结果中“STATUS”应该为“ONLINE”,其中system01.dbf状态值为SYSTEM,9.3.5检查Oracle所有回滚段的状态输入:SQL>selectsegment_name,statusfromdba_rollback_segs;输出:SEGMENT_NAMESTATUS----------------------------------------------SYSTEMONLINE_SYSSMU1$ONLINE_SYSSMU2$ONLINE_SYSSMU3$ONLINE_SYSSMU4$ONLINE_SYSSMU5$ONLINE_SYSSMU6$ONLINE_SYSSMU7$ONLINE_SYSSMU8$ONLINE_SYSSMU9$ONLINE_SYSSMU10$ONLINE说明:输出结果中所有回滚段的“STATUS”应该为“ONLINE”。9.3.6检查Oracle所有表、索引、存储过程、触发器等对象的状态输入:selectowner,object_name,object_typefromdba_objectswherestatus!='VALID'andowner!='SYS'andowner!='SYSTEM';输出:norowsselected说明:如果有记录返回,则说明存在无效的对象。若这些对象与我们应用相关,那么需要重新生成这个对象。9.4监控数据库表空间的使用情况(字典管理表空间)数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,维护工程师应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。9.4.1判断是否需要碎片整理输入:selecttablespace_name,count(*)chunks,max(bytes/1024/1024)max_chunkfromdba_free_spacegroupbytablespace_name;输出:TABLESPACE_NAMECHUNKSMAX_CHUNKUNDOTBS1137.9375SYSAUX13.3125APPTBS0111847.9375USERS142.5625SYSTEM29.9375说明:其中,CHUNKS列表示表空间中有多少可用的空闲块(每个空闲块是由一些连续的Oracle数据块组成),如果这样的空闲块过多,比如平均到每个数据文件上超过了100个,那么该表空间的碎片状况就比较严重了,可以尝试用以下的SQL命令进行表空间相邻碎片的接合:altertablespace表空间名coalesce;然后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减少。如果没有效果,并且表空间的碎片已经严重影响到了数据库的运行,则考虑对该表空间进行重建。9.4.2判断是否需要扩展表空间输入:selectb.file_id"File#",      b.tablespace_name,      b.bytesAll_space,      sum(nvl(a.bytes,0))"free",      (sum(nvl(a.bytes,0))/(b.bytes))*100"%free"fromdba_free_spacea,dba_data_filesbwherea.file_id=b.file_idgroupbyb.tablespace_name,b.file_id,b.bytesorderbyb.tablespace_name;输出:File#TABLESPACE_NAMEALL_SPACEfree%free5APPTBS012147483648193770291290.23132323SYSAUX31457280034734081.104166671SYSTEM513802240108134402.104591842UNDOTBS1262144001717043265.54USERS773324804463001657.7118644说明:ALL_SPACE表示表空间总的字节数,free表示空闲的字节数,%free为空闲的百分率,当空闲的百分率小于10时,就需要增加数据文件来扩展表空间,而不要是用数据文件的自动扩展功能。扩展表空间的方法:输入:alterdatabasedatafile'数据文件的位置'resize扩展后的大小;例如扩展system表空间到800Malterdatabasedatafile'/opt/oracle/oradata/oracmts/system01.dbf'resize800M;输出:Databasealtered.再查看表空间的使用情况,输出:File#TABLESPACE_NAMEALL_SPACEfree%free----------------------------------------------------------------------1SYSTEM83886080033587200040.0390625可以看出表空间扩展成功了。9.5查看数据库的连接情况DBA要定时对数据库的连接情况进行检查,看与数据库建立的会话数目是不是正常,如果建立了过多的连接,会消耗数据库的资源。同时,对一些“挂死”的连接,可能会需要DBA手工进行清理。输入:selectsid,serial#,username,program,machine,statusfromv$session;输出:SIDSERIAL#USERNAMEPROGRAMMACHINESTATUS1418698oracle@oracle02(J000)oracle02ACTIVE142462SYSsqlplus@oracle02(TNSV1-V3)oracle02ACTIVE说明:SID会话(session)的ID号;SERIAL#会话的序列号,和SID一起用来唯一标识一个会话;USERNAME建立该会话的用户名;PROGRAM这个会话是用什么工具连接到数据库的;STATUS当前这个会话的状态,ACTIVE表示会话正在执行某些任务,INACTIVE表示当前会话没有执行任何操作;如果DBA要手工断开某个会话,则执行:altersystemkillsession'SID,SERIAL#';注意,上例中SID为1到7(USERNAME列为空)的会话,是Oracle的后台进程,不要对这些会话进行任何操作。9.6术语解释•Oracle的实例:由Oracle的内存结构和Oracle进程组成的集合。一般由ORACLE_SID环境变量定义。•Oracle的监听进程:Oracle是一个基于client/server体系结构的应用程序。Oracle服务进程和客户端进程之间通过Oracle监听进程进行连接和转发。Oracle监听进程一般在数据库服务器的1521号端口进行监听。•Oracle控制文件:Oracle系统文件之一。用来存放Oracle主要的控制信息,如:日志文件的位置,数据文件的位置,数据库名字,数据库归档信息等等。•Oracle在线日志:Oracle所有增、删、改等操作都记录在在线日志中。通过在线日志和归档日志,Oracle就可以跟踪所有的数据库更改操作,就可以做完整的数据恢复。•Oracle表空间:Oracle所有对象都存储在表空间中,表空间是Oracle数据库中的逻辑存储单元。它在数据库中的概念类似于操作系统中文件的概念,不同的是每个表空间可以由一个或多个数据文件构成。•Oracle回滚段:Oracle用回滚段来保存用户已经修改但没有递交的信息。回滚段中的信息可以用来将没递交的信息进行回退,同时也可以保证用户视图的读一致性。•Oracle检查点:Oracle将内存中所有已经修改但没有写入数据文件的信息集中写入的过程叫做检查点,checkpoint。•Oracle的归档和非归档模式:Oracle在归档模式下时只有当一个在线日志已经归档结束后才能被Oracle实例重新写入。非归档模式下在线日志不用归档完成就可以被Oracle实例重新写入。•Cron:Unix操作系统的一个进程,它可以定时执行一些脚本。•ORACLE_BASE:安装所有管理脚本和其他与oracle相关的文件的基本目录。•ORACLE_HOME:安装所有oracle软件的位置。•ORACLE_SID:oracle实例名。10、命令解释•ps:操作系统用来检查系统进程的命令。•pstree:操作系统用来检查系统进程的命令。•tail:操作系统中用来查看文件内容的特殊方法,加参数-f使tail不停地去读最新的内容•cd:操作系统中用来切换目录。•top:操作系统用来显示,管理执行中的程序。•su:操作系统中用来变更用户身份。•du:操作系统用来显示目录或文件的大小。•mail:操作系统E-mail的管理程序•df:操作系统用来显示磁盘空间。•cat:操作系统用来浏览一个文件的命令。•more:操作系统用来浏览一个文件的命令,类似与cat。•ls:操作系统用来显示文件和目录的命令。•grep:操作系统用来在文件中进行字符串查找的命令。•sqlplus:Oracle提供的一个工具,用来执行标准SQL语句,以对数据库进行操作。•lsnrctl:Oracle提供的一个工具,可以用来启动、停止Oracle监听进程以及检查Oracle监听进程的状态。可编辑word可编辑word可编辑word
/
本文档为【软件系统运维指导手册】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索