|
知识路径: > 信息系统数据资源维护 > 信息系统数据资源例行管理 > Oracle数据库监控技术 >
|
被考次数:3次
被考频率:中频率
总体答错率:63%  
知识难度系数:
|
由 软考在线 用户真实做题大数据统计生成
|
相关知识点:26个
|
|
|
|
作为Oracle数据库管理人员,如何及时发现数据库系统潜在的问题,实时掌握系统运行的状况,提高工作效率,是一个值得注意的问题。Oracle数据库的监控可以通过系统自带的语句或者一些监控软件如:Spotlight on Oracle。下面介绍通过系统自带的命令进行监控的方式。
|
|
|
|
包含:检查Oracle实例状态,检查Oracle服务进程,检查Oracle监听进程,共6个部分。
|
|
|
|
|
其中“STATUS”表示Oracle当前的实例状态,必须为“OPEN”;“DATABASE_STATUS”表示Oracle当前数据库的状态,必须为“ACTIVE”。
|
|
|
|
|
输出结果应该有3条以上(包含3条)记录,“STATUS”应该为非“INVALID”,非“DELETED”。注:“STATUS”显示为空表示正常。
|
|
|
|
|
|
|
|
输出结果中“STATUS”应该都为“ONLINE”。或者:
|
|
|
|
输出结果中“STATUS”应该都为“AVAILABLE”。
|
|
|
|
|
如果有记录返回,则说明存在无效对象。若这些对象与应用相关,那么需要重新编译生成这个对象,或者:
|
|
|
|
|
|
输出结果中所有回滚段的“STATUS”应该为“ONLINE”。
|
|
|
|
|
|
|
检查Oracle各个表空间使用情况,检查一些扩展异常的对象。
|
|
|
检查system表空间内的内容,检查对象的下一扩展与表空间的最大扩展值,总共七个部分。
|
|
|
|
|
若LIMIT_VALU-MAX_UTILIZATION<=5,则表明与RESOURCE_NAME相关的Oracle初始化参数需要调整。可以通过修改Oracle初始化参数文件$ORACLE_BASE/admin/CKDB/pfile/initORCL.ora来修改。
|
|
|
|
|
|
其中,SID是会话(session)的ID号;SERIAL#是会话的序列号,和SID一起用来唯一标识一个会话;USERNAME是建立该会话的用户名;PROGRAM是这个会话是用什么工具连接到数据库的;STATUS是当前这个会话的状态,ACTIVE表示会话正在执行某些任务,INACTIVE表示当前会话没有执行任何操作。
|
|
|
如果建立了过多的连接,会消耗数据库的资源,同时,对一些“死锁”的连接可能需要手工进行清理。如果DBA要手工断开某个会话,则执行:
|
|
|
|
注意:上例中SID为1到10(USERNAME列为空)的会话,是Oracle的后台进程,不要对这些会话进行任何操作(注意:一般不建议使用这种方式去杀掉数据库的连接,这样有时候session不会断开。容易引起死连接。建议通过sid查到操作系统的spid,使用ps-eflgrep spidno的方式确认spid不是ORACLE的后台进程。使用操作系统的kill-9命令杀掉连接)。
|
|
|
|
如果文件系统的剩余空间过小或增长较快,需对其进行确认并删除不用的文件以释放空间。
|
|
|
|
|
|
如果空闲率%Free小于10%以上(包含10%),则注意要增加数据文件来扩展表空间而不要是用数据文件的自动扩展功能。请不要对表空间增加过多的数据文件,增加数据文件的原则是每个数据文件大小为2G或者4G,自动扩展的最大限制在8G。
|
|
|
|
|
如果有记录返回,则这些对象的扩展已经快达到它定义时的最大扩展值。对于这些对象要修改它的存储结构参数。
|
|
|
|
|
如果记录返回,则表明system表空间内存在一些非system和sys用户的对象。应该进一步检查这些对象是否与应用相关。如果相关请把这些对象移到非System表空间,同时应该检查这些对象属主的缺省表空间值。
|
|
|
|
|
如果有记录返回,则表明这些对象的下一个扩展大于该对象所属表空间的最大扩展值,需调整相应表空间的存储参数。
|
|
|
|
包含:①检查数据库备份日志信息;②检查backup卷中文件产生的时间;③检查Oracle用户的Email。
|
|
|
|
假设:备份的临时目录为/backup/hotbakup,需要检查2017年7月22日的备份结果,则用下面的命令来检查:
|
|
|
|
备份脚本的日志文件为hotbackup-月份-日期-年份.log,在备份的临时目录下面。如果文件中存在“ERROR:”,则表明备份没有成功,存在问题需要检查。
|
|
|
|
|
backup卷是备份的临时目录,查看输出结果中文件的日期,都应当是在当天凌晨由热备份脚本产生的。如果时间不对则表明热备份脚本没执行成功。
|
|
|
|
|
热备份脚本是通过Oracle用户的cron去执行的。cron执行完后操作系统就会发一条Email通知Oracle用户任务已经完成。查看Oracle Email中今天凌晨部分有无ORA-,Error,Failed等出错信息,如果有则表明备份不正常。
|
|
|
|
在本节主要检查Oracle数据库性能情况,包含:检查数据库的等待事件,检查死锁及处理,检查CPU、I/O、内存性能,查看是否有僵死进程,检查行链接/迁移,定期做统计分析,检查缓冲区命中率,检查共享池命中率,检查排序区,检查日志缓冲区,总共10个部分。
|
|
|
|
|
如果数据库长时间持续出现大量像latch free,enqueue,buffer busy waits,db file sequential read,db file scattered read等等待事件时,需要对其进行分析,可能存在问题的语句。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
记录数据库的CPU使用、IO、内存等使用情况,使用vmstat,iostat,sar,top等命令进行信息收集并检查这些信息,判断资源使用情况。
|
|
|
|
|
注意剩余的CPU使用量,当其平均值下降至10%以下时视为CPU使用率异常,需记录下该数值,并将状态记为异常。
|
|
|
|
|
如上所示,2026表示系统总内存、1958表示系统使用的内存、67表示系统剩余内存,当剩余内存低于总内存的10%时视为异常。
|
|
|
|
|
如上所示,“Device”行表示磁盘读写情况,”cug-cpo”行表示CPU、“sda”行表示IO等待情况。
|
|
|
|
|
如上所示,15表示系统负载,后面的3个数值如果有高于2.5的时候就表明系统在超负荷运转了,并将此值记录到巡检表,视为异常。
|
|
|
|
|
有些僵尸进程有阻塞其他业务的正常运行,定期杀掉僵尸进程。
|
|
|
|
|
注:含有long raw列的表有行链接是正常的,找到迁移行保存到chained_rows表中,如没有该表执行../rdbms/admin/utlchain.sql进行该表的创建,如果想统计表的链接记录和迁移记录,可使用:
|
|
|
|
可通过表chained_rows中table_name,head_rowid看出哪些行是迁移行。
|
|
|
|
|
对于采用Oracle Cost-Based-Optimizer的系统,需要定期对数据对象的统计信息进行采集更新,使优化器可以根据准备的信息作出正确的explain plan。在以下情况更需要进行统计信息的更新。
|
|
|
|
|
|
|
|
如果行数相差很多,则该表需要更新统计信息,建议一周做一次统计信息收集,具体如下所示。
|
|
|
|
|
|
如果命中率低于90%则需加大数据库参数db_cache_size。
|
|
|
|
|
如低于95%,则需要调整应用程序使用绑定变量,或者调整数据库参数shared pool的大小。
|
|
|
|
|
如果disk/(memoty+row)的比例过高,则需要调整sort_area_size(workarea_size_policy=false)或pga_aggregate_target(workarea_size_policy=true)。
|
|
|
|
|
如果redo buffer allocation retries/redo entries超过1%,则需要增大log_buffer。
|
|
|
|
在本节主要检查Oracle数据库的安全性,包含:检查系统安全信息,定期修改密码,总共两个部分。
|
|
|
|
系统安全日志文件的目录在/var/log下,主要检查登录成功或失败的用户日志信息。
|
|
|
|
|
|
|
在出现的日志信息中没有错误(Invalid、refused)提示,如果没有(Invalid、refused)视为系统正常,出现错误提示,应作系统告警通知。
|
|
|
|
在数据库系统上往往存在很多的用户,如:第三方数据库监控系统,初始安装数据库时的演示用户,管理员用户等,这些用户的密码往往是写定的,被很多人知道,会被别有用心的人利用来攻击系统甚至进行修改数据。需要修改密码的用户包括:
|
|
|
|
登录系统后,提示符下输入cat/etc/passwd,在列出来的用户中查看是否存在已经不再使用的或是陌生的账号。若存在,则记录为异常。
|
|
|
|
|
|
在本节主要检查当前crontab任务是否正常,检查Oracle Job是否有失败等共6个部分。
|
|
|
|
|
|
|
|
|
|
|
根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相应的措施:
|
|
|
(1)删除历史数据。系统规定数据库中至少保留6个月的历史数据,所以以前的历史数据可以考虑备份然后进行清除以便释放其所占的资源空间。
|
|
|
|
|
注意:在数据库结构发生变化时,如增加了表空间,增加了数据文件或重做日志文件这些操作,都会造成Oracle数据库控制文件的变化,DBA应及时进行控制文件的备份,备份方法如下。
|
|
|
|
|
|
|
这样,会在USER_DUMP_DEST(初始化参数文件中指定)目录下生成创建控制文件的SQL命令。
|
|
|
|
|
注:分区表上的索引status为N/A是正常的,如有失效索引则对该索引做rebuild,如:
|
|
|
|
|
|
|
|
|
|
|
|