文档库 最新最全的文档下载
当前位置:文档库 › 关于AIX系统错误日志的一些说明

关于AIX系统错误日志的一些说明

关于AIX系统错误日志的一些说明


内容提要:系统地介绍一下AIX的错误日志的报告机制以及一些参数的意义

说明:
一、 错误日志的工作机制

首先我们需要弄明白错误日志是怎么保存并被用户识别的。实际上在系统的某个功能模块检测到一个错误事件时,会把它记录到/dev/error设备中,并随后由错误日志进程errdemon从/dev/error文件中读取错误日志并最终写入/var/adm/ras/errlog中。
具体与错误日志相关的一些设置可以通过/usr/lib/errdemon -l 命令来看到:
Error Log Attributes
--------------------------------------------
Log File /var/adm/ras/errlog
Log Size 106496 bytes
Memory Buffer Size 32768 bytes
Duplicate Removal true
Duplicate Interval 10000 milliseconds
Duplicate Error Maximum 1000
:/#
上面显示的错误日志文件是/var/adm/ras/errlog,这也是系统默认的错误日志的存放位置。

二、 查看错误日志:errpt命令

errpt命令可以说是AIX系统管理员最为熟悉的命令了。下面是一个errpt命令的输出:
:/#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
BA431EB7 022******* P S SRC SOFTWARE PROGRAM ERROR
12081DC6 022******* P S harmad SOFTWARE PROGRAM ERROR
12081DC6 022******* P S harmad SOFTWARE PROGRAM ERROR
F7FA22C9 022******* I O SYSJ2 UNABLE TO ALLOCATE SPACE IN FILE SYSTEM
AFA89905 022******* I O grpsvcs Group Services daemon started
97419D60 022******* I O topsvcs Topology Services daemon started
6D19271E 022******* I O topsvcs Topology Services daemon stopped

这里的输出分为六列依次为:
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。

2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。

3.类型TYPE:错误的类型,或者说严重的程度,共分为6种:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U

4.种类CLASS c:指出错误源
H 硬件故障 Hardware
S 软件故障 Software
O 人为操作 Operation
U 不能确定 Unknown

5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。

6.描述
具体的错误代表的意义可以打IBM的支持热线寻求帮助。

三、 日志的清理
错误日志可以通过errclear命令进行清理。实际上,清理工作并不需要手工执行。在系统安装完成后,定时自动执行的脚本中会包含下面几行:
0 11 * * * /usr/bin/errclear -d S,O 30
0 12 * * * /usr/bin/errclear -d H 90
即:S,O 类的错误会保留30天,而H的错误会保留90天

手动清除错误日志可以用smit errclear来删除错误记录



相关文档