+ -
当前位置:首页 → 问答吧 → [超级0疼] “Journal has aborted”

[超级0疼] “Journal has aborted”

时间:2008-02-29

来源:互联网

IBM X366
ServerRAID 8i  
OS: REDHAT AS4U5


最开始,RAID降级,有磁盘offline,强制上线后,备份数据(只能备份部分)

重新创建RAID,无法初始化,且重启经常丢失RAID信息,怀疑RAID适配器有问题,检测磁盘,RAID成员每个都检测有毛病,昏!

---------support -----------------------

IBM support过来换RAID卡

第一天OK,
白天运行正常,次日凌晨4~5点,
系统开始报错,远程可以登录,只是进入系统,会随机的出现某些文件或文件夹无法访问,所有分区变为只读,
目前的情况是登录进去,所有外部命令无法正常使用,大部分显示 I/O错误,涉及硬件的命令显示总线错误........

于是过去重启了一下,检测了一下磁盘,OK
次日凌晨4~5点
继续原来的错误


IBM SUPPORT继续过来换RAID卡电池,OK
白天运行正常,次日凌晨4~5点
仍然继续原来的错误

IBM SUPPORT说是要继续换块新RAID卡,
实在是0疼!

哪位遇到过类似情况

而且每次重启就OK,不会丢失任何数据.

---------------------------------------------------------------
补充 :  凌晨4~5点并无特别的crontab安排,仅仅是一个应用程序重启的过程,最多维持几十秒,而且不会明显的影响负载的

error log
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
EXT3-fs error (device sda3) in start_transaction: Journal has aborted
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device
scsi0 (0:0): rejecting I/O to offline device

[ 本帖最后由 dayan_he 于 2008-2-29 10:28 编辑 ]

作者: dayan_he   发布时间: 2008-02-29

没人回复,我自己顶一下!!!

作者: dayan_he   发布时间: 2008-02-29



QUOTE:
白天运行正常,次日凌晨4~5点,
系统开始报错,远程可以登录,只是进入系统,会随机的出现某些文件或文件夹无法访问,所有分区变为只读,
目前的情况是登录进去,所有外部命令无法正常使用,大部分显示 I/O错误,涉及硬件的命令显示总线错误........

于是过去重启了一下,检测了一下磁盘,OK
次日凌晨4~5点
继续原来的错误


IBM SUPPORT继续过来换RAID卡电池,OK
白天运行正常,次日凌晨4~5点
仍然继续原来的错误




几次错误都发生在同一个时间,很有可能是系统在这个时候执行了默认cronjob而触发的问题。你可以去检查一下在这个时间点上有哪些系统和自定义的任务计划。
但为什么会触发该问题,情况可能不简简单单就是换raid卡的问题了。

我觉得有必要先确定服务器上所有的硬件连接没有问题,然后分别对阵列中每块磁盘做backblocks坏块检查,这是系统中提供的命令。

然后最关键的是,要看看启动的时候到底怎么个报错法。dmesg文件很关键。



唉!这年头,只要你找IBM,他们除了换硬件就是换硬件。但你要想真正知道问题在哪里,你也要提供点有用的信息像dmesg这样的文件啊!?至少你告诉我有几块盘,阵列是RAID-1还是RAID-5。......光猜有啥用啊!?

作者: jerrywjl   发布时间: 2008-02-29

大爷的,我也发生这问题了,可啥办呀?你的问题你解决了嘛?

作者: niezhenqun   发布时间: 2011-03-10

热门下载

更多