+ -
当前位置:首页 → 问答吧 → 最近遇到:BUG: soft lockup detected on CPU #0 问题?

最近遇到:BUG: soft lockup detected on CPU #0 问题?

时间:2007-09-19

来源:互联网

这个问题不少人在问,却没有答案,再次提出和大家讨论。
linux 2.6.18内核。

最近遇到:BUG: soft lockup detected on CPU #0 问题?

作者: wchtalk   发布时间: 2007-09-19

我也遇到过,你提供的信息太少了,做什么操作了?

作者: yikaikai   发布时间: 2007-09-19

2.6.18内核,我系统调用阻塞在内核的一个队列上,然后,CTL+C,中断等待,结果就出现BUG: soft lockup detected on CPU #0。

作者: wchtalk   发布时间: 2007-09-19

还是没有答案?我的系统也出现同样问题,下面是Messages日志信息! 有人说是网卡驱动问题,系统是RHEL5 2.6.18-8.el5xen #1 SMP  Dell 2950 服务器
  1. Nov 29 15:23:40 shdb kernel: BUG: soft lockup detected on CPU#3!
  2. Nov 29 15:23:40 shdb kernel:  [<c043ea67>] softlockup_tick+0x98/0xa6
  3. Nov 29 15:23:40 shdb kernel:  [<c0408b7d>] timer_interrupt+0x504/0x557
  4. Nov 29 15:23:40 shdb kernel:  [<c043ec9b>] handle_IRQ_event+0x27/0x51
  5. Nov 29 15:23:40 shdb kernel:  [<c043ed58>] __do_IRQ+0x93/0xe8
  6. Nov 29 15:23:40 shdb kernel:  [<c040672b>] do_IRQ+0x93/0xae
  7. Nov 29 15:23:40 shdb kernel:  [<c053a045>] evtchn_do_upcall+0x64/0x9b
  8. Nov 29 15:23:40 shdb kernel:  [<c0404ec5>] hypervisor_callback+0x3d/0x48
  9. Nov 29 15:23:40 shdb kernel:  [<c0407fd1>] raw_safe_halt+0x8c/0xaf
  10. Nov 29 15:23:40 shdb kernel:  [<c0402bca>] xen_idle+0x22/0x2e
  11. Nov 29 15:23:40 shdb kernel:  [<c0402ce9>] cpu_idle+0x91/0xab
  12. Nov 29 15:23:40 shdb kernel:  =======================
  13. Nov 29 15:24:59 shdb kernel: BUG: soft lockup detected on CPU#3!
  14. Nov 29 15:24:59 shdb kernel:  [<c043ea67>] softlockup_tick+0x98/0xa6
  15. Nov 29 15:24:59 shdb kernel:  [<c0408b7d>] timer_interrupt+0x504/0x557
  16. Nov 29 15:24:59 shdb kernel:  [<c043ec9b>] handle_IRQ_event+0x27/0x51
  17. Nov 29 15:24:59 shdb kernel:  [<c043ed58>] __do_IRQ+0x93/0xe8
  18. Nov 29 15:24:59 shdb kernel:  [<c040672b>] do_IRQ+0x93/0xae
  19. Nov 29 15:24:59 shdb kernel:  [<c053a045>] evtchn_do_upcall+0x64/0x9b
  20. Nov 29 15:24:59 shdb kernel:  [<c0404ec5>] hypervisor_callback+0x3d/0x48
  21. Nov 29 15:24:59 shdb kernel:  [<c0407fd1>] raw_safe_halt+0x8c/0xaf
  22. Nov 29 15:24:59 shdb kernel:  [<c0402bca>] xen_idle+0x22/0x2e
  23. Nov 29 15:24:59 shdb kernel:  [<c0402ce9>] cpu_idle+0x91/0xab
  24. Nov 29 15:24:59 shdb kernel:  =======================
复制代码

作者: luocy2008   发布时间: 2007-11-30



QUOTE:
Nov 29 15:23:40 shdb kernel: BUG: soft lockup detected on CPU#3!



already seen this line, the simplest way is to update kernel,
it is already payed attention by many, and
RHEL5 has no rights to prevent 2.6.22+ ??

作者: sisi8408   发布时间: 2007-12-01



QUOTE:
原帖由 wchtalk 于 2007-9-19 17:08 发表
这个问题不少人在问,却没有答案,再次提出和大家讨论。
linux 2.6.18内核。

最近遇到:BUG: soft lockup detected on CPU #0 问题?





请问大家有解决此问题的吗?
我也遇到此类问题,方便联系我email:[email protected]
谢谢赐教!

作者: skywh_2001   发布时间: 2008-03-30



QUOTE:
原帖由 wchtalk 于 2007-9-19 17:08 发表
这个问题不少人在问,却没有答案,再次提出和大家讨论。
linux 2.6.18内核。

最近遇到:BUG: soft lockup detected on CPU #0 问题?


顶以下 我的同样此类问题 好像是调整了内核参数后会出现
Linux www.abc.com 2.6.18-53.el5xen #1 SMP Wed Oct 10 17:06:12 EDT 2007 i686 i686 i386 GNU/Linux


QUOTE:
BUG: soft lockup detected on CPU#6!
[<c0441824>] softlockup_tick+0x96/0xa4
[<c04092a9>] timer_interrupt+0x504/0x557
[<c0441a57>] handle_IRQ_event+0x27/0x51
[<c0441b14>] __do_IRQ+0x93/0xe8
[<c0406d9b>] do_IRQ+0x93/0xae
[<c0541661>] evtchn_do_upcall+0x64/0x9b
[<c0405515>] hypervisor_callback+0x3d/0x48
[<c04084c3>] raw_safe_halt+0x8c/0xaf
[<c040321a>] xen_idle+0x22/0x2e
[<c0403339>] cpu_idle+0x91/0xab
=======================
BUG: soft lockup detected on CPU#6!
[<c0441824>] softlockup_tick+0x96/0xa4
[<c04092a9>] timer_interrupt+0x504/0x557
[<c0441a57>] handle_IRQ_event+0x27/0x51
[<c0441b14>] __do_IRQ+0x93/0xe8
[<c0406d9b>] do_IRQ+0x93/0xae
[<c0541661>] evtchn_do_upcall+0x64/0x9b
[<c0405515>] hypervisor_callback+0x3d/0x48
[<c04084c3>] raw_safe_halt+0x8c/0xaf
[<c040321a>] xen_idle+0x22/0x2e
[<c0403339>] cpu_idle+0x91/0xab
=======================
BUG: soft lockup detected on CPU#6!
[<c0441824>] softlockup_tick+0x96/0xa4
[<c04092a9>] timer_interrupt+0x504/0x557
[<c0441a57>] handle_IRQ_event+0x27/0x51
[<c0441b14>] __do_IRQ+0x93/0xe8
[<c0406d9b>] do_IRQ+0x93/0xae
[<c0541661>] evtchn_do_upcall+0x64/0x9b
[<c0405515>] hypervisor_callback+0x3d/0x48
[<c04084c3>] raw_safe_halt+0x8c/0xaf
[<c040321a>] xen_idle+0x22/0x2e
[<c0403339>] cpu_idle+0x91/0xab
=======================
BUG: soft lockup detected on CPU#6!
[<c0441824>] softlockup_tick+0x96/0xa4
[<c04092a9>] timer_interrupt+0x504/0x557
[<c0441a57>] handle_IRQ_event+0x27/0x51
[<c0441b14>] __do_IRQ+0x93/0xe8
[<c0406d9b>] do_IRQ+0x93/0xae
[<c0541661>] evtchn_do_upcall+0x64/0x9b
[<c0405515>] hypervisor_callback+0x3d/0x48
[<c04084c3>] raw_safe_halt+0x8c/0xaf
[<c040321a>] xen_idle+0x22/0x2e
[<c0403339>] cpu_idle+0x91/0xab
=======================
BUG: soft lockup detected on CPU#6!
[<c0441824>] softlockup_tick+0x96/0xa4
[<c04092a9>] timer_interrupt+0x504/0x557
[<c0441a57>] handle_IRQ_event+0x27/0x51
[<c0441b14>] __do_IRQ+0x93/0xe8
[<c0406d9b>] do_IRQ+0x93/0xae
[<c0541661>] evtchn_do_upcall+0x64/0x9b
[<c0405515>] hypervisor_callback+0x3d/0x48
[<c04084c3>] raw_safe_halt+0x8c/0xaf
[<c040321a>] xen_idle+0x22/0x2e
[<c0403339>] cpu_idle+0x91/0xab
=======================


[ 本帖最后由 xuledw 于 2008-4-25 10:53 编辑 ]

作者: xuledw   发布时间: 2008-04-25



QUOTE:
原帖由 xuledw 于 2008-4-25 10:52 发表

顶以下 我的同样此类问题 好像是调整了内核参数后会出现
Linux www.abc.com 2.6.18-53.el5xen #1 SMP Wed Oct 10 17:06:12 EDT 2007 i686 i686 i386 GNU/Linux


在使用Xen,版本号?dom0,domU?出现这种问题可能是dom0/U的bug,
个人从dump中推测直接原因是在raw_safe_halt()中使domian block的时间过长,并且没有事件到达导致的soft lockup
你可以看一下xen-devel或者直接搜索http://bugzilla.xensource.com/bugzilla/index.cgi看看有什么解决方法
有精力可以研究一下代码并提交一个patch

作者: crspo   发布时间: 2008-04-25

我也碰到了,
默认安装的rhas5,
内核参数没有修改过

作者: dandy   发布时间: 2008-09-22

进程试图占有CPU,但是没成功。

作者: liying_gg   发布时间: 2008-09-22

其实这个不算什么bug,只要你的系统io,或者某个服务10秒内都没反应,这个信息就会出现在你的日志中

作者: YourLai   发布时间: 2008-10-12

我也遇到过这样的现象,不知道有没解呀?恰巧我的系统在死机前报了这个信息,会不会因为这个原因导致死机呀?

作者: wjlinux   发布时间: 2008-10-29



QUOTE:
原帖由 YourLai 于 2008-10-12 23:13 发表
其实这个不算什么bug,只要你的系统io,或者某个服务10秒内都没反应,这个信息就会出现在你的日志中




Is it really?
我也遇见这个问题。好像是io超过10秒了。
ding....

作者: studyboy_3w   发布时间: 2008-12-06



QUOTE:
原帖由 YourLai 于 2008-10-12 23:13 发表
其实这个不算什么bug,只要你的系统io,或者某个服务10秒内都没反应,这个信息就会出现在你的日志中



从最初的代码中看,应该是这样的。有一个watchdog线程,没1s更新一下自己的时间戳。如果在时钟中断处理程序中发现这个watchdog线程已经超过10s没有被更新过。就会报这个错误。

这个技术叫soft lockup。大家帮讲一下这个技术要解决什么问题吧?

作者: greek_zjb   发布时间: 2009-09-03

一次我在一个底半自旋锁里做了超过 10s 的工作,也提示了上述信息
另外还有一次是由于 lock 使用有问题,也提示了类似的信息

作者: platinum   发布时间: 2009-09-03

回复 wchtalk


    我在应用层调用驱动,一运行应用层的程序过一会就出现soft lockup detected on CPU#0,咋办,有解决的么?

作者: marcomo1986   发布时间: 2010-09-21

驱动是你写的吗,驱动里面做了哪些工作。

这个提示信息其实就是内核抱怨 某个地方过长时间占用 CPU 了

作者: Godbach   发布时间: 2010-09-21

你看一下白金兄的回复。在底半环境下,较长时间的占用 CPU 就有可能导致这个问题。
我记得前段时间我也是这一个情况。

作者: Godbach   发布时间: 2010-09-21

回复 Godbach


    驱动是我写的我写的AC97的驱动,但是不知道驱动对不对想运行一下看看管脚有无数据读写,但是应用层一运行过几秒就出现那个提示了

作者: marcomo1986   发布时间: 2010-09-21

你的驱动代码里面有没有过长占用 CPU 的情况啊

作者: Godbach   发布时间: 2010-09-21

热门下载

更多