+ -
当前位置:首页 → 问答吧 → 双机的业务不能切换

双机的业务不能切换

时间:2008-04-25

来源:互联网

小弟新手,今天碰到问题,想在坛子上请教各位,如果问的问题弱的话,大家还要不要见怪。
事情是这样的,今天客户那边两台H85做的双机,主机因为两个电源坏掉,down机了。按理说备机应该能接管业务,但是现在出现了情况。我运行smitty ssaraid命令,选择第一项“列出系统逻辑盘的状态”结果7133阵列上的逻辑卷都是free的状态,各个pdisk的状态都是good的。手动挂载,会提示要varyonvg,但是varyonvg不成功。
有两个问题请教:
(1)SSA卡的电池的状态用哪个命令可以看到,现在怀疑SSA卡的电池没电,如果SSA卡没电的话,是不是有可能导致卷组的信息和备机上的ODM库中的信息不一样?继而出现varyonvg不上去的现象?
(2)如果在备机上执行synclvodm的话,会不会影响双机?

[ 本帖最后由 fengyan 于 2008-5-30 17:00 编辑 ]

作者: fengyan   发布时间: 2008-04-25

(1)SSA卡的电池的状态用可以看到,现在怀疑SSA卡的电池没电,如果SSA卡没电的话,是不是有可能导致卷组的信息和备机上的ODM库中的信息不一样?继而出现varyonvg不上去的现象?
(2)如果在备机上执行synclvodm的话,会不会影响双机?
1)在AIX上如何查询7133RAID卡上的FAST-WRITE缓存可以使用
ssa_fw_status命令。
2)格式:
ssa_fw_status -a Adapter [-p|-l|-c]
其中
-a Adapter 显示指定SSA卡的所有fast-write的状态.
-l 显示预期的电池寿命. (小时)
-p 显示电池已经工作的时间(小时).
-c 显示fast-write缓存的状态.
3)例如:
#ssa_fw_status -a ssa0 -c
Active
#ssa_fw_status -a ssa0 -l
22000
#ssa_fw_status -a ssa0 -p
30492
SSA卡没电的话,是不会导致卷组的信息和备机上的ODM库中的信息不一样的



2如果在备机上执行synclvodm的话,会不会影响双机?不会,不过最好用ha做同步

作者: 炸兔子   发布时间: 2008-04-25

什么跟什么啊,别越搞越乱

作者: eagle   发布时间: 2008-04-25

是啊,的确乱。
HA用不好,不如单机可靠呢。

这和电池有啥关系啊?找个懂点HA的去处理吧。

作者: 老农   发布时间: 2008-04-25

哪跟哪?

作者: xyk1314521   发布时间: 2008-04-25

谢谢这位大哥,这是errpt的报错,昨天比较累,忘记了传log,这是errpt的报错LABEL:          SSA_CACHE_ERROR
IDENTIFIER:     BC31DEA7

Date/Time:       Mon Mar 17 10:22:16
Sequence Number: 251225
Machine Id:      005F618A4C00
Node Id:         localhost
Class:           H
Type:            PERM
Resource Name:   ssa0
Resource Class:  adapter
Resource Type:   ssa160
Location:        11-08
VPD:            
        Part Number................. 27H1204
        FRU Number.................. 34L5388
        Serial Number...............S3120171
        EC Level....................    E28793
        Manufacturer................IBM053
        ROS Level and ID............C400    0000
        Loadable Microcode Level....05
        Device Driver Level.........00
        Displayable Message.........SSA-ADAPTER
        Device Specific.(Z0)........SDRAM=128
        Device Specific.(Z1)........CACHE=32
        Device Specific.(Z2)........UID=006094C10000CF36

Description
CORRUPT DATA

Probable Causes
DASD CACHE

Failure Causes
DASD CACHE

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES
后来我们把备机的I/O柜里的一个电源拔下来了,换到主机上。把主机上的I/O柜中的一个拔下来用到备机上,发现原先在主机I/O柜中不能使用的电源竟然在备机上能够使用。而主机这时也能起来了。后来又出现了新的问题,就是以前没有问题的CEC上面的电源灯竟然在闪,而且mail中有报错From root Mon Mar 24 04:01:31 2008
Date: Mon, 24 Mar 2008 04:01:30 +0800
From: root
To: root
Subject: diagela

A PROBLEM WAS DETECTED ON Mon Mar 24 04:00:30 TAIST 2008                  801014

The Service Request Number(s)/Probable Cause(s)
(causes are listed in descending order of probability):

  A05-160: System shutdown due to internal power supply failure
           Error log information:
                 Sequence number: 251234
    n/a              FRU: n/a                  U1.1-V1         

  651-880: The CEC or SPCN reported an error. Report the SRN and the
           following reference and physical location codes to your service
           provider.
           Error log information:
                 Sequence number: 251232
    Ref. Code: 10111921 FRU:  11K0802         U1.1-V2         

  651-881: The CEC or SPCN reported an error. Report the SRN and the
           following reference and physical location codes to your service
           provider.
           Error log information:
                 Sequence number: 251231
    Ref. Code: 10111910 FRU: n/a              n/a            

  651-882: The CEC or SPCN reported an error. Report the SRN and the
           following reference and physical location codes to your service
           provider.
           Error log information:
                 Sequence number: 251227
    Ref. Code: 10111923 FRU:  11K0802         U1.1-V2   
不知道这是不是电源坏掉了,5555555555555

作者: fengyan   发布时间: 2008-04-25

Ref. Code: 10111923 FRU:  11K0802         U1.1-V2   
电源报错

作者: 炸兔子   发布时间: 2008-04-25

我在serviceguide上查到也是这样的,刚换的电源就报错了。。。以前的坏电源是灯不亮,但是这次是一直在闪。。。

作者: fengyan   发布时间: 2008-04-25

如果在保内,找18M吧,如果不在保内,那先准备好电源再折腾吧.

作者: 炸兔子   发布时间: 2008-04-25

7133,如果环不合理,i/o柜电源坏了,会开环

作者: turbo   发布时间: 2008-04-25

these series machine powers are rubbish.correct power firstly.

作者: jiangxh   发布时间: 2008-04-25

电源报错的这个我知道,嘿嘿。现在想知道那个SSA卡报错是什么故障?嘿嘿,谢谢各位了

作者: fengyan   发布时间: 2008-04-25

HA不能切换的问题难道是7133的问题。你的7133没有坏吧。

作者: 五“宅”一生   发布时间: 2008-04-26

7133的状态正常,现在主机起来后,业务在主机上能够很好的运行,就是在备机上切换不过去

作者: fengyan   发布时间: 2008-04-26

我可以包整好,可是这样看就没兴趣了

作者: 老农   发布时间: 2008-04-26

HA配置问题。不要搞到其他方面了。

作者: 五“宅”一生   发布时间: 2008-04-26

好的,明白了。谢谢各位

作者: fengyan   发布时间: 2008-04-26

原帖由 老农 于 2008-4-26 13:46 发表
我可以包整好,可是这样看就没兴趣了


不用农哥出马了,俺的小弟俺协助搞定了!事情不大。

事情的确跟H85 的ssa卡的电池有关系

[ 本帖最后由 haomao1879 于 2008-4-27 15:38 编辑 ]

作者: haomao1879   发布时间: 2008-04-27

:lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol :lol

作者: fengyan   发布时间: 2008-04-27

学习一点 学习

作者: 呵呵夕阳   发布时间: 2011-12-01