+ -
当前位置:首页 → 问答吧 → 存储故障问题

存储故障问题

时间:2011-09-16

来源:互联网

上周,我单位一台DS4800报障:磁盘笼子的一ESM上的温感器有问题(Event type: 281D
Description: Temperature sensor removed),导致此ESM发生故障( 具体描述:Drive enclosure component failed or removed,Event type: 280D)。大致处理过程:
    (1)应用系统(即DB)运行状态下,维保公司拿一备ESM更换上,过N久,两ESM信息同步完成,但是发生诡异显现--两ESM的所有信息,包括出厂日期、SN等全都一模一样。此时,SM里面马上报CHANNEL 1、3 miswire错误(CHANNEL 1 连A控、CHANNEL 3连B控),具体说大致是存在loop的情况,同时ESM错误在SM中消失。出这样的错误,我觉得是如下原因:两ESM信息一样,控制器逻辑上信息就混乱了,所以报存在loop的错误信息;此备ESM卡物理上是好的,但是里面的fireware有问题了。
    (2)应用系统运行状态下,拔掉换上去的备ESM,重新插回以前的ESM,此时SM系统报错为:CHANNEL 3 miswire,ESM卡错误在SM中也消失。我认为可能是:原ESM物理上也并无问题,可能是系统连接的物理性能问题吧,所以插拔解决了以前系统的报错;CHANNEL 1 miswire错误消失,ChANNEL 3 miswire错误为什么存在?(不明白,难道是现在的两ESM中信息正常?但应该两个miswire错误信息都应该关闭才对啥。)
    (3)应用系统关闭状态下,拔掉CHANNEL 3对应的ESM卡,SM中的报障立即消失,然后再插回ESM卡,SM中仍就没有再报障了,也就是说:CHANNEL 3 miswire错误也没有了,应该是存储系统中的逻辑错误被解决了。

俺主要的疑问有:
    (a)既然有ESM问题,DS48系统中为啥没有发生路经切换?在插拔ESM、ESM报障状态下都没有发生。
    (b)原ESM报障,是否是物理连接性能等问题?或者是误报?温感器有问题,此CHANNEL应该不通了吧?
    (c)两个ESM 的信息同步后,出现SN等信息一模一样,应该有问题吧?
    (d)出现CHANNEL 1、3 miswire,是否是因为两个ESM卡信息一样导致的?在DS48内部逻辑是否发生了混乱?对业务系统而已是否有影响?此时进行的ESM热插拔是否有明显的风险?

问题描述的比较长、啰嗦,麻烦慢慢看,帮忙解惑、指出整个过程有不当的地方。
谢谢!

作者: dengxidengxi   发布时间: 2011-09-16

俺鼎!

泪奔中,没捧场滴!

作者: dengxidengxi   发布时间: 2011-09-16

上周,我单位一台DS4800报障:磁盘笼子的一ESM上的温感器有问题(Event type: 281D
Description: Temperature sensor removed),导致此ESM发生故障( 具体描述:Drive enclosure component failed or removed,Event type: 280D)。大致处理过程:
    (1)应用系统(即DB)运行状态下,维保公司拿一备ESM更换上,过N久,两ESM信息同步完成,但是发生诡异显现--两ESM的所有信息,包括出厂日期、SN等全都一模一样。此时,SM里面马上报CHANNEL 1、3 miswire错误(CHANNEL 1 连A控、CHANNEL 3连B控),具体说大致是存在loop的情况,同时ESM错误在SM中消失。出这样的错误,我觉得是如下原因:两ESM信息一样,控制器逻辑上信息就混乱了,所以报存在loop的错误信息;此备ESM卡物理上是好的,但是里面的fireware有问题了。
    (2)应用系统运行状态下,拔掉换上去的备ESM,重新插回以前的ESM,此时SM系统报错为:CHANNEL 3 miswire,ESM卡错误在SM中也消失。我认为可能是:原ESM物理上也并无问题,可能是系统连接的物理性能问题吧,所以插拔解决了以前系统的报错;CHANNEL 1 miswire错误消失,ChANNEL 3 miswire错误为什么存在?(不明白,难道是现在的两ESM中信息正常?但应该两个miswire错误信息都应该关闭才对啥。)
    (3)应用系统关闭状态下,拔掉CHANNEL 3对应的ESM卡,SM中的报障立即消失,然后再插回ESM卡,SM中仍就没有再报障了,也就是说:CHANNEL 3 miswire错误也没有了,应该是存储系统中的逻辑错误被解决了。

俺主要的疑问有:
    (a)既然有ESM问题,DS48系统中为啥没有发生路经切换?在插拔ESM、ESM报障状态下都没有发生。
    (b)原ESM报障,是否是物理连接性能等问题?或者是误报?温感器有问题,此CHANNEL应该不通了吧?
    (c)两个ESM 的信息同步后,出现SN等信息一模一样,应该有问题吧?
    (d)出现CHANNEL 1、3 miswire,是否是因为两个ESM卡信息一样导致的?在DS48内部逻辑是否发生了混乱?对业务系统而已是否有影响?此时进行的ESM热插拔是否有明显的风险?

问题描述的比较长、啰嗦,麻烦慢慢看,帮忙解惑、指出整个过程有不当的地方。
谢谢!

作者: dengxidengxi   发布时间: 2011-09-16

俺鼎!

泪奔中,没捧场滴!

作者: dengxidengxi   发布时间: 2011-09-16

上周,我单位一台DS4800报障:磁盘笼子的一ESM上的温感器有问题(Event type: 281D
Description: Temperature sensor removed),导致此ESM发生故障( 具体描述:Drive enclosure component failed or removed,Event type: 280D)。大致处理过程:
    (1)应用系统(即DB)运行状态下,维保公司拿一备ESM更换上,过N久,两ESM信息同步完成,但是发生诡异显现--两ESM的所有信息,包括出厂日期、SN等全都一模一样。此时,SM里面马上报CHANNEL 1、3 miswire错误(CHANNEL 1 连A控、CHANNEL 3连B控),具体说大致是存在loop的情况,同时ESM错误在SM中消失。出这样的错误,我觉得是如下原因:两ESM信息一样,控制器逻辑上信息就混乱了,所以报存在loop的错误信息;此备ESM卡物理上是好的,但是里面的fireware有问题了。
    (2)应用系统运行状态下,拔掉换上去的备ESM,重新插回以前的ESM,此时SM系统报错为:CHANNEL 3 miswire,ESM卡错误在SM中也消失。我认为可能是:原ESM物理上也并无问题,可能是系统连接的物理性能问题吧,所以插拔解决了以前系统的报错;CHANNEL 1 miswire错误消失,ChANNEL 3 miswire错误为什么存在?(不明白,难道是现在的两ESM中信息正常?但应该两个miswire错误信息都应该关闭才对啥。)
    (3)应用系统关闭状态下,拔掉CHANNEL 3对应的ESM卡,SM中的报障立即消失,然后再插回ESM卡,SM中仍就没有再报障了,也就是说:CHANNEL 3 miswire错误也没有了,应该是存储系统中的逻辑错误被解决了。

俺主要的疑问有:
    (a)既然有ESM问题,DS48系统中为啥没有发生路经切换?在插拔ESM、ESM报障状态下都没有发生。
    (b)原ESM报障,是否是物理连接性能等问题?或者是误报?温感器有问题,此CHANNEL应该不通了吧?
    (c)两个ESM 的信息同步后,出现SN等信息一模一样,应该有问题吧?
    (d)出现CHANNEL 1、3 miswire,是否是因为两个ESM卡信息一样导致的?在DS48内部逻辑是否发生了混乱?对业务系统而已是否有影响?此时进行的ESM热插拔是否有明显的风险?

问题描述的比较长、啰嗦,麻烦慢慢看,帮忙解惑、指出整个过程有不当的地方。
谢谢!

作者: dengxidengxi   发布时间: 2011-09-16

俺鼎!

泪奔中,没捧场滴!

作者: dengxidengxi   发布时间: 2011-09-16