+ -
当前位置:首页 → 问答吧 → 几个关于数据安全的案例

几个关于数据安全的案例

时间:2010-09-20

来源:互联网

1。用户发现EMC CX的存储盘坏了,通知了乙方,这很正确。乙方工程师倒现场检查,试图恢复,这也正确。恢复不成,决定换盘,这也正确。他把存储关了,然后换盘,好像也对。。。。但问题出来了,一开机,存储又坏了一块盘,RAID组OVER了。关机和开机最容易坏硬盘和电源了,而现在的电源和硬盘(尤其是存储的)都是设计好了可以热插拔的,所以热插拔才是正确的,关机换那就是错误的。

2。我一下飞机就接到一个短信,说要我赶紧回电话。回电话一问,原来是一个不认识的人,通过别人找到了我。问题是他去给用户换DS4000坏的控制器,换完之后RAID信息没了。我问是怎么换的,答曰:关机换了然后开机就没了。我气不打一处来,这样的工程师怎么就去现场干活去了,连手册都不看的。一想也是,大部分工程师都是这样的。存储俩控制器,是一个特殊的cluster,RAID信息在控制器上。坏了一个控制器,换一个,俩控制器的信息当然就不一致了。如果关机换,开机的时候,俩控制器的信息以哪个为准?当然应该不关机换,这样换上的控制器才会知道以原来好的那个控制器为准做信息同步。

3。一个乙方,给甲方DS4800添加EXP810扩容,关机加上后开机,发现一个RAID的4块盘坏了,RAID fail了。又是不懂就乱搞的,这样的真不少。扩容就不是这样扩的,要看手册,乱搞,出事就是正常,不出事才怪。

4。一个电话,我赶紧飞了过去。是DS4000上的VG访问不了,乙方export后再尝试import,失败,报没有可用的VGDA,找了几个人去,都没办法,只好找我了。得知乙方没做什么别的操作,我认为数据是可以恢复的。但到现场扫描硬盘扇区,却怪异了,除了硬盘头部有一点信息,后边的竟然全是0。实在想不明白,仔细一看硬盘头部信息,却发现有点怪异,好像是windows的痕迹。然后发现旁边有台WINDOWS机器,做备份服务器的,但没连到DS4000啊。还是觉得奇怪,就查对了一下计算机名,一看就是它,硬盘头部的信息里出现的就是它的名字!赶紧找用户问,原来这台机器也有FC卡,曾经连过光纤到FC交换机上,而FC交换机上没有划ZONE,存储上也没有做分区mapping,有人在这台windows上练手装过oracle....天啊,原来是这台windows访问了这个LUN,做了label。要是只是做了label,那数据也可以恢复,但要命的是练手的人以为这个LUN是本地硬盘吧,搞RAC把它清0了。。。。这到哪里找数据啊。这规划、实施和管理,问题真是多了去了。

5。又是紧急电话,一个朋友找来了,还是数据丢失,7133上的RAID还在,但VG搞坏了,LV找不到了,FS当然也没了。赶紧飞了过去,搜索硬盘扇区,万幸,数据应该都在。连夜找各种日志信息,通过各种痕迹,一点点计算推断,终于把PV的LP-PP映射图搞了出来,重建30个LV,恢复FS信息,mount文件系统,数据完全恢复。出错的原因就是基础不牢靠,误操作了,但万幸的是没做更多的改变,数据还没有被破坏。

作者: 老农   发布时间: 2010-09-20

ding

作者: 笑看风云淡   发布时间: 2010-09-20

NX+NB(诠释一下牛x+牛B)

作者: jinmaoda   发布时间: 2010-09-20

总结:
基础一定要学好
做事之前一定要认真看手册
遇到疑难杂症,保护现场,呼叫农哥。

作者: netrogue   发布时间: 2010-09-20

刀口上舔血的行当


我还是先好好练练基本功

作者: stone_hqc   发布时间: 2010-09-20

保护现场,呼叫农哥。

这个要支持

作者: relianni   发布时间: 2010-09-20

宝贵的经验,希望大家都来参与并分享.

作者: mack2050   发布时间: 2010-09-20