+ -
当前位置:首页 → 问答吧 → 《亲历惊心动魄48小时!》-要命的数据丢失

《亲历惊心动魄48小时!》-要命的数据丢失

时间:2007-04-29

来源:互联网

111

[ 本帖最后由 yuyang0726 于 2007-10-26 13:22 编辑 ]

作者: yuyang0726   发布时间: 2007-04-29

怕啊,最怕怕这种了,后来怎么样,还有下文吧!

作者: zjb219219   发布时间: 2007-04-29

你们在搞新上的存储,应该没关系吧

作者: levine   发布时间: 2007-04-29

不理解,既然是新上的盘阵跟生产数据有什么关系??难道是存储的扩容???

作者: 漫步的双鱼   发布时间: 2007-04-29

应该是没关系,但在那里的所有人首先都会被怀疑,所以你要证明自己的清白。

关键的工作,容不得马虎,所以平常玩PC的人是不适合搞小机的,喜欢乱折腾的那是找死。

这个帖子好

作者: 老农   发布时间: 2007-04-29

111

[ 本帖最后由 yuyang0726 于 2007-10-26 13:22 编辑 ]

作者: yuyang0726   发布时间: 2007-04-29

原来是误操作啊?

不经过确认就是惨

客户和经理的巨大能力?那时候不急得跳楼就算不错了,那时候是真的战场啊,要命的哦

作者: 老农   发布时间: 2007-04-29

一般进机房我都是要求局方有人和我一起进去,如果涉及加电,我一定先确认可以加电后再加,局方都不确定是否可以加电,我不敢冒险。

每次配存储的时候我都是自己带个小HUB过去,省事,只是每次出去干活的时候我的包都是死沉死沉的。

干活前先确认,俺永远记得!

作者: cinord   发布时间: 2007-04-29

做事情不严谨,没章法的,我根本不敢要,因为不敢用他出去干活。

作者: 老农   发布时间: 2007-04-29

看了专家的评论,我受益菲浅啊,做事情真的是不能有办点马虎,这是从做人的基本原则开始,对我这样的新手很是有用!

作者: zjb219219   发布时间: 2007-04-29

曾经遇到过一次人为故障,领导在删用户,应用突然断了,刚好我telnet在上面,而且当时root用户密码只有我们两人知道,但我那个时候啥也没做,到后来居然把罪名放在我头上,冤枉呀,最后一气之下不干了。据后来的同事说,停应用是因为删除了当时安装应用的用户的关系。


咳,悲哀呀!做领导做成这样,这样的公司也没必要待下去。

作者: cinord   发布时间: 2007-04-29

可以根据这个事写个剧本,然后拍个电影,让论坛上的各个老大们来出演各个角色,一定很有意思

作者: flysnowpp   发布时间: 2007-04-29

原帖由 cinord 于 2007-4-29 12:06 发表
曾经遇到过一次人为故障,领导在删用户,应用突然断了,刚好我telnet在上面,而且当时root用户密码只有我们两人知道,但我那个时候啥也没做,到后来居然把罪名放在我头上,冤枉呀,最后一气之下不干了。据后来的 ...


大好的机会居然让你浪费了

当着大家的面,领导也在场,告诉大家,事情是你干的。

如果你的领导识体,他就会保你,不会让你死,当然,你会在一段时间内不爽,可能会扣奖金,可能会受批评,但这些对于你来说都是财富,都是好事 …………

过着这波,你的好日子就来了。

so . stay the couse . You will win .

作者: ericsson   发布时间: 2007-04-29

非它自己的硬件和软件故障,IBM是不会在标准所带MA中管的,这种人为的操作故障,要单立case。

一般代理的工程师的水平不如分销总代的,分销总代的不如做MA的。IBM的工程师,一般水平还可以,但也算不上高手,肯定有高手,但高手难请出来。

作者: 老农   发布时间: 2007-04-29

IBM工程师
在此之前总有耳闻,说现在的IBM工程师水平一般般。于是,在心理并没有对他们又多大的期待。心想用户就是迷信,干脆重起得了。事后4个小时,在所有人都看完以后IBM工程师到。先是2位,再来又是2位,然后是3位。分别来自不同的TEAM。有负责不同系统的,由负责小机的,由负责存储的,还有售前的。但是他们在一起却能很好的协商和达成一致,没有人口出狂言或者轻举妄动,最后,7个人没有给出任何的动作的建议,唯一的举措就是将现场情况抓图,整理,上传给2线。并说,希望有人在线,希望能有解决的办法。然后,走了。

作者: yuyang0726   发布时间: 2007-04-29

紧急方案
与此同时,客户召开紧急会议,讨论后给我们也开了个会:冻结原存储4300,连夜在新的存储4800上RAID,建VG,将所有应用和数据转移,先让系统跑起来,数据再说。于是,电话和短信里就有了:“今晚通宵加班,我不回去了。“
节外生枝
这时回到那两台为了做它们而闯祸的4800面前,它们却吓得再不敢抬眼看我们,死活就是不合我们的manager连。。。。气得我是·##¥%……—*(——也没办法。

作者: yuyang0726   发布时间: 2007-04-29

做ma的类似的事情,大大小小总会碰到,一切安全第一,让客户确认(虽然有些时候这也不一定管用,最好书面的东西),要不然等出了事ma就成了替死的。

他××的 fuck!

作者: canghai   发布时间: 2007-04-29

我就说么,那个帖子那么奇怪。
但不了解情况,是没办法做分析的。
所以才需要那么多人跑去现场啊,还要抓信息啊。

作者: 老农   发布时间: 2007-04-29

写的精彩!按照紧张的程度来来排列,应该是证券行业的生产机要求最高了。
银行和电信也许还没有达到这种程度。
另外,有钱就买ibm的保。

作者: fck   发布时间: 2007-04-29

HA,有时候我也去救IBM工程师的急。
证券、银行、电信的一些服务器我都保着呢

作者: 老农   发布时间: 2007-04-29

做事太马虎了,连现场周边的大概都没弄清楚,就嘎事。好歹也该看看旁边的IP是什么吧。

我还是等着看连载算了

[ 本帖最后由 shala 于 2007-4-29 14:00 编辑 ]

作者: shala   发布时间: 2007-04-29

倒,原来那个帖子是你写的啊!所以大家都不知道你的苦衷啊!不是不想写啊,是在现实的压迫下,没办法啊

作者: zjb219219   发布时间: 2007-04-29



越看越糊涂,感觉这多人象一群无头的苍蝇,浪费了n个小时。

作者: shala   发布时间: 2007-04-29

看的比较茫然,不知道到底是个什么解决思路

作者: yurual   发布时间: 2007-04-29

还好,没遇到过这种硬件的DOWN的问题。试过DBMS宕了48小时,也是惊心动魄了。

作者: wolfop   发布时间: 2007-04-29

我到客户现场,一般只在本服务机器边上转,其他一概不管。事先一些准备工作也要做好,比如笔记本要充足电,自带网线等等、拧螺丝钉的工具头不要轻易就掉下来。如果要动生产系统环境,我都事先咨询一遍,再确认一遍,而且一般都会建议客户不要动生产系统,如同步升级DS4300两个控制器Firware,有次客户要把控制器的2根网线加入到生产交换机上,我看了交换机上密密麻麻的线,把情况一说明,当时就建议额外准备好一个以太网交换机,改天再升级Firware,客户同意。还有,有时候笔记本电用没了,我也不会在机房里充电,一般都会在保安或者客户的维护间里充电,坚决不会在生产供电上加。有一次,我在客户机房里配置HACMP,有个朋友过来看,我犹豫了一下,但还是让他过来了。中途我笔记本电用没了,这哥们随手就把电源线插到客户的生产机柜里,我发现后,立刻制止,并且告戒他不要乱动,尤其是生产系统。第二天,有个国内出名的2大电信供应商之一公司的工程师动这个机柜机器,过了一会,甲方忽忽来了2个人,行色匆匆,说网关不通,谁动了他们机器,双方的人在激烈的交谈,具体我也没听。
   记住:有些事情花钱买都买不来。

作者: nmcl   发布时间: 2007-04-29

感谢各位老大的回帖,我觉得收获得更多些!谢谢!

作者: yuyang0726   发布时间: 2007-04-29

工程师都应该自己准备一个袖珍无线路由器只要出差都带着,现在Linksys的袖珍无线路由才200多,我当初这么做的时候袖珍的只有ASUS WL530G可选,800多。多么便宜简单的事情,一举多得:在酒店可以上厕所也用无线 ,同事同住不管他是有线还是无线,都可以用,不会冲突;在客户现场,可以不用死守在设备旁边,还可以用于这种需要HUB的情况。

袖珍无线路由本身很轻体积很小,没有负担。

唉,就是不会想

作者: larryh   发布时间: 2007-04-29

看来犯这个错的人还不少呀,前2个月一个DC的工程师在装DS4700把我客户的DS4300给删的干干净净。

作者: ibm6000   发布时间: 2007-04-29

唉,没有经历过系统生与死的工程师(不管是DBA还是小机)都不能说是真正的工程师,那种压力大太了,呵呵。

LZ,写下去啊。

作者: rwq_   发布时间: 2007-04-29

原帖由 rwq_ 于 2007-4-29 17:56 发表
唉,没有经历过系统生与死的工程师(不管是DBA还是小机)都不能说是真正的工程师,那种压力大太了,呵呵。

LZ,写下去啊。



完了,我不是真正的工程师

作者: larryh   发布时间: 2007-04-29

新手路过  期待连载
铭记教训  决不犯错

作者: 65054453   发布时间: 2007-04-29

原帖由 larryh 于 2007-4-29 18:59 发表



完了,我不是真正的工程师

人家说的是经历过系统生与死的压力

作者: 老农   发布时间: 2007-04-29

说句实话,俺感觉在生产机上做ma没有5年以上的工作经验,没有30岁以上的年纪还是省省巴,要求的不是非常高的技术,而是非常丰富的经验,尤其是那种自以为是,自认为是高手的人最为危险,时时刻刻要牢记安全意识,没事不要乱动机器,动的时候之前要做好备份,做好笔记纪录,我以前就说过,你可以做不好它,但不能做坏他,因为你技术不行还有别人行,但数据没了,神仙也不行了,

作者: jeszj   发布时间: 2007-04-29

收录菜鸟日记,楼主要版权么?哈哈?

先不说风凉话了。。。。ibm PE肯定可以救的,但是最好由以前配置的sm保存,另外存储的raid也不要太复杂,自己编一个raid 头信息,写进去就是了,但是不知道数据是否重要到能动用他们,一般的PE也不行,工作量也很大,也许用户的老大能把他们请出来。

作者: orian   发布时间: 2007-04-29

弱弱地问,KVM与存储是怎样连的。通过K,V,M,还是通过网线?这里KVM的用途是?

没玩过4xxx,不懂这些。

作者: 炸鸡   发布时间: 2007-04-29

热门下载

更多