【客户描述】
新疆某地址勘探研究院,HP服务器4块SAS硬盘, Win2003系统,NTFS文件系统,客户描述为Raid5,现在不知何故三块盘报红灯离线。
【恢复过程】
1、经检测,RAID信息丢。其中一块盘存在物理故障,先行修复。并将所有故障盘数据同步镜像到安全存储介质中。此过程用去大概1天的时间。
2、对当前已完整备份的所有硬盘镜像进行分析,确定故障RAID的原结构参数,同时判断故障RAID中各硬盘的离线情况。
3、依据分析所得RAID参数及离线硬盘情况在只读环境中构建RAID数据,并对所构建的虚拟RAID进行基本的逻辑校验,确定文件系统大体结构无误后将RAID生产完整镜像。
4、历时3个工作日,数据圆满恢复成功。
【负责工程师】
甲驭网络科技有限公司—李工 联系方式:4000-7743-77
QQ:1253140355
【故障现象】
1、Raid阵列多块硬盘指示灯报警;
2、Raid-5两块硬盘指示灯报警;
2、Raid管理中显示多块硬盘离线或丢失;
3、Raid信息丢失,所有硬盘均呈离线状态;
4、服务器无法正常开机;
4、无法进入Raid管理界面或查看Raid信息时死机。
【故障原因】
1、Raid阵列中一块或多块硬盘出现物理故障;
2、Raid控制器损坏导致Raid信息丢失;
3、Raid控制器升级、系统更新;
4、系统重装导致Raid信息丢失或被初始化;
5、意外断电或电源故障导致Raid模块损坏;
6、Raid阵列清尘没有标记盘序导致Raid盘序错乱。
【友情提示】
1、Raid阵列出现异常后,切忌重新创建Raid、强制上线或强制重组等操作,这些操作会提高数据恢复难度,甚至造成数据永久丢失。
2、非专业人士切忌对Raid模块进行拆卸、更换,不当的操作可能对硬盘内数据造成严重破坏,甚至永久损坏;
3、对阵列中的硬盘拆卸清尘时,需标记盘序,以免盘序错乱导致Raid信息丢失;
4、服务器开机状态下切忌插拔硬盘,防止Raid信息不同步导致服务器无法正常工作;
5、定期对重要数据做好备份,数据常常在没有防备的前提下突然丢失!