怎么防止raid发生不可恢复的读取错误
2012-01-03 22:11:45 来源:华军科技数据恢复
如果你从来没有重建一个RAID系统,那么相信不可恢复的读取错误( Unrecoverable Read Error,URE)是一个你永远不愿意了解的名词。从字面上来看,URE一定不是指什么好事,因为它可能导致RAID重建中断,使得整个RAID卷不可用。
在这里我就不详细解决导致不可恢复读取错误发生的根源,我想要做的就是提供一些如何让你不会成为这种错误受害者的技巧。
1、如果你计划使用大型非企业级SATA磁盘,不要使用RAID 5
当谈到可靠性的时候,企业级磁盘往往要比非企业级磁盘可靠得多。随着磁盘容量的增长以及更多磁盘被添加到RAID 5阵列中,整个RAID卷发生数据丢失的几率就会进入一个危险的区域。
如果你真的打算搭建一个大型阵列并希望将RAID开销降至最低,那么你甚至可以考虑一下使用RAID 50,也就是一个由RAID 5组成的RAID 0。如果你将对这14个磁盘阵列使用RAID 50,那么你就得搭建三个4磁盘RAID 5阵列并且做RAID 0,用剩余两个磁盘做备盘。
2、如果你需要提高上限的话,不要使用廉价硬件
是的,预算很紧张,但是不能将你的数据至于风险中,你应该购买例如SAS、光纤通道磁盘或者至少是高端SATA磁盘这样的企业级磁盘。
如果你正在使用误码率在1/10~1/14之间的磁盘,那么你就是在使用廉价磁盘。企业级磁盘的误码率在1/10~1/15之间,或者到1/16,这使得这种磁盘更不容易遭遇不可恢复的读取错误。
提示:我并不是说你应该购买SAS磁盘而不是SATA磁盘,但一定要购买那些误码率在合理范围内的磁盘。
3、如果你需要很多磁盘来提高性能的话,采用容量更小的磁盘
例如,当你的磁盘系统受到IOPS限制的时候,减少解决方案的磁盘数可以解决问题,因此在很多情况下,你可能希望在一个RAID阵列中有一堆磁盘。如果你是这么想的话,那就使用容量较小的磁盘吧。
另外一个担心就是,在丢失大容量磁盘(例如1TB或者2TB磁盘)之后重建的短暂时间内可能会遭遇不可恢复的读取错误。当磁盘容量变小,数据丢失几率就会大大降低,因为低容量磁盘的重建更快。随着磁盘容量持续增长,这种数据丢失的几率越来越大,这个问题会变得越来越严峻,除非制造商可以生产出具有更低误码率的驱动器。
4、备份、备份、再备份
曾经有人问我,为什么我们在所有服务器上使用了RAID还要备份呢?不管磁盘多么可靠,也不管你有多么远离潜在URE的发生,没有什么可以取代可靠的备份。如果你遭遇不可恢复的读取错误,你就会需要可靠的备份。
5、保持耐心
存储需求持续增长,RAID 6并不一定适合所有那些喜欢RAID 5的人们。我们面对市场需求,就要以足够高的冗余性来满足这一需求。我们也看到了在产品中使用更新的数据保护方法,例如Windows Home Server和Drobo的产品线,针对企业设备的类似功能的出现只是一个时间问题。