服务器阵列RAID6简介_数据资讯_恢复资讯_技王数据恢复-技王数据恢复中心

服务器阵列RAID6简介

2013-12-12 20:00:31 来源：技王数据恢复

技王数据恢复

RAID6和Reed-Solomon编码

www.sosit.com.cn

　　笔者本来想写成“李德-所罗门编码”，但那样就不方便大家一边看帖子一边google了。 www.sosit.com.cn

　　Reed-Solomon编码是通讯领域中经常碰到的一个算法，已经有15年以上的历史了。技王数据恢复

　　其实很多校验算法都是通讯领域最先研究出来，然后才应用到其他领域的。前面说到的XOR算法对一组数据只能产生一个校验，搞通讯的工程师们觉得不够可靠，于是就研究出很多能对一组数据产生多个校验的算法。Reed-Solomon编码是其中应用最广泛的一个，咱们以前经常用的ADSL、xDSL、高速Modem都有采用。后来手机、卫星电视、数字电视、CD唱片、DVD、条码系统、还有……连高级点儿的服务器内存也用这个算法做校验和纠错。 www.sosit.com.cn

　　现在存储的工程师也觉得RAID5中只能容忍一颗磁盘离线不够理想，需要一种容忍多颗磁盘离线的技术，自然就会想到Reed-Solomon编码啦。把这种算法应用到存储中，就可以让N颗磁盘的空间装应用数据，M颗磁盘的空间装校验码(对一组N个数据生成M个校验，但实际上校验码是分散在所有磁盘上的)，这样只要离线的磁盘不大于M颗，数据就不会丢失。技王数据恢复

　　Reed-Solomon编码理论中有一个公式：

技王数据恢复

　　N + M + 1 = 2的b次方技王数据恢复

　　其中b是校验字的位数。(校验字是生成校验过程需要用的一个东东，不是最后的校验码。)举例来说，如果用8位的字节做校验字，那么M + N = 255，而RAID6是特指M = 2，这样N = 253。

　　就是说，用8位字节做校验字的话，理论上一个RAID6的磁盘组可以容下253颗磁盘。

　　当然啦，实际应用中，太多的磁盘一起做运算会严重影响性能，所以阵列控制器和芯片的设计者都会把磁盘组的容量限制在16颗左右。

　　卖了这么多关子，实在是因为RAID6这个概念所指的意义太混乱。从功能上讲，能实现两颗磁盘掉线容错的，都叫RAID6。(至少我认识的销售们都这么认为。)但是实行这一功能的方式却有很多很多。

　　Intel的P+Q RAID6，NetApp的RAID-DP，HP的RAID5-DP，还要很多实验室中的原型机都能实行这个功能。但是由于机制不同，各种所谓的RAID6，其性能表现、磁盘负载分布、错误恢复方式都完全不同。

　　三、基于P+Q的RAID6

　　在Intel的80333IOP芯片中，有一个新的引擎叫P+Q单元，是专门用来处理RAID6加速的。详情请查阅Intel官方网站　

　　Intel的P+Q RAID6是这样写磁盘的：

　　这里每个条带中的P，跟RAID5里面的P意义完全一样，就是同一条带中除Q以外其它数据的XOR运算结果。

　　而Q呢，就是理解这个技术的关键所在了。

　　Q是同一条带中各数据的Galois Field进行XOR运算的结果。

　　“找到条带中每个数据的GF，然后这些GF再XOR一下，就得到Q。”

　　(GF是Galois Field的缩写，是法国著名数学家伽罗瓦发明的一种数学变换。)

　　这个GF变换呢，就是这个淘气的伽同学当年为了逃避老师点名，而发明的一种教室换座位方法。按照这种方法，每个人都不会坐在自己的座位上，而且每个人都肯定会有座位。而且任意个同学的座位号进行XOR运算之后，仍然跑不出这个教室里的座位号。

　　在Intel 80333IOP中存着两个表格，分别对应GF正向变换和反向变换。任何一个8位二进制数，都可以直接在表格中查到对应的GF变换结果。

　　这两个表格分别在Intel 80333IOP研发手册的第445页和446页，不过我估计大部分人会懒得去看。也是，看了又能怎么样呢?反正Intel已经把那玩意固化到芯片里了。

　　如果一颗磁盘掉线，根本不需要Q用P直接就搞定了，跟RAID5一样。

　　如果两颗磁盘掉线，又分做两种情况：

　　A)坏的地方有Q。这种情况跟RAID5坏一颗磁盘一样，用XOR就恢复了。

　　B)坏的地方没有Q。用GF变换加XOR一起搞定。按照Intel的官方说法，是用“恢复矩阵”进行恢复。

　　结合上面表格的例子，如果磁盘5和磁盘6掉线。那条带1和条带2就属于情况A;而条带3、4、5和6属于情况B。

　　其实P+Q只是一种算法，Intel IOP里面的硬件加速引擎并不是必须的。有一些产品就采用了PowerPC等不含P+Q引擎的CPU，一样不耽误P+Q RAID6功能。

　　GF转换表在软件里完成就是了。

简单的说，RAID6主要是比RAID5更加安全，允许两块硬盘出现离线，阵列还可以正常运行。

假如服务器阵列无法进入系统，或者阵列信息丢失了等，千万不要重新初始化配置阵列信息或者强制上线同步操作，或阵列重新可以联系我们技王，我们有更加专业的服务器阵列工程师为您服务！

上一篇：教你解决MySQL数据库乱码下一篇：硬盘固件损坏数据恢复