为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

磁盘阵列_资料

2013-05-13 31页 pdf 660KB 21阅读

用户头像

is_443498

暂无简介

举报
磁盘阵列_资料 Invoice Date Invoice # Bill To: Ship To: P.O. Number Terms Rep Ship Via F.O.B. Project Quantity Item Code Description Price Each Amount Total 2007年 12月 3 Tech ¡ 我爱 技术 在过去的 10 年里,CPU的运算速度提高了近 40 倍。但作为数据存储重要设备 的磁盘.其存取速度却没能与微处理器的性能同步发展发展。虽然磁盘的容量/...
磁盘阵列_资料
Invoice Date Invoice # Bill To: Ship To: P.O. Number Terms Rep Ship Via F.O.B. Project Quantity Item Code Description Price Each Amount Total 2007年 12月 3 Tech ¡ 我爱 技术 在过去的 10 年里,CPU的运算速度提高了近 40 倍。但作为数据存储重要设备 的磁盘.其存取速度却没能与微处理器的性能同步发展发展。虽然磁盘的容量/价 格比再不断改善,但磁盘速度却之提高了 3、4倍,如何才能进一步提升服务器 磁盘性能呢,本期 I-Tech为您揭晓。 本篇主要讲解的 RAID 技术起初主要应用于 服务器高端市场,但是随着个人用户市场的成 熟和发展,正不断向低端市场靠拢,从而为用 户提供了一种既可以提升硬盘速度,又能够确 保数据安全性的良好的解决。 目 录 C A T A L O G 〉 〉 〉 磁盘阵列(RAID)技术 一、 磁盘阵列(RAID)入门基础 二、 磁盘阵列(RAID)LEVEL 概述 三、 常用磁盘阵列(RAID)比较 四、 磁盘阵列(RAID)原理 五、 细说磁盘阵列(RAID) 磁盘阵列(RAID)饮水机 六、 磁盘阵列(RAID)术语 七、 磁盘阵列(RAID)FAQ 负债均衡技术 RAID 是英文 Redundant Array of Inexpensive Disks 的缩写,中文 简称为磁盘阵列。其实,从 RAID的英文原意中,我们已经能够多少知道 RAID 就是一种由多块廉价磁盘构成的冗余阵列。虽然 RAID包含多块磁盘,但是 在操作系统下是作为一个独立的大型存储设备出现。RAID 技术分为几种不 同的等级,分别可以提供不同的速度,安全性和性价比。 人们在开发 RAID 时主要是基于以下设想,即几块小容量硬盘的价格 总和要低于一块大容量的硬盘。虽然目前这一设想还没有成为现实,RAID 在节省成本方面的作用还不是很明显,但是 RAID可以充分发挥出多块硬盘 的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。除了性能上的 提高之外,RAID 还可以提供良好的容错能力,在任何一块硬盘出现问题的 情况下都可以继续工作,不会受到损坏硬盘的影响。 RAID系统究竟有什么好处呢? 1.扩大了存贮能力 可由多个硬盘组成容量巨大的存贮空间。 2.降低了单位容量的成本 市场上最大容量的硬盘每兆容量的价格要 大大高于普及型硬盘,因此采用多个普及型硬盘组成的阵列其单位价格要 低得多。 3.提高了存贮速度 单个硬盘速度的提高均受到各个时期的技术条件 限制,要更进一步往往是很因难的,而使用 RAID,则可以让多个硬盘同时 分摊数据的读或写操作,因此整体速度有成倍地提高。 4.可靠性 RAID 系统可以使用两组硬盘同步完成镜像存贮,这种安全 措施对于网络服务器来说是最重要不过的了。 RAID入门基础 Be yo nd C hin a 5.容错性 RAID 控制器的一个关键功能就是容错处理。容错阵列中如 有单块硬盘出错,不会影响到整体的继续使用,高级 RAID控制器还具有拯 救功能。 6.对于 IDE RAID来说,目前还有一个功能就是支持 ATA/66/100。RAID 也分为 SCSI RAID和 IDE RAID 两类,当然 IDE RAID 要廉价得多。如果主 机主板不支持 ATA/66/100 硬盘,通过 RAID 卡,则能够使用上新硬盘的 ATA/66/100功能。 1. RAID技术主要包含 RAID 0~RAID 7等数个,它们的侧重点各不相 同,常见的规范有如下几种: RAID 0:RAID 0连续以位或字节为单位分割数据,并行读/写于多个磁 盘上,因此具有很高的数据传输率,但它没有数据冗余,因此并不能算是 真正的 RAID结构。RAID 0只是单纯地提高性能,并没有为数据的可靠性提 供保证,而且其中的一个磁盘失效将影响到所有数据。因此,RAID 0不能 应用于数据安全性要求高的场合。 RAID 1:它是通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产 生互 为备份的数据。当原始数据繁忙时,可直接从镜像拷贝中读取数据, 因此 RAID 1可以提高读取性能。RAID 1是磁盘阵列中单位成本最高的,但 提供了很高的数据安全性和可用性。当一个磁盘失效时,系统可以自动切 换到镜像磁盘上读写,而不需要重组失效的数据。 RAID Level概述 Be yo nd C hin a RAID 0+1: 也被称为 RAID 10,实际是将 RAID 0和 RAID 1标准结 合的产物,在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的 同时,为每一块磁盘作磁盘镜像进行冗余。它的优点是同时拥有 RAID 0的 超凡速度和 RAID 1的数据高可靠性,但是 CPU占用率同样也更高,而且磁 盘的利用率比较低。 RAID 2:将数据条块化地分布于不同的硬盘上,条块单位为位或字节, 并使用称为“加重平均纠错码(海明码)”的编码技术来提供错误检查及恢复。 这种编码技术需要多个磁盘存放检查及恢复信息,使得 RAID 2技术实施更 复杂,因此在商业环境中很少使用。 RAID 3:它同 RAID 2非常类似,都是将数据条块化分布于不同的硬盘上, 区别在于 RAID 3使用简单的奇偶校验,并用单块磁盘存放奇偶校验信息。 如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据;如果奇偶盘失 效则不影响数据使用。RAID 3对于大量的连续数据可提供很好的传输率, 但对于随机数据来说,奇偶盘会成为写操作的瓶颈。 RAID 4:RAID 4同样也将数据条块化并分布于不同的磁盘上,但条块单 位为块或。RAID 4使用一块磁盘作为奇偶校验盘,每次写操作都需要 访问奇偶盘,这时奇偶校验盘会成为写操作的瓶颈,因此 RAID 4在商业环 境中也很少使用。 RAID 5:RAID 5不单独指定的奇偶盘,而是在所有磁盘上交叉地存取数 据及奇偶校验信息。在 RAID 5上,读/写指针可同时对阵列设备进行操作, 提供了更高的数据流量。RAID 5更适合于小数据块和随机读写的数据。 Be yo nd C hin a RAID 3与 RAID 5相比,最主要的区别在于 RAID 3每进行一次数据传 输就需涉及到所有的阵列盘;而对于 RAID 5来说,大部分数据传输只对一 块磁盘操作,并可进行并行操作。在 RAID 5中有“写损失”,即每一次写操 作将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写 新的数据及奇偶信息。 RAID 6:与 RAID 5相比,RAID 6增加了第二个独立的奇偶校验信息块。 两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁 盘同时失效也不会影响数据的使用。但 RAID 6需要分配给奇偶校验信息更 大的磁盘空间,相对于 RAID 5有更大的“写损失”,因此“写性能”非常差。 较差的性能和复杂的实施方式使得 RAID 6很少得到实际应用。 RAID 7:这是一种新的 RAID标准,其自身带有智能化实时操作系统和用 于存储管理的软件工具,可完全独立于主机运行,不占用主机 CPU资源。 RAID 7可以看作是一种存储计算机(Storage Computer),它与其他 RAID 标准有明显区别。除了以上的各种标准,我们可以如 RAID 0+1那样结合多 种 RAID规范来构筑所需的 RAID阵列,例如 RAID 5+3(RAID 53)就是一种应 用较为广泛的阵列形式。用户一般可以通过灵活配置磁盘阵列来获得更加 符合其要求的磁盘存储系统。 RAID级别的选择有三个主要因素:可用性(数据冗余)、性能和成本。如 果不要求可用性,选择 RAID0以获得最佳性能。如果可用性和性能是重要 的而成本不是一个主要因素,则根据硬盘数量选择 RAID 1。如果可用性、 成本和性能都同样重要,则根据一般的数据传输和硬盘的数量选择 RAID3、 RAID5。 Be yo nd C hin a 常用 RAID比较 Be yo nd C hin a 磁盘阵列中针对不同的应用使用的不同技术,称为 RAID level,而每一 level代表一种技术,目前业界公认的标准是 RAID 0~RAID 5。 这个 level并不代表技术的高低,level 5并不高于 level 3,level 1 也不低过 level 4,至于要选择那一种 RAID level的产品,纯视用户的操作 环境(operating environment)及应用(application)而定,与 level的高低 没有必然的关系。 RAID 0 及 RAID 1 适用于 PC 及 PC 相关的系统如小型的网络服务器 (network server)及需要高磁盘容量与快速磁盘存取的工作站等,因为比较 便宜,但因一般人对磁盘阵列不了解,没有看到磁盘阵列对他们价值,市场 尚未打开;RAID 2及 RAID 3适用于大型电脑及影像、CAD/CAM等处理;RAID 5 多用于 OLTP,因有金融机构及大型数据处理中心的迫切需要,故使用较多 而较有名气,但也因此形成很多人对磁盘阵列的误解,以为磁盘阵列非要 RAID 5不可;RAID 4较少使用,因为两者有其共同之处,而 RAID 4有其先天 的限制。其他如 RAID 6,RAID 7,乃至 RAID 10等,都是厂商各做各的,并无 一致的标准,在此不作说明。 介绍各个 RAID level之前,先看看形成磁盘阵列的两个基本技术:磁 盘延伸(Disk Spanning):译为磁盘延伸,能确切的表示 disk spanning这种 技术的含义。四个磁盘形成一个阵列(array),而磁盘阵列的控制器(RAID controller)是将此四个磁盘视为单一的磁盘,如 DOS环境下的 C:盘。这是 disk spanning 的意义,因为把小容量的磁盘延伸为大容量的单一磁盘,用 户不必规划数据在各磁盘的分布,而且提高了磁盘空间的使用率。DFTraid RAID原理 Be yo nd C hin a 的 SCSI 磁盘阵列更可连接几十个磁盘,形成数百 GB 到数 TB 的阵列,使磁 盘容量几乎可作无限的延伸;而各个磁盘一起作取存的动作,比单一磁盘更 为快捷。很明显的,有此阵列的形成而产生 RAID 的各种技术。我们也可从 上图看出 inexpensive(便宜)的意义,因为四个 250MBbytes 的磁盘比一个 1GBytes 的磁盘要便宜,尤其以前大磁盘的价格非常昴贵,但在磁盘越来越 便宜的今天,inexpensive 已非磁盘阵列的重点,虽然对于需要大磁盘容量 的系统,仍是考虑的要点。 磁盘或数据分段(Disk Striping or Data Striping):因为磁盘阵列是将同一阵列的多个磁盘视为单一的虚拟磁盘 (virtual disk),所以其数据是以分段(block or segment)的方式顺序存放 在磁盘阵列中。 我们在前文中已经提到 RAID 分为几种不同的等级,其中,RAID 0 是 最简单的一种形式。RAID 0 可以把多块硬盘连接在一起形成一个容量更大 的存储设备。最简单的 RAID 0技术只是提供更多的磁盘空间,不过我们也 可以通过设置,使用 RAID 0来提高磁盘的性能和吞吐量。RAID 0没有冗余 或错误修复能力,但是实现成本是最低的。 RAID 0最简单的实现方式就是把几块硬盘串联在一起创建一个大的卷 集。磁盘之间的连接既可以使用硬件的形式通过智能磁盘控制器实现,也 可以使用操作系统中的磁盘驱动程序以软件的方式实现。 我们可以把 3块磁盘组合在一起形成一个独立的逻辑驱动器,容量相 细说 RAID RAID 0 Be yo nd C hin a 当于任何任何一块单独硬盘的 3 倍。如图中彩色区域所示,数据被依次写 入到各磁盘中。当一块磁盘的空间用尽时,数据就会被自动写入到下一块 磁盘中。 这种设置方式只有一个好处,那就是可以增加磁盘的容量。至于速度, 则与其中任何一块磁盘的速度相同,这是因为同一时间内只能对一块磁盘 进行 I/O 操作。如果其中的任何一块磁盘出现故障,整个系统将会受到破 坏,无法继续使用。从这种意义上说,使用纯 RAID 0方式的可靠性仅相当 于单独使用一块硬盘的 1/3(因为本例中 RAID 0使用了 3块硬盘)。 虽然我们无法改变 RAID 0的可靠性问题,但是我们可以通过改变配置 方式,提供系统的性能。与前文所述的顺序写入数据不同,我们可以通过 创建带区集,在同一时间内向多块磁盘写入数据。 系统向逻辑设备发出的 I/O指令被转化为 3项操作,其中的每一项操 作都对应于一块硬盘。我们可以通过建立带区集,将原先顺序写入的数据 Be yo nd C hin a 被分散到所有的四块硬盘中同时进行读写。四块硬盘的并行操作使同一时 间内磁盘读写的速度提升了 3倍。 在创建带区集时,合理的选择带区的大小非常重要。如果带区过大, 可能一块磁盘上的带区空间就可以满足大部分的 I/O 操作,使数据的读写 仍然只局限在少数的一、两块硬盘上,不能充分的发挥出并行操作的优势。 另一方面,如果带区过小,任何 I/O 指令都可能引发大量的读写操作,占 用过多的控制器总线带宽。因此,在创建带区集时,我们应当根据实际应 用的需要,慎重的选择带区的大小。 我们已经知道,带区集可以把数据均匀的分配到所有的磁盘上进行读 写。如果我们把所有的硬盘都连接到一个控制器上的话,可能会带来潜在 的危害。这是因为当我们频繁进行读写操作时,很容易使控制器或总线的 负荷超载。为了避免出现上述问题,建议用户可以使用多个磁盘控制器。 这样,我们就可以把原先控制器总线上的数据流量降低一半。当然, 最好解决方法还是为每一块硬盘都配备一个专门的磁盘控制器。 虽然 RAID 0可以提供更多的空间和更好的性能,但是整个系统是非常 不可靠的,如果出现故障,无法进行任何补救。所以,RAID 0 一般只是在 那些对数据安全性要求不高的情况下才被人们使用。 RAID 1 和 RAID 0 截然不同,其技术重点全部放在如何能够在不影响 性能的情况下最大限度的保证系统的可靠性和可修复性上。RAID 1 是所有 RAID等级中实现成本最高的一种,尽管如此,人们还是选择 RAID 1来保存 那些关键性的重要数据。 RAID 1 Be yo nd C hin a RAID 1又被称为磁盘镜像,每一个磁盘都具有一个对应的镜像盘。对 任何一个磁盘的数据写入都会被复制镜像盘中;系统可以从一组镜像盘中 的任何一个磁盘读取数据。显然,磁盘镜像肯定会提高系统成本。因为我 们所能使用的空间只是所有磁盘容量总和的一半。 RAID 1下任何一块硬盘的故障都不会影响到系统的正常运行,而且只 要能够保证任何一对镜像盘中至少有一块磁盘可以使用,RAID 1 甚至可以 在一半数量的硬盘出现问题时不间断的工作。当一块硬盘失效时,系统会 忽略该硬盘,转而使用剩余的镜像盘读写数据。 通常,我们把出现硬盘故障的 RAID系统称为在降级模式下运行。虽然 这时保存的数据仍然可以继续使用,但是 RAID系统将不再可靠。如果剩余 的镜像盘也出现问题,那么整个系统就会崩溃。因此,我们应当及时的更 换损坏的硬盘,避免出现新的问题。 Be yo nd C hin a 更换新盘之后,原有好盘中的数据必须被复制到新盘中。这一操作被 称为同步镜像。同步镜像一般都需要很长时间,尤其是当损害的硬盘的容 量很大时更是如此。在同步镜像的进行过程中,外界对数据的访问不会受 到影响,但是由于复制数据需要占用一部分的带宽,所以可能会使整个系 统的性能有所下降。 因为 RAID 1主要是通过二次读写实现磁盘镜像,所以磁盘控制器的负 载也相当大,尤其是在需要频繁写入数据的环境中。为了避免出现性能瓶 颈,使用多个磁盘控制器就显得很有必要。下图示意了使用两个控制器的 磁盘镜像。 使用两个磁盘控制器不仅可以改善性能,还可以进一步的提高数据的 安全性和可用性。我们已经知道,RAID 1 最多允许一半数量的硬盘出现故 障,所以按照我们上图中的设置方式(原盘和镜像盘分别连接不同的磁盘控 制),即使一个磁盘控制器出现问题,系统仍然可以使用另外一个磁盘控制 器继续工作。这样,就可以把一些由于意外操作所带来的损害降低到最低 程度。 RAID 3采用的是一种较为简单的校验实现方式,使用一个专门的磁盘 存放所有的校验数据,而在剩余的磁盘中创建带区集分散数据的读写操作。 例如,在一个由 4块硬盘构成的 RAID 3系统中,3块硬盘将被用来保存数 据,第四块硬盘则专门用于校验。 第四块硬盘中的每一个校验块所包含的都是其它 3块硬盘中对应数据 RAID 3 Be yo nd C hin a 块的校验信息。RAID 3的成功之处就在于不仅可以象 RAID 1那样提供容错 功能,而且整体开销从 RAID 1 的 50%下降为 25%(RAID 3+1)。随着所使用 磁盘数量的增多,成本开销会越来越小。举例来说,如果我们使用 7 块硬 盘,那么总开销就会将到 12.5%(1/7)。 在不同情况下,RAID 3读写操作的复杂程度不同。最简单的情况就是 从一个完好的 RAID 3系统中读取数据。这时,只需要在数据存储盘中找到 相应的数据块进行读取操作即可,不会增加任何额外的系统开销。 当向 RAID 3写入数据时,情况会变得复杂一些。即使我们只是向一个 磁盘写入一个数据块,也必须计算与该数据块同处一个带区的所有数据块 的校验值,并将新值重新写入到校验块中。例如,当我们向上图中的绿色 数据块写入数据时,必须重新计算所有 3 个绿色数据块的校验值,然后重 写位于第四块硬盘的绿色校验块。由此我们可以看出,一个写入操作事实 上包含了数据读取(读取带区中的关联数据块),校验值计算,数据块写入 和校验块写入四个过程。系统开销大大增加。 我们可以通过适当设置带区的大小使 RAID系统得到简化。如果某个写 Be yo nd C hin a 入操作的长度恰好等于一个完整带区的大小(全带区写入),那么我们就不 必再读取带区中的关联数据块计算校验值。我们只需要计算整个带区的校 验值,然后直接把数据和校验信息写入数据盘和校验盘即可。 到目前为止,我们所探讨的都是正常运行状况下的数据读写。下面, 我们再来看一下当硬盘出现故障时,RAID系统在降级模式下的运行情况。 RAID 3虽然具有容错能力,但是系统会受到影响。当一块磁盘失效时, 该磁盘上的所有数据块必须使用校验信息重新建立。如果我们是从好盘中 读取数据块,不会有任何变化。但是如果我们所要读取的数据块正好位于 已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据 校验值重建丢失的数据。 当我们更换了损坏的磁盘之后,系统必须一个数据块一个数据块的重 建坏盘中的数据。整个过程包括读取带区,计算丢失的数据块和向新盘写 入新的数据块,都是在后台自动进行。重建活动最好是在 RAID系统空闲的 时候进行,否则整个系统的性能会受到严重的影响。 RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案。 以四个硬盘组成的 RAID 5为例,其数据存储方式如下图所示: 图中,P0为 D0,D1和 D2的奇偶校验信息,其它以此类推。 RAID 5 Be yo nd C hin a 由图中可以看出,RAID 5不对存储的数据进行备份,而是把数据和相 对应的奇偶校验信息存储到组成 RAID5 的各个磁盘上,并且奇偶校验信息 和相对应的数据分别存储于不同的磁盘上。当 RAID5 的一个磁盘数据发生 损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。 RAID 5可以理解为是 RAID 0和 RAID 1的折衷方案。RAID 5可以为系 统提供数据安全保障,但保障程度要比 Mirror 低而磁盘空间利用率要比 Mirror 高。RAID 5 具有和 RAID 0 相近似的数据读取速度,只是多了一个 奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由 于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比 RAID 1 高,存储成本相对较低。 Be yo nd C hin a 什么是校验 RAID 3和 RAID 5都分别使用了校验的概念提供容错能力。简单的说,我们 可以把校验想象为一种二进制的校验和,一个可以告诉你其它所有字位是否正确 的特殊位。 在数据通信领域,奇偶校验被用来确定数据是否被正确传送。例如,对于 每一个字节,我们可以简单计算数字位 1的个数,并在字节内加入附加校验位。 在数据的接收方,如果数字位 1的个数为奇数,而我们使用的又是奇数校验的话, 则说明该字节是正确的。同样对偶数校验也是如此。然而,如果数字位 1的个数 和校验位的奇偶性不一致的话,则说明数据在传送过程中出现了错误。 RAID 系统也采用了相似的校验方法,可以在磁盘系统中创建校验块,校验 块中的每一位都用来对其它关联块中的所有对应位进行校验。 在数据通讯领域,虽然校验位可以告诉我们某个字节是否正确,但是无法 告诉我们到底是哪一位出现了问题。这就是说我们可以错误,但是不能改正 错误。对于 RAID,这是远远不够的。固然错误的检测非常重要,但是如果不能 对错误进行修复,我们就无法提高整个系统的可靠性。 举个例子来说,假设我们发现校验块中第 10个字节的第 5位不正确。如果 这个校验块包含的是另外 8个数据块的校验信息,那么哪一个数据块才是问题的 罪魁祸首呢?也许你可能会想为每一个数据块都建立一个校验块就可以解决问 题。但是这种方法很难实现。事实上,RAID 主要是借助磁盘控制器的错误报告 检测错误位置,并进行修复。如果磁盘控制器在读 Be yo nd C hin a 对于 RAID种类恐怕很多文章都介绍过,这里我就不详细说明理论东 西了。恰巧笔者看到了一个外国描述 RAID各个级别的图片,感觉很多地 方定义得非常准确,而且通过看图了解 RAID效果会更加显著。(如图) RAID饮水机:) Be yo nd C hin a Array:阵列 磁盘阵列模式是把几个磁盘的存储空间整合起来,形成一个大的单一 连续的存储空间。NetRAID控制器利用它的 SCSI通道可以把多个磁盘组合 成一个磁盘阵列。简单的说,阵列就是由多个磁盘组成,并行工作的磁盘 系统。需要注意的是作为热备用的磁盘是不能添加到阵列中的。 Array Spanning:阵列跨越 阵列跨越是把 2个,3个或 4个磁盘阵列中的存储空间进行再次整合, 形成一个具有单一连续存储空间的逻辑驱动器的过程。NetRAID控制器可以 跨越连续的几个阵列,但每个阵列必需由相同数量的磁盘组成,并且这几 个阵列必需具有相同的 RAID级别。就是说,跨越阵列是对已经形成了的几 个阵列进行再一次的组合,RAID 1,RAID 3和 RAID 5跨越阵列后分别形成 了 RAID 10,RAID 30和 RAID 50. Cache Policy:高速缓存策略 NetRAID控制器具有两种高速缓存策略,分别为 Cached I/O(缓存 I/O) 和 Direct I/O(直接 I/O)。缓存 I/O总是采用读取和写入策略,读取的时 候常常是随意的进行缓存。直接 I/O 在读取新的数据时总是采用直接从磁 盘读出的方法,如果一个数据单元被反复地读取,那么将选择一种适中的 读取策略,并且读取的数据将被缓存起来。只有当读取的数据重复地被访 问时,数据才会进入缓存,而在完全随机读取状态下,是不会有数据进入 缓存的。 Capacity Expansion:容量扩展 RAID术语 Be yo nd C hin a 在微软的 Windows NT,2000或 Novell公司的 NetWare 4.2,5操作系 统下,可以在线增加目前卷的容量。在 Windows 2000或 NetWare 5系统下, 准备在线扩容时,要禁用虚拟容量选项。而在 Windows NT或 NetWare 4.2 系统下,要使虚拟容量选项可用才能进行在线扩容。 在 NetRAID控制器的快速配置工具中,设置虚拟容量选项为可用时, 控制器将建立虚拟磁盘空间,然后卷能通过重构把增加的物理磁盘扩展到 虚拟空间中去。重构操作只能在单一阵列中的唯一逻辑驱动器上才可以运 行,你不能在跨越阵列中使用在线扩容。 Channel:通道 在两个磁盘控制器之间传送数据和控制信息的电通路。 Format:格式化 在物理驱动器(硬盘)的所有数据区上写零的操作过程,格式化是一 种纯物理操作,同时对硬盘介质做一致性检测,并且标记出不可读和坏的 扇区。由于大部分硬盘在出厂时已经格式化过,所以只有在硬盘介质产生 错误时才需要进行格式化。 Hot Spare:热备用 当一个正在使用的磁盘发生故障后,一个空闲、加电并待机的磁盘将 马上代替此故障盘,此方法就是热备用。热备用磁盘上不存储任何的用户 数据,最多可以有 8 个磁盘作为热备用磁盘。一个热备用磁盘可以专属于 一个单一的冗余阵列或者它也可以是整个阵列热备用磁盘池中的一部分。 而在某个特定的阵列中,只能有一个热备用磁盘。 当磁盘发生故障时,控制器的固件能自动的用热备用磁盘代替故障磁 盘,并通过算法把原来储存在故障磁盘上的数据重建到热备用磁盘上。数 据只能从带有冗余的逻辑驱动器上进行重建(除了 RAID 0 以外),并且热 Be yo nd C hin a 备用磁盘必须有足够多的容量。系统管理员可以更换发生故障的磁盘,并 把更换后的磁盘指定为新的热备用磁盘。 Hot swap Disk Module:热交换磁盘模式 热交换模式允许系统管理员在服务器不断电和不中止网络服务的情况 下更换发生故障的磁盘驱动器。由于所有的供电和电缆连线都集成在服务 器的底板上,所以热交换模式可以直接把磁盘从驱动器笼子的插槽中拔除, 操作非常简单。然后把替换的热交换磁盘插入到插槽中即可。热交换技术 仅仅在 RAID 1,3,5,10,30和 50的配置情况下才可以工作。 I2O(Intelligent Input/Output):智能输入输出 智能输入输出是一种工业标准,输入输出子系统的体系结构完全独立 于网络操作系统,并不需要外部设备的支持。I2O使用的驱动程序可以分为 操作系统服务模块(operating system services module,OSMs)和硬件 驱动模块(hardware device modules,HDMs)。 Initialization:初始化 在逻辑驱动器的数据区上写零的操作过程,并且生成相应的奇偶位, 使逻辑驱动器处于就绪状态。初始化将删除以前的数据并产生奇偶校验, 所以逻辑驱动器在此过程中将一并进行一致性检测。没有经过初始化的阵 列是不能使用的,因为还没有生成奇偶区,阵列会产生一致性检测错误。 IOP(I/O Processor):输入输出处理器 输入输出处理器是 NetRAID控制器的指令中心,实现包括命令处理, PCI和 SCSI总线的数据传输,RAID的处理,磁盘驱动器重建,高速缓存的 管理和错误恢复等功能。 Logical Drive:逻辑驱动器 阵列中的虚拟驱动器,它可以占用一个以上的物理磁盘。逻辑驱动器 Be yo nd C hin a 把阵列或跨越阵列中的磁盘分割成了连续的存储空间,而这些存储空间分 布在阵列中的所有磁盘上。NetRAID控制器能设置最多 8个不同容量大小的 逻辑驱动器,而每个阵列中至少要设置一个逻辑驱动器。输入输出操作只 能在逻辑驱动器处于在线的状态下才运行。 Logical Volume:逻辑卷 由逻辑磁盘形成的虚拟盘,也可称为磁盘分区。 Mirroring:镜像 冗余的一种类型,一个磁盘上的数据在另一个磁盘上存在一个完全相 同的副本即为镜像。RAID 1和 RAID 10使用的就是镜像。 Parity:奇偶校验位 在数据存储和传输中,字节中额外增加一个比特位,用来检验错误。 它常常是从两个或更多的原始数据中产生一个冗余数据,冗余数据可以从 一个原始数据中进行重建。不过,奇偶校验数据并不是对原始数据的完全 复制。 在 RAID中,这种方法可以应用到阵列中的所有磁盘驱动器上。奇偶校 验位还可以组成专用的奇偶校验方式,在专用奇偶校验中,奇偶校验数据 可分布在系统中所有的磁盘上。如果一个磁盘发生故障,可以通过其它磁 盘上的数据和奇偶校验数据重建出这个故障磁盘上的数据。 Power Fail Safeguard:掉电保护 当此项设置为可用时,在重构过程中(非重建),所有的数据将一直保 存在磁盘上,直到重构完成后才删除。这样如果在重构过程中发生掉电, 将不会发生数据丢失的危险情况。 RAID:独立冗余磁盘阵列 独立冗余磁盘阵列最初叫做廉价冗余磁盘阵列(Redundant Array of Be yo nd C hin a Inexpensive Disks),它是由多个小容量、独立的硬盘组成的阵列,而阵 列综合的性能可以超过单一昂贵大容量硬盘(SLED)的性能。由于是对多 个磁盘并行操作,所以 RAID磁盘子系统与单一磁盘相比它的输入输出性能 得到了提高。服务器会把 RAID阵列看成一个单一的存储单元,并对几个磁 盘同时访问,所以提高了输入输出的速率。 RAID Levels:RAID级别 RAID级别为不同冗余类型在逻辑驱动器上的应用。它可以提高逻辑驱 动器的故障容许度和性能,但也会减少逻辑驱动器的可用容量,每个逻辑 驱动器都必须指定一个 RAID级别。 RAID 10,30和 50是逻辑驱动器跨越阵列而组成的。附表 2描述了跨 越磁盘阵列的情况。 Read Policy:读取策略 NetRAID 控制器提供了三种读取策略,分别为 Read-Ahead(预读), Normal(标准)和 Adaptive(适中)。 预读是在运行中,控制器不断的提前读取未被请求的数据,把它存储 在内存中,并期望这些数据能被使用。预读可以更快的提供连续数据,当 访问的是随机数据时效果就不佳了。 标准策略不使用预读的方法,当读取的数据大部分为随机数据时,这 个策略是最有效的。 适中策略是当访问的最后两个磁盘上的数据存储在连续扇区上时,将 采用预读的方法。 Ready State:就绪状态 就绪状态是一个可用的硬盘,它即不在线也不是热备用盘,并可以添 加到任一个阵列中或者指定为热备用盘的这种硬盘状态。Rebuild:重建 Be yo nd C hin a 在 RAID 1,3,5,10,30或 50阵列中把一个故障盘上的所有数据再 生到替换磁盘上的过程。磁盘重建过程中逻辑驱动器通常不会中断对其数 据的访问请求。 Rebuild Rate:重建率 重建操作过程的速度。每个控制器都分配了重建率,它反映的是在重 建操作中 IOP资源使用的百分比。 Reconstruct:重构 在改变 RAID级别后,对逻辑驱动器上的数据重新整理的过程。 SCSI Disk Status:SCSI磁盘状态 SCSI磁盘(物理驱动器)可以有以下五种状态,分别为 Ready(就绪), 未配置的加电可操作磁盘;Online(在线),配置过的加电可操作磁盘;Hot Spare(热备用),当一个磁盘出现故障时,准备使用的加电待用磁盘;Failed (故障),磁盘发生错误导致失效或用户利用 NetRAID控制器实用程序使驱 动器脱机的状态;Rebuilding(重建),磁盘正处于从一个或几个关键性逻 辑驱动器上恢复数据的过程中。 Stripe Size:条带容量 在每个磁盘上连续写入数据的总量,也称作“条带深度”。你可以指定 每个逻辑驱动器的条带容量从 2KB,4KB,8KB一直到 128KB.为了获得更高 的性能,要选择条带的容量等于或小于操作系统的簇的大小。大容量的条 带会产生更高的读取性能,尤其在读取连续数据的时候。而读取随机数据 的时候,最好设定条带的容量小一点。如果指定 128KB 的条带将需要 8MB 内存。 Striping:条带化 条带化是把连续的数据分割成相同大小的数据块,把每段数据分别写 Be yo nd C hin a 入到阵列中不同磁盘上的方法。此技术非常有用,它比单个磁盘所能提供 的读写速度要快的多,当数据从第一个磁盘上传输完后,第二个磁盘就能 确定下一段数据。数据条带化正在一些现代数据库和某些 RAID硬件设备中 得到广泛应用。 Virtual Sizing:虚拟容量 当此设置生效后,对一个逻辑驱动器来说,控制器将报告逻辑驱动器 的容量比实际的物理容量要大的多。“虚拟”空间可以允许在线扩容。 Write policy:写入策略 当处理器向磁盘上写入数据的时候,数据先被写入高速缓存中,并认 为处理器有可能马上再次读取它。NetRAID有两种如下的写入策略: Write Back(回写),在回写状态下,数据只有在要被从高速缓存中清 除时才写到磁盘上。随着主存读取的数据增加,回写需要开始从高速缓存 中向磁盘上写数据,并把更新的数据写入高速缓存中。由于一个数据可能 会被写入高速缓存中许多次,而没有进行磁盘存取,所以回写的效率非常 高。 Write Through(完全写入),在完全写入状态下,数据在输入到高速 缓存时,它同时也被写到磁盘上。因为数据已经复制到磁盘上,所以在高 速缓存中可以直接更改要替换的数据,因此完全写入要比回写简单的多。 Be yo nd C hin a 个人用户在组建 RAID即磁盘阵列的过程中,应该注意什么问题呢? 1.问:我应该选择怎样的 RAID解决方案,带 RAID功能的主板?RAID控 制卡?还是软件 RAID? 答:其实 RAID 解决方案只有高端和低端之分,对于绝大部分的廉价 RAID解决方案来讲,其构架中都不包含运算部分,因此对 CPU的依赖性比 较强,低速的 CPU很难胜任这种工作,当然,对于较新的 CPU如 PⅢ、新赛 扬、雷鸟、毒龙等来说,这种运算完全可以承受,但是为了保证 RAID系统 的稳定运行,并且为了避免 RAID拖累系统性能,我们强烈建议用户使用主 频 1GHz以上的 CPU。 至于是选择 RAID卡还是购买带集成 RAID功能的主板,则要依据用户 的需求而定,一般来说,使用 RAID卡能得到比较稳定的性能,但是会占用 一个宝贵的扩展槽,而且成本较高;如果是正在准备升级主板或新装机的用 户,集成 RAID芯片的主板则是以最低成本实现 RAID功能的首选。 2.问:我使用了 RAID系统,但是并没有感觉到速度有明显的提升,这 是为什么? 答:对于 RAID系统有数种标准,对于 RAID 1、RAID 5等标准的磁盘阵 列,主要追求数据的可靠性,所以尽管是并行存储,但由于需要对数据进 行校验,所以它们的写性能会受到一些影响,对于普通用户来说,会感到 速度提升并不明显。当然,对于一些需要大量读取的应用,它们的优势还 是比较大的。 3.问:我使用了 RAID 0标准的磁盘阵列方式,我听说这样会导致数据 RAID FAQ Be yo nd C hin a 非常不安全,我是不是应该使用 RAID 0+1方式? 答:对于普通用户而言,RAID 0 的安全性还是可以承受的,但对于重 要数据而言,RAID 0显然是比较危险的方式,并且 RAID 0阵列中的磁盘数 量越多,出现问题的几率越大。由于 RAID 0使用分割数据的方式且没有冗 余,一旦某块磁盘失效,将会对所有数据造成毁灭性的打击,相对的,其 他 RAID方式均提供了冗余盘(或数据块)用来备份或者恢复数据。因此我们 建议用户不要在 RAID 0阵列中存储重要数据或在其上安装系统,因为进行 大量临时交换文件的存储和交换才是 RAID 0真正的优势所在。 4.问:我有两块规格并不一致的硬盘,我能不能使用 RAID?效果怎样? 答:可以使用 RAID 0方式,但是要注意的是,这样构建的 RAID 0,总 容量将是较小的磁盘的容量×磁盘总数,因此可能会造成一些资源的浪费。 当然电脑如果拥有比较强劲的运算能力并且使用 Windows 2000/XP 操作系 统,使用软件 RAID 就可以避免这种损失,详情请参看本篇内的“动态磁盘” 相关介绍。 5.问:使用 RAID和使用 SCSI硬盘有什么不同,哪一种性价比更好? 答:我们这里仅仅讨论 IDE-RAID,在通常情况下,SCSI能够提供更好 的稳定性和更快的速度,但是价格则是相当昂贵。一款 7200 转的 9.2GB/Ultra160 SCSI硬盘价格会高达 1500元左右,相比之下,同样价位 的普通 IDE硬盘容量会达到 80GB以上。 我们可以对比 IDE-RAID和 SCSI RAID,我们使用 4块迈拓(Maxtor)金 钻七代80GB硬盘组成RAID 0+1,选用支持ATA/133的HighPoint RocketRAID 404 RAID 卡,这套系统的总价在 8000 元以下*,大约相当于某 10 000 转 73.4GB 容量的 SCSI 硬盘,使用 Ultra160 SCSI 接口/4MB 缓存,并且配备 支持 Ultra160的 SCSI卡。 Be yo nd C hin a 当然,SCSI硬盘有着许多普通 IDE硬盘无法比拟的优点,例如高传输 率、低 CPU 占用率和支持热插拔等,但对个人用户而言,它的性价比还是 很低,我们不得不将目光继续留在我们的 IDE硬盘上。 Be yo nd C hin a 负载均衡技术简述 当前,无论在企业网、园区网还是在广域网如 Internet 上,业务量的发展都超出了过去 最乐观的估计,上网热潮风起云涌,新的应用层出不穷,即使按照当时最优配置建设的网络, 也很快会感到吃不消。尤其是各个网络的核心部分,其数据流量和计算强度之大,使得单一 设备根本无法承担,而如何在完成同样功能的多个网络设备之间实现合理的业务量分配,使 之不致于出现一台设备过忙、而别的设备却未充分发挥处理能力的情况,就成了一个问题, 负载均衡机制也因此应运而生。 负载均衡建立在现有网络结构之上,它提供了一种廉价有效的方法扩展服务器带宽和增加 吞吐量,加强网络数据处理能力,提高网络的灵活性和可用性。它主要完成以下任务:解决 网络拥塞问题,服务就近提供,实现地理位置无关性 ;为用户提供更好的访问质量;提高服 务器响应速度;提高服务器及其他资源的利用效率;避免了网络关键部位出现单点失效。 对一个网络的负载均衡应用,可以从网络的不同层次入手,具体情况要看对网络瓶颈所在 之处的具体分析,大体上不外乎从传输链路聚合、采用更高层网络交换技术和设置服务器集 群策略三个角度实现。 ■传输链路聚合 为了支持与日俱增的高带宽应用,越来越多的 PC 机使用更加快速的链路连入网络。而网 络中的业务量分布是不平衡的,核心高、边缘低,关键部门高、一般部门低。伴随计算机处 理能力的大幅度提高,人们对多工作组局域网的处理能力有了更高的要求。当企业内部对高 带宽应用需求不断增大时(例如 Web访问、文档传输及内部网连接),局域网核心部位的数据 接口将产生瓶颈问题,瓶颈延长了客户应用请求的响应时间。并且局域网具有分散特性,网 络本身并没有针对服务器的保护措施,一个无意的动作(像一脚踢掉网线的插头)就会让服 务器与网络断开。 通常,解决瓶颈问题采用的对策是提高服务器链路的容量,使其超出目前的需求。例如可 以由快速以太网升级到千兆以太网。对于大型企业来说,采用升级技术是一种长远的、有前 景的解决方案。然而对于许多企业,当需求还没有大到非得花费大量的金钱和时间进行升级 时,使用升级技术就显得大材小用了。在这种情况下,链路聚合技术为消除传输链路上的瓶 颈与不安全因素提供了成本低廉的解决方案, 链路聚合技术,将多个线路的传输容量融合成一个单一的逻辑连接。当原有的线路满足不 了需求,而单一线路的升级又太昂贵或难以实现时,就要采用多线路的解决方案了。目前有 4 种链路聚合技术可以将多条线路“捆绑”起来。同步 IMUX系统工作在 T1/E1的比特层,利用多 个同步的 DS1信道传输数据,来实现负载均衡。IMA是另外一种多线路的反向多路复用技术, 工作在信元级,能够运行在使用 ATM 路由器的平台上。用路由器来实现多线路是一种流行的 链路聚合技术,路由器可以根据已知的目的地址的缓冲(cache)大小,将分组分配给各个平 行的链路,也可以采用循环分配的方法来向线路分发分组。多重链路 PPP,又称 MP 或 MLP, 是应用于使用 PPP封装数据链路的路由器负载平衡技术。MP可以将大的 PPP数据包分解成小 Be yo nd C hin a 的数据段,再将其分发给平行的多个线路,还可以根据当前的链路利用率来动态地分配拨号 线路。这样做尽管速度很慢,因为数据包分段和附加的缓冲都增加时延,但可以在低速的线 路上运行得很好。 链路聚合系统增加了网络的复杂性,但也提高了网络的可靠性,使人们可以在服务器等关 键 LAN段的线路上采用冗余路由。对于 IP系统,可以考虑采用 VRRP(虚拟路由冗余协议)。 VRRP 可以生成一个虚拟缺省的网关地址,当主路由器无法接通时,备用路由器就会采用这个 地址,使 LAN 通信得以继续。总之,当主要线路的性能必需提高而单条线路的升级又不可行 时,可以采用链路聚合技术。 ■更高层交换 大型的网络一般都是由大量专用技术设备组成的,如包括防火墙、路由器、第 2层/3层交 换机、负载均衡设备、缓冲服务器和 Web服务器等。如何将这些技术设备有机地组合在一起, 是一个直接影响到网络性能的关键性问题。现在许多交换机提供第四层交换功能,可以将一 个外部 IP 地址映射为多个内部 IP 地址,对每次 TCP 连接请求动态使用其中一个内部地址, 达到负载均衡的目的。有的协议内部支持与负载均衡相关的功能,例如 HTTP协议中的重定向 能力。 Web 内容交换技术,即 URL 交换或七层交换技术,提供了一种对访问流量的高层控制 方式。Web 内容交换技术检查所有的 HTTP 报头,根据报头内的信息来执行负载均衡的决策, 并可以根据这些信息来确定如何为个人主页和图像数据等内容提供服务。它不是根据 TCP 端 口号来进行控制的,所以不会造成访问流量的滞留。如果 Web服务器已经为图像服务、SSL对 话、数据库事务服务之类的特殊功能进行了优化,那么,采用这个层次的流量控制将可以提 高网络的性能。目前,采用第七层交换技术的产品与方案,有黎明网络的 iSwitch、交换机, Cisco的 CDN(内容交换网络系统)等。 服务器群集解决方案 在某些情况下,例如,某网站内部职员和外部客户同时使用网站,而公司要将内部职 员的服务请求连接到一个较慢的服务器来为外部客户提供更多的资源,这时就可以使用 Web 内容交换技术。Web主机访问控制设备也可以使用这种技术来降低硬件成本,因为它可以轻易 地将访问多个主机的用户流量转移给同一个 Web 服务器。如果用户访问量增加到一定程度, 这些流量还可以被转移到专用的 Web 服务器设备,虽然这种专用设备的成本较高,但是由于 使用的是相同的 Web内容交换技术来控制流量,所以网络的结构框架就不用再进行改变了。 但是,使用 Web内容交换技术的负载均衡设备所能支持的标准和规则的数目有限,其 采用的标准和规则的灵活性也有限。另外,负载均衡设备所能监测到 HTTP报头的深度也是限 制内容交换能力的一个因素。如果所要找的信息在负载均衡设备所不能监测的字段内,那内 容交换的作用就无法发挥。而且,内容交换还受到能够同时开启的 TCP 连接数量以及 TCP 连 接的建立和断开比率的限制。另外,Web内容交换技术还会占用大量的系统资源(包括内存占 用和处理器占用)。对 Web内容交换技术进行的测试表明,操纵 Web内容的吞吐量是很费力的, 有时只能得到很小的性能改进。所以,网络管理员必须认真考虑投入与回报的问题。 ■带均衡策略的服务器群集 Be yo nd C hin a 如今,服务器必须具备提供大量并发访问服务的能力,其处理能力和 I/O能力已经成 为提供服务的瓶颈。如果客户的增多导致通信量超出了服务器能承受的范围,那么其结果必 然是——宕机。显然,单台服务器有限的性能不可能解决这个问题,一台普通服务器的处理 能力只能达到每秒几万个到几十万个请求,无法在一秒钟内处理上百万个甚至更多的请求。 但若能将 10台这样的服务器
/
本文档为【磁盘阵列_资料】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索