存储虚拟化技术研究比较 |
发布时间: 2012/9/12 19:56:59 |
存储虚拟化技术研究比较1.引言 信息网络的普及与发展,带动了信息存储技术的进步与发展。日益增长的信息存储需求,从MB、GB到TB,不断增长的数据量,使数据存储越来越复杂。企业用户面对日益复杂的异构平台,不同厂商的产品,不同种类的存储设备,给存储管理带来诸多难题。以服务器为中心的系统正逐步向以网络、数字信息为中心转移。数据应用已不再局限于某一企业和部门,而分布于整个网络环境。系统整合、资源共享、简化管理、降低成本以及自动存储将成为信息存储技术的发展要求。存储虚拟化技术(Storage Virtualization)是解决这些问题的有效手段,现成为信息存储技术的主要发展方向。其重要地位日趋显著,不仅体现在技术方面,更体现在应用方面。 存储虚拟化不是一个新概念,如卷管理就是一种存储虚拟化的服务器软件,但网络存储的飞速发展给存储虚拟化赋予了新的内涵。使之成为共享存储管理中的主流技术。存储虚拟化把不同接口协议(如SCSI,iSCSI或FC等)的物理存储设备(如JBOD,RAID和磁带库等)整合成一个虚拟的存储池,根据需要为主机创建和提供虚拟存储卷。在虚拟存储技术管理下的各种存储设备,在主机应用程序面前呈现为一个虚拟的存储池,而不依赖于其位置、数量及种类,它对用户完全透明,等效于一个本地大硬盘。该虚拟存储池可根据需要动态而透明地扩容,并能按用户要求,透明地实现服务器之间的动态数据迁移。 2.存储虚拟化技术原理 存储虚拟化的基本原理是,把多个存储介质模块(如硬盘、磁盘、磁带)通过一定手段集中管理。从主机和工作站的角度看它不是多个硬盘,而是一个分区或者一个卷,如同一个超大容量的硬盘。这些分区或者卷利用计算机操作系统平台上的卷管理软件进行管理,把多个磁盘组或者多个磁盘条带组织起来,虚拟成统一的数据块集,这样操作系统就可以统一而方便地使用所有磁盘。 存储虚拟化技术将底层存储设备进行抽象化管理,在服务器层屏蔽存储设备硬件的特殊性,只保留其统一的逻辑特性,从而实现存储系统集中、统一而方便的管理。整个存储系统中的虚拟存储部分就像计算机操作系统。对下层管理各种具体设备,对上层提供相对统一的运行环境和资源使用方式。 从目前情况看,存储虚拟化技术有以下4种功能。 2.1提高存储系统性 在传统磁盘阵列中。不同容量的磁盘无法混合使用,而虚拟技术可以把不同时期购买的不同容量磁盘,统一起来使用。数据块虚拟存储方案为多台客户机提供了极高的带宽,最大限度地减少了延时和冲突的发生。 2.2提高系统容量 显而易见,虚拟空间的磁盘、磁带等增加了系统容量。 2.3改变设备使用方式 例如,服务器不必关心后端物理设备,也不会因为物理设备发生任何变化而受任何影响。磁带可当作磁盘使用,磁盘也可当作磁带使用。TCP/IP的网络连接可虚拟成ScSI连接。例如彩带设备,在传统的系统中,只能被当作顺序读写设备使用,通过虚拟化技术,变成可随机读写的块设备,摆脱了离线存储的宿命而加了在线存储的行列。 2.4加强存储系统安全性 例如,虚拟文件系统存储方案着重解决网络中文件共享的安全机制问题。 3.存储虚拟化技术类型 3.1对称式与非对称式 目前,存储虚拟化的发展尚无统一标准。从存储虚拟化的拓扑结构来讲,有对称式和非对称式两种,根据实现机制又分为带内和带外两种基本类型。两种方式的主要区别在于存储网络中数据I/O与控制信息是否使用同一通道,如图1和2所示。 3.1.1对称式(In-Band) 如网I所示,对称式结构存储虚拟化(又叫做带内存储虚拟化),是指存储虚拟化控制设备、交换设备与存储软件系统集成在一台专用服务器中。通过这种方式整合多种技术于存储设备,管理是集中式的,因此具有极高的安全性。这种方式是在数据读写过程中,在主机到存储设备的路径上实现存储虚拟化,也称为“同步虚拟”。对称式结构存储虚拟化,数据和控制信息,使用同一条通路。虽然节省了硬件设备,但是容易造成网络拥塞,降低性能,同时容易产生瓶颈和单点失效。专用服务器是整个网络的单点故障,故在应用中这种结构往往是冗余配置。 3.1.2非对称式(Out-of-Band) 如图2所示,非对称式结构存储虚拟化〔又叫做带外存储虚拟化),数据和命令信息使用不同的通路。就是在存储区域网络中(或主机系统以太网)设置专用于存储控制的服务器作为元数据控制器。数据在专用通道上传愉,提供了很好的访问性能,减少了网络延迟。增加了带宽,不需要对现有的网络架构进行改变,避免了单点故障和瓶颈。这种方式是在数据读写之前就已经做好了虚拟工作,而且实现虚拟的部分并不在主机到存储设备的访问路径上,因此称为“异步虚拟”。非对称结构存储虚拟化的劣势在于数据的安全性控制,当没有加人到虚拟控制环境中的服务器直接连人网络时,这个服务器有可能直接对存储进行访问或操作。另外,此方案在一定程度上增加了成本。 3.2数据块虚拟与虚拟文件系统 3.2.1数据块虚拟 在多交换机组成的大型FC结构的SAN中,由干多台主机通过多个交换机端口访问存储设备。会产生严重的延时和数据块冲突。数据块虚拟存储方案利用虚拟的多端口并行技术,为多台客户机提供了极高的带宽,最大限度地减少了延时与冲突。在实际应用中,数据块虚拟存储方案以对称式拓扑结构来实现。 3.2.2虚拟文件系统 虚拟文件系统存储方案着重解决大规模网络文件共享的安全机制问题。对不同站点指定不同的访问权限,限制越权访问,保证网络文件的安全。在实际应用中,崖拟文件系统存储方案以非对称式拓扑结构来实现。4.存储虚拟化技术实现与比较 一般来说,主机、存储设备和存储网络都有对应的存储虚拟化技术存在,根据其所在的位置,存储虚拟化技术可分为基于主机、基于存储设备以及基于网络的虚拟存储技术 4.存储虚拟化技术实现与比较 4.1基于主机的虚拟存储 基于主机的虚拟存储完全依赖存储管理软件,无需任何附加硬件。基于主机的存储管理软件,在系统和应用级上,实现多机间的共享存储、存储资源管理(存储媒介、卷、文件管理)、数据复制和数据迁移、远程备份、集群系统、灾难恢复等存储管理任务。 基于主机的虚拟存储又可分为数据块以上虚拟层和数据块存储虚拟层: 4.1.1数据块以上虚拟层(ViAualization above Block ) 它是存储虚拟化的最顶层,通过文件系统和数据库给应用程序提供一个虚拟数据视图,屏蔽了底层实现。 4.1.2数据块存储虚拟层(Block Storage Virtualzation ) 通过基于主机的卷管理程序和附加设备接口,给主机提供一个整合的存储访问视图。卷管理程序为虚拟存储设备创建逻辑卷。井负责数据块UO请求的路由。 4.2基于存储设备的虚拟存储 存储设备虚拟层管理共享存储资源并匹配可用资源和访问请求。基于存储设备的虚拟方法目前最常用的是虚拟磁盘。虚拟磁盘是指把多个物理磁盘按照一定方式组织起来形成一个标准的虚拟逻辑设备。虚拟磁盘主要由功能设备、管理器以及物理磁盘组成。 4.2.1功能设备 它是主机所看到的虚拟逻辑单元,可以当作一个标准的磁盘设备使用。 4.2.2管理器 它通过一系列“逻辑磁道与物理磁道”指针转换表完成逻辑磁盘到物理磁盘卷的间接地址映射。 4.2.3物理磁盘 它用于存储的物理设备。 虚拟磁盘提供远远大于磁盘实际物理容量的虚拟空间。不管功能磁盘分配了多少空间,如果没有数据写到虚拟磁盘上,就不会占用任何物理磁盘空间。数据按照控制器内部的性能优化算法被存储到后台的物理磁盘上。数据被有效地分布到后台的所有磁盘上,消除了对物理磁盘的竟争所造成的性能瓶颈。当数据更新时,数据并不会被写回原来的位置,极大地改善了更新操作的性能。 4.3基于网络的虚拟存储 网络虚拟层包括了绑定管理软件的存储服务器和网络互联设备。基于网络的虚拟化是在网络设备之间实现存储虚拟化功能,它将类似于卷管理的功能扩展到整个存储网络,负责管理Host视图、共享存储资源、数据复制、数据迁移及远程备份等,并对数据路径进行管理避免性能瓶颈。 基于网络的虚拟存储可采用对称或非对称的虚拟存储架构。在非对称架构中,虚拟存储控制器处于系统数据通路之外。不直接参与数据的传输。服务器可以直接经过标准的交换机对存储设备进行访问。虚拟存储控制器对所有存储设备进行配置。并将配置信息提交给所有服务器。服务器在访问存储设备时。不再经过虚拟存储控制器,而是直接使存储设备并发工作,同样达到了增大传输带宽的目的。而对称式架构中,虚拟存储控制设备直接位于服务器与存储设备之间,利用运行其上的存储管理软件来管理和配置所有存储设备,组成一个大型的存储池,其中的若干存储设备以一个逻辑分区的形式,被系统中所有服务器访问。虚拟存储控制设备有多个数据通路与存储设备连接,多个存储设备并发工作,所以系统总的存储设备访问效率可达到较高水平。 非对称结构控制信息和数据走不同的路径,而对称结构控制信息和数据走同一条通道。所以非对称结构比对称结构具有更好的可扩展性。非对称结构性能和可扩展性比较好,但安全性不高。对称结构中。虚拟存储控制设备可能成为瓶颈,并易出现单点故障;由于不再是标准的SAN结构,对称结构的开放性和互操作性差。 5.基于网络的虚拟存储实现方法 5.1基于互联设备的虚拟化 其虚拟存储架构可以是对称的或非对称的。在对称结构中。互联设备可能成为瓶颈。多重设备管理和负载平衡机制可以减缓瓶颈。在多重设备管理环境中,当一个设备出现故障时。较易支持故障替换,但这将产生多个SAN孤岛。因为一个设备仅控制与它所连接的存储系统。 基于互联设备的虚拟功能模块,能够在专用服务器中运行于标准操作系统之上,具有基于主机的虚拟方法的诸多优势—易使用、价格低,但也继承了基于主机的虚拟方法的一些缺陷,因为基于互联设备的虚拟方法,仍然需要运行于主机的代理软件或基于主机的适配器,任何主机的故障或不适当的主机配置,都可能导致访问到未受保护的数据。同时,在异构操作系统间的互操作性仍是一个问题。 5.2基于交换机的虚拟化 其虚拟方法是把虚拟功能模块嵌人交换机的固件或者放置附属千交换机的服务器上。由于并不要求在每台主机上都运行虚拟功能模块,该方法不存在基于设备或基于主机虚拟存储环境中可能遇到的安全性问题。同时。在异构环境中也能提供更好的互操作性。但是,交换机仍然是一个性能瓶颈。也可能成为故障敏感点。为提高可靠性,可引入备用交换机,用于数据通路上的故障替换。 5.3基于路由器的虚拟化 其虚拟方法是在路由器周件上实现虚拟存储功能。供应商通常也提供运行在主机上的附加软件来进一步增强存储管理能力。采用基于路由器的虚拟方法,带虚拟功能模块的路由器,被置于每个主机到存储网络的数据通路中,用来截取网络中任何一条从主机到存储系统的命令。相对于基于主机和大多数基于互连设备的虚拟方法,基于路由器的虚拟方法性能更好、效果更佳,具有更好的安全性。 当连接主机到存储网络的路由器出现故障时,可能导致主机中的数据不能被访问,但只有连接于故障路由器的主机才受影响,其他主机仍可通过其他路由器访问存储系统。可通过冗余路由器支持动态多路径,解决上述故障问题。由于路由器常作为协议转换的桥梁,基于路由器的虚拟方法,也可为异构操作系统和多供应商存储环境提供更好的互操作性。 6.结论 目前,海量数据需求在各个应用场合不断增加,由于存储虚拟化技术能够提供系统的可用性、可靠性并易于维护,它正在成为存储领域的核心技术。 当然我们也不能忽视虚拟技术的一些潜在的问题。首先,由于存储应用场合的复杂性和不同用户的存储需求的多样化,存储虚拟化技术必须加以丰富和完善(如数据的备份、复制、恢复、远程容灾、快照和多重镜像支持等),以提供良好的个性化存储服务。另外,存储虚拟化依然缺乏高度的标准化,不同的虚拟产品之间的兼容性还有待进一步提高,必须尽快制定业界公认的存储虚拟化技术标准,以解决操作平台、网络和存储设备等厂商及产品之间的互操作性问题,推动存储虚拟化技术的发展。 本文出自:亿恩科技【www.enkj.com】 |