寻找数据存储之根本

dn001 2009-09-01 10:57:02 531 0

架构中的基本概念

近线和离线存储

所谓分级存储，就是根据数据不同的重要性、访问频次等指标分别存储在不同性能的存储设备上，采取不同的存储方式。这样一方面可大大减少非重要性数据在一级本地磁盘所占用的空间，还可加快整个系统的存储性能。在这里就涉及到几种不同性能的存储设备和不同的存储形式了。

目前常用于数据存储的存储设备主要有磁盘（包括磁盘阵列）、磁带（包括磁带机和磁带库）和光盘（包括一切CD-R、CD-RW、DVD-R、DVD-RW等光盘塔和光盘库设备）。从性能上来说，磁盘当然是最好的，光盘次之，最差的是磁带。而从价格上来说，单位容量成本上升磁盘最贵、光盘次之，磁带最低。这就为我们不同的应用追求最佳性价比提供了条件，因为这些不同的存储媒介可应用于不同的存储方式中。这不同的存储形式包括在线存储（OnStore）、近线存储（NearStore）和离线存储（OffStore）。

在分级数据存储结构中，磁带库等成本较低的存储资源用来存放访问频率较低的信息，而磁盘或磁盘阵列等成本高、速度快的设备，用来存储经常访问的重要信息。数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到存储层次中较低的层次，释放出较高成本的存储空间给更频繁访问的数据，可以获得更好的总体性价比。

今天企业的数据中心非常复杂，数据保护是其关键。但是，并非所有的数据都具有同样的价值，也并非所有的企业都具有同样的需求。的确如此，通常认为企业中的关键和非关键数据量也符合“二八原则，就是只有20%的关键数据，而80%都是非关键的。系统中60%至80%的数据经常在一个月，甚至一年中都不会被访问。而在经常访问的数据中，重要性差别也十分突出，有的数据与用户的业务联系紧密，可靠性、可用性及性能要求都很高，有的尽管经常使用但是与业务联系不是特别紧密。一般来说，重用数据的概率自数据创建3天之后就会下降50%，当数据创建30天后，重用的概率通常会降至很低，而高达90%的数据超过90天后就不会或很少被读取。为了提供良好的数据保护，IT部门通常都保留巨大的空余空间，用以防止出现容量不足的现象。

IT企业总是要面对增长起来无休无止的数据量。各种应用都在创建越来越大的文件，用户也很少删除数据和存档，这就导致要访问旧一些的文件已经变得非常困难。之所以要采取分组存储，是因为它既能最大限度地满足用户随时访问所有需要经常使用的数据，又可使存储成本最小化。综合起来，可以得出分级存储的优点主要体现在以下两个方面：

1.减少总体存储成本

在传统的在线存储中，所有数据都存储在一线磁盘存储设备上，而由于绝大多数数据的访问率并不高，占住了大量宝贵的磁盘空间，在一定程度上是一种浪费。如果把这些数据转移到存储性能稍低的磁盘（如IDE或SATA接口磁盘）或光盘存储设备上，存储成本可得以大幅降低。

2.提高整体系统性能

由于绝大部分数据转移到下级存储设备上，那需要时刻保持在线的数据就少了，系统资源的占用也就少了许多，整体系统性能自然也就提高了。如果采用了离线存储方式对很少使用的数据保存在像磁带这样的离线存储媒体上时，则不仅可提高系统性能，还可确保数据的安全性。

iSCSI技术

随着TCP/IP在上的发展，TCP/IP已经成为了事实上的网络协议标准，现有的架构、标准、协议如果结合FC-SAN，是否能够减低SAN系统成本呢？厂商推出了IP-SAN和ISCSI，IP-SAN主要解决的是SAN的管理问题，ISCSI解决是SAN的成本问题。ISCSI的出现，标志着低价化SAN方案的问世，一圆中小企业也能够建置SAN的梦想。

自2003年SNIA（存储网络产业协会；The Storage Networking Industry Associate）通过ISCSI协议后，厂商有了统一的IP-SAN方案，另外2003年微软宣布了在 2003中提供ISCSI支持，ISCSI在此之后获得了很大发展。ISCSI理论上可以用在DAS、NAS、SAN各种存储方案上面，不过目前主流还是在SAN上的应用。

所谓ISCSI就是通过IP协议将SCSI区块数据转换成网络封包的一种传输标准，它和NAS一样透过IP网络来传输数据，但在数据存取方式上，则采用与NAS不同的，而与FC-SAN相同的Block Protocol协议。IP协议使得ISCSI可以使用普通交换机，而不必使用昂贵的光纤交换机，而且懂得IP协议的人很多，比起光纤SAN的人员培训要省不少费用；使用IP协议的另外一个好处是如果随着以太网的速度进一步提升，ISCSI的网络传输速度也会提升，采用10G以太网协议的ISCSI甚至会超过下一代光纤FC-SAN的4G标准；另一方面采用了与FC-SAN相同的Block Protocol协议，虽然无法与FC-SAN想比，不过在存储速度超过使用文件协议的NAS不少。