电脑技术学习

IBM DB2通用数据库和信息管理(1)

dn001
  简介  1970 年,IBM 圣何塞研究室的 E. F. Codd 发表了一篇开创了计算机治理信息新方法的论文。他的论文“A Relational Model of Data for Large Shared Data Banks提出了用于存储、治理和交互操作数据的新体系结构。这一新的关系模型使应用程序开发人员从必须了解被治理数据的具体信息的桎梏中解脱出来。  4 年以后,IBM 员工 Don Chamberlin和 Ray Boyce 发表了“SEQUEL: A Structured English Query Language,该论文成为了 SQL 语言标准的基础。用新的 SQL 语言编写问题变得比如何在磁盘存储和组织数据更重要。该语言可以询问和回答功能更强大的新问题。构建应用程序也比以往迅速得多。该关系数据库系统自身承担了更多数据治理的任务,从而使应用程序拥有更多的自由以专注于业务逻辑。  自 1970 年以来,IBM 已经开发出了完整的关系数据库治理系统(RDBMS)软件系列(现称为 DB2 通用数据库 (Universal Database,UDB))。另外,IBM 还用 DB2 作为“引擎构建了其它信息治理软件,用途包括数据仓库、数据分析、数据挖掘、媒体资产治理、企业内容治理和信息集成。DB2 和 IBM 信息治理(Information Management)产品组合表示一个产品组合元素,IBM 称之为中间件 - 即充当联结系统和软件应用程序“粘合剂的软件。DB2 是 IBM 五个软件品牌之一,这五个品牌是:DB2、WebSphere?、Lotus?、Tivoli? 和 Rational。本文介绍了 DB2 和 IBM 信息治理产品组合。  DB2 简史  从一开始就成为 DB2 系列扎实的技术来源的一系列研究项目有:  System R 项目使 IBM 实现了第一个关系模型。  基于成本的查询优化从 System R 时代开始就一直取得巨大成就和创新。R Star 项目将关系模型扩展至分布式系统环境。 12345678910下一页   Starburst 项目专注于扩展关系模型,使之能处理新的信息形式和新的优化策略类型。  Garlic 项目强调数据联邦,答应一起治理不同系统(而不仅仅是 DB2 系统)中的数据。  最近,Xperanto 项目已经演示了 Web 服务信息的集成和用于治理 XML 内容的又一功能强大的查询语言 - XQuery 的使用。  1980 年,最初的 System R 项目首次实现了关系技术:集成到 System/38 服务器的数据库。1982 年,SQL/DS? 产品被用于大型机操作系统 VM 和 VSE,它也是基于 System R 的。DB2(正式名称是 DATABASE 2)于 1983 年诞生于 MVS? 上。1987 年,OS/2? Extended Edition 中的数据库治理器是分布式系统上的首个关系数据库。用于新的 AS/400? 服务器的 SQL/400? 在 1988 年出现。新的 DB2 版本被用于 AIX?(1993)、HP-UX 和 Solaris(1994)、Windows?(1995)和 Linux(1999)。  DB2 的今天  如今,DB2 系列跨越了各种 UNIX?、Linux 与 Windows 平台和 IBM iSeries?(OS/400? 操作系统)和 zSeries?(OS/390?、z/OS?、z/VM 和 Linux)服务器系列。DB2 Everyplace? 支持手持设备和嵌入式 Linux 环境,并提供了与更大型系统的数据同步。为整个系列的应用程序开发和数据库治理提供了常用工具。来自所有系列成员的创新以及 2001 年收购的 Informix 数据库系列,满足了整个系列的发展需求。  如今的 DB2 技术解决了几个新领域中新兴的客户需求:  自主计算要求服务器、操作系统和中间件(包括 DB2)在无人干涉的情况下诊断和纠正问题。为数据库治理员实现数据库自我治理和自动化是最新版的 DB2 中非凡强调的内容。  基于标准的 Web 服务是作为一种新的 DB2 全力支持的应用程序处理样式出现的。 上一页12345678910下一页   网格计算,即将大规模计算资源用作实用程序或服务(包括数据库服务)的思想,利用 DB2 大量群集的可伸缩性,以高度可用的方式来支持大型数据库和同一时间内的大量用户。基于标准的 Web 服务是 DB2 所支持的网格计算的另一个要害组件。  “ 电子商务随需应变(e-business on demand)业务模型需要构建在开放标准上的操作环境,以答应进行快速的和符合成本效益的创新和重新配置。用以支持电子商务随需应变的基础架构必须是可靠的、可伸缩的且是安全的。DB2 就是这样一种基础架构。  除了强大的和创新的技术之外,DB2 还为所有规模的客户提供了很高的价值。UNIX、Linux 和 Windows 系统中的 DB2 定价被业界分析人员公认为大约是其主要竞争对手定价的一半。DBA 自动化和自我治理增强功能与低价结合,为 DB2 客户提供了卓越的价值。  本文的目的在于向您大致概述由 DB2 中的功能解决的非凡技术领域。正如在一开始,SQL 分担了应用程序开发人员肩上的大部分数据治理负担,这里所描述的各种 DB2 技术通力合作,使今天和明天的应用程序开发人员和数据库治理员能更加专注于解决业务问题。对他们来说,这意味着从治理信息技术性细节中日益解脱。  深入研究该技术  DB2 旨在为那些有需求的用户提供强大的功能。但是,人们日益重视可用性和开发的简单性。让我们研究一下那些共同使 DB2 出类拔萃的技术:  已证实的性能和可伸缩性  治理(更为简单)  您所选环境的应用程序开发和部署  已证实的性能和可伸缩性  为同时满足支持为数众多的操作系统的需要,以及高性能和高可伸缩性的需要,DB2 是用特定于每种环境的方式开发的。  在 OS/390 和 z/OS上,DB2 被开发成与操作系统和服务器硬件的增强功能合作。这一紧密集成提供了 DB2“数据共享 - 使用 IBM System/390? 和 zSeries Parallel Sysplex? 硬件体系结构的共享资源群集体系结构。一些世界上最大的数据库就构建在该环境中的 DB2 之上,正如在 Winter Corporation所进行的大型数据库定期研究中提到的那样。 上一页12345678910下一页   在 OS/400- IBM iSeries 服务器系列(原先是 AS/400)的操作系统上,DB2 被作为操作系统本身的一部分来实现,支持单服务器和多服务器的并行处理和群集。  在 UNIX、Linux 和 Windows 平台上,DB2 具有“无共享(shared-nothing)体系结构,它使公共代码库能在所有这些环境中被使用。DB2 无共享群集中的服务器在总体数据的子集和群集所接收到的 SQL 请求子集上独立和并行地进行工作。事务型(比如 TPC-C)和决策支持(比如 TPC-H)工作负载的 基准测试结果都证实了:具有这种可移植体系结构的 DB2 具有巨大的可伸缩性。  高可用性和可伸缩性的群集以及对最新处理器和互连技术的支持,都是 DB2 确保客户能够顺利发展的各个方面。DB2 故障转移和备用支持提供了如今所需的高可用性。DB2 对最新的 64 位处理器(Intel Itanium 2 和 AMD Opteron)的支持意味着:可以构建更大型的数据库,并且可以达到更快的性能。诸如 InfiniBand这样的更简单和更快速的群集和连接技术使 DB2 更轻易伸缩。对于所有规模的客户和开发人员都得以顺利发展。  治理(更为简单)  经济条件和提高底线的愿望意味着:由于受管信息的数量和种类增加,而又没有雇用额外治理员的资源,因此许多 DBA 的工作负荷正变得越来越重。  DB2 通过许多方法减轻了数据库治理的压力:  它的控制中心(Control Center)为 DBA 提供了一个中心地点,使他们通过 DB2 系统网络执行工作。  一批顾问工具提供了专业的资源监控、问题诊断和纠正措施。这方面最新的示例是 Configuration Advisor,用于在 UNIX、Linux 和 Windows 上的新安装中快速获得最高 DB2 性能。另一个示例是 Health Center,它担任许多最近的 DB2 自我治理工作的核心件。其基于规则的问题诊断和纠正措施功能增加了新的 DB2 Performance Expert和 DB2 Recovery Expert 工具(一类新出现的 IBM 数据库工具,提供了前所未有的专业指导和自动操作)。 上一页12345678910下一页   从 DB2 诞生开始,基于成本的优化和自动查询重写技术方面就一直持续发展,不断为数据库治理员卸去 DB2 性能治理方面的负担。每个 DB2 新版本的目标在于使数据库治理资源的需求越来越少。IBM 整体上对自主计算的重点关注和投资使 DB2 从中受益。  您所选环境的应用程序开发和部署  假如您是一位应用程序开发人员,则您会在开发将 DB2 用作数据库服务器的应用程序时有多种选择。DB2 团队努力使应用程序的开发变得简单。 IBM WebSphere Studio产品团队和 Microsoft Visual Studio 小组努力开发出了用于 DB2 应用程序开发的插件。最近公布的与 Borland的合作达成了这样的协议:在 Borland 开发工具(Kylix、Delphi、C++Builder)中打包 DB2 UDB,DB2 UDB 中也打包 Borland 开发工具。另外,DB2 UDB 附带了 Development Center,以用于构建应用程序的服务器端部件,如存储过程和用户定义的函数。  DB2 与 Java? 有很深的渊源。1996 末,在 DB2 中首次提供了 Java 支持。从此存储过程和用户自定义函数都可以用 Java 构建, Java 应用程序和数据库系统之间的编程接口 JDBC?也得到了充分支持。此后,DB2 Java 支持技术不断发展(包括用于 DB2 与静态 SQL 通信的 SQLJ),而且 IBM 还参与了 JOLAP(一种基于 Java 的数据分析标准)的创建。用 Java 编写的治理工具使得有可能用 DB2 进行基于 Web 的数据库治理。还有,DB2全面支持 J2EE 这种应用程序处理环境。  同时,DB2 开发人员与 Microsoft 的 Windows 和 .NET 团队紧密合作,以确保 DB2 成为该应用程序环境的强势“居民。IBM 承诺 DB2 支持 J2EE 和 .NET。DB2 对 Windows 的承诺是有力的。这一事实的证据包括 DB2 在客户可使用 Windows 2000 的第一天就支持它,以及 DB2 在 Microsoft Gold Certified Partner Program for Software Products 中的成员资格。要达到 Gold Certified 状态,要在三种 Windows 2000 服务器包上验证 DB2:Server、Advanced Server 和 Datacenter Server。另外,DB2 提供了到 Microsoft OLE DB 数据源的高速本机接口。DB2 目前正跟踪支持 Windows .NET 操作系统的使用。 上一页12345678910下一页   DB2 技术是众多解决方案的核心  对研究和开发的有力承诺意味着 DB2 是众多信息治理产品和解决方案的核心,包括的领域有:  商业智能  内容和记录治理  联邦和信息集成  商业智能  商业智能(Business Intelligence,BI)功能构建到 DB2 引擎中,而 BI 应用程序将 DB2 置于其核心。商业智能工具包括了这几个领域:数据仓库、数据分析和数据挖掘。DB2 Data Warehouse Center 提供了一个用于定义、构建和维护数据仓库的接口。 DB2 Warehouse Manager还提供了治理仓库元数据的 Information Catalog 以及用于报告和治理复杂的查询执行操作的工具。  通过两种方式可以用 DB2 进行联机分析处理(Online analytic processing,OLAP):  DB2 提供了用于 CUBE 和 ROLLUP(用于研究数据库中信息的流行的 OLAP 操作)的内置函数。DB2 还有一个库,包含了象 rolling sum and rolling average这样的统计分析函数和聚合函数。  IBM 和 Hyperion 合作创建了 DB2 OLAP Server?,这是构建在 Hyperion Essbase 分析上的完整的 OLAP 解决方案。DB2 OLAP Server 的最新版本构建在 DB2 UDB 之上,同时提供了多维数据存储和关系数据存储。混合的分析(结合了多维存储的速度和关系存储的可伸缩性)和 OLAP 三维数据中数据的自动偏差检测(数据挖掘),是最新版的 DB2 OLAP Server 中的功能。IBM 还与各类数据分析软件供给商合作,这些供给商使他们的工具能使用 DB2 数据库。  另一个和合作伙伴 ESRI 共同开发的称为 DB2 Spatial Extender的分析工具,扩展了 DB2 SQL 语言以理解某些概念,如地图上各点之间的距离或已定义区域“之内或“之外之类的关系。 上一页12345678910下一页   数据挖掘代表了商业智能功能的尖端领域。数据挖掘是发现用其他方式不能发现的数据模式的过程。基于重要属性的群集信息技术和基于以前的行为模式猜测客户行为的技术是数据挖掘的两个示例。早在 1996 年,IBM 就已经提供了 DB2 Intelligent Miner。它的算法预备并转换用于挖掘的数据、执行挖掘操作和可视化挖掘结果。2001 年,这些功能以“ 计分(Scoring)服务的形式,作为扩展功能在 DB2 中实现。计分服务使得能使用 SQL 实时地对小段数据执行数据挖掘。如今,DB2 Intelligent Miner Modeling、Visualization 和 Scoring 是 DB2 的可选特性。  DB2 UDB 的一些新特性旨在使将 DB2 用作商业智能的客户受益。 多维群集(Multi-dimensional clustering)将相关联的信息物理上存储在同一磁盘上,以进行快速检索。实例化的查询表为同时需要大量不同数据源信息的复杂查询提供了显著的更快速的性能。空数据或缺省数据的压缩技术减少了数据仓库以及其它形式的数据库的磁盘存储需求。  内容和记录治理  信息治理的未来包括治理和联合各种各样的结构化的和非结构化的信息,以解决业务问题。DB2 传统上专注于治理结构化的数据 - 即以数字和字母表示的行和列。IBM 信息治理软件产品组合的另一部分专注于治理“内容,或者说是图像和其它多媒体信息、文字处理文档和计算机生成的报告之类的非结构化信息。 Content Manager和 Enterprise Information Portal产品满足了客户对内容治理解决方案的需求。它们构建在 DB2 之上。  Content Manager 提供了对两种内容治理的支持:媒体资产治理和企业内容治理。媒体资产治理是存储和治理大量大型多媒体对象的业务。客户包括美术馆、大学音乐资料库和电视广播机构。企业内容治理是第二种内容治理,包括象扫描校验图像这样的大量较小型的对象,若是用于银行,还有象银行结单、发票和报表之类的业务。 上一页12345678910下一页   Enterprise Information Portal(EIP)在 Content Manager 和其它结构化的或非结构化的数据源上提供了编程层,目的是为了使用公共接口在所有这些源中进行访问和搜索。例如,可以检索所有关于某一特定客户的信息,而不必考虑数据类型或文档类型。EIP 还提供了 Web 搜寻、工作流治理和信息挖掘服务。  与合作伙伴 Tarian Software 进行的合作开发,以及随后对 Tarian 的并购,产生了 IBM Records Manager。该产品将电子记录保留能力和生命周期治理添加到 IBM 内容治理产品组合。  联邦和信息集成  IBM 信息治理软件理念的核心是客户需求所支持的这种信念:集成异构数据环境中的信息比在单一的大型数据库系统中集中信息来得重要,而且能更快地得到 IT 投资的利润回报。DB2 和相关的信息治理软件将这一信念体现在集成和联邦中。  DB2 支持种类繁多的访问远程信息的方法。这些方法包括 ODBC 和 JDBC、SQLJ 和 OLE DB。DB2 支持 .NET(Microsoft)和 J2EE(Java)应用程序环境。自 1995 发布 DB2 DataJoiner? 以来,IBM 提供了对非 DB2 数据库中信息(比如那些来自 Oracle、Microsoft 和 Sybase 数据库的信息)SQL 访问的优化。DB2 应用程序可以使用 DB2 SQL 查询 DB2 和非 DB2 数据库中的信息。这种联合不同关系数据库的能力从 DB2 DataJoiner 发展成称作 DB2 Relational Connect的 DB2 特性。  DB2 还提供了 数据复制技术。在整个 DB2 系列中支持基于日志的更改获取和新式的复制。DB2 DataJoiner 的异构功能和 DB2 数据复制结合意味着非 DB2 数据库也可以成为复制目标和/或源。  如今 DB2 可以治理各种各样类型的信息。构建了 DB2 Extenders? 用来治理文本、XML、图像、音频、视频和空间信息。这些 Extender 是 DB2 从纯粹的关系系统发展为对象-关系系统的结果。这些年,DB2 应用程序可用的数据源领域已经进行了扩展,包括 WebSphere MQ 消息队列和 基于标准的 Web 服务。DB2 可以治理文件系统中的数据,就好象它是存储在 DB2 表中一样,这是通过 DB2 Data Links Manager(一个可选的 DB2 特性)实现的。DB2 应用程序使用 SQL 操作 DB2 表内外的数据。 上一页12345678910下一页   XML 日益被用作一种描述、组织和交换信息的方法,这使得 DB2 中产生了各种 XML 支持增强功能。如今,在 DB2 中实现了 100 多个 SQL 语言的扩展,用以支持 XML 数据的治理。 DB2 XML Extender,于 1999 年首次提供给客户,提供了本机 XML 数据治理的基础。最新的增强功能包括对由 DB2 中数据组成的 XML 文档进行自动模式验证和使用 XSLT 进行自动样式转换。DB2 还支持 SQLX 发布功能和 XPath 表达式,并且在 2002 年初通过一个 公共原型演示了对 XQuery 的支持。DB2 正逐步成为一个真正的双语数据库,同时支持 SQL 和 XQuery。  这多种联邦和集成技术,以及新的软件封装技术,已经结合在一起成为 DiscoveryLink? - 一种用于生命科学行业的信息治理解决方案。DiscoveryLink 使生命科学应用程序可以使用 SQL 连接来自完全不同的来源的信息,这些信息是该行业所特有的(例如,染色体文件数据、毒理学电子表格、临床试验和调节文本,以及化验结果数据库)。  根据 DB2 和 SQL 语言支持的数据类型、数据源和连接方式的范围,可以证实 DB2 是唯一满足要求的信息集成引擎。将这个性能与前面提到的内容治理功能相结合,那么 IBM 能帮助客户集成信息(无论什么类型、多少数量或什么位置)的承诺范围就变得很清楚了。  多实惠啊!  和上面说明的技术功能一样重要的是 DB2 提供给客户的价格。DB2 的定价在各个级别上都对竞争者提出了挑战。为了简单明了起见,DB2 的定价很大程度上基于每个处理器模型。在高可用性设置方面,DB2 只根据在只有一个处理器的空闲备用服务器上执行不活动的 DB2 工作来定价。综合考虑价格因素与增强的自我治理功能以及丰富的功能,那么总拥有成本(TCO)优势地位就十分明显了。在几个业界分析人员的报告中记录了五年来 DB2 领先于其竞争者的 TCO 优势。 上一页12345678910下一页   稳固而广泛的伙伴关系  合作伙伴认可 DB2 的技术力量和高价值。业务应用程序合作伙伴(包括 SAP、Siebel、PeopleSoft、i2 和 J. D. Edwards) 在根据 DB2 标准化他们的应用程序时有多种方式可供选择。许多情况下,他们通过 DB2 上的应用程序促进了他们的销售业绩。因为 IBM 仅专注于提供中间件而不提供给用程序软件,所以我们的合作伙伴不会因为与 IBM 合作而受到 IBM 方面的竞争威胁。IBM 信息治理运作全面的合作伙伴计划,以吸引和留住工具、应用程序和各种各样的业务伙伴。  我们的合作伙伴还包括 IBM 服务器部门(Server Group)和其它 IBM 软件品牌(WebSphere、Tivoli、Lotus 和 Rational)。DB2 开发人员在 DB2 开发和基准测试期间与服务器组团队进行合作。WebSphere 集成了 DB2 以治理其所控制的应用程序、数据库、用户和其它资源中的信息。WebSphere Commerce Analyzer 的一个版本包括了 DB2 Intelligent Miner 技术。DB2 与 WebSphere Application Server 一起提供了对基于标准的 Web 服务的支持。Lotus 计划通过集成 DB2 来扩展 Notes? 和 Domino? 的可伸缩性。DB2 是受管于 Tivoli 的系统资源。关于 IBM 中间件和服务器产品组合中日益加强的集成有一些示例,这些集成产生了更快速的高性能电子商务应用程序部署。  结束语  从结构化的数据到非结构化的内容,从手持设备到群集服务器配置,以及从事务处理工作负载到数据挖掘,DB2 和 IBM 信息治理软件产品组合随着客户在电子商务方面的发展和成功不断支持他们。IBM 信息治理软件可以为客户预备先进技术和策略,比如 Web 服务、网格计算和电子商务随需应变。2003 年是 DB2 for MVS 方法问世 20 周年,DB2 在数据库市场中的发展充分说明了:为世界各地的 IBM 客户进行的 IBM 信息治理投资和策略取得了持续成功。 上一页12345678910