电脑技术学习

Sybase数据仓库落户加拿大统计局

dn001

  加拿大统计局(Statistics Canada)是加拿大的一个联邦政府机构,它负责人口普查和计算,每隔五年,它都要对加拿大的两千七百万人口进行普查,并将结果提供给政府部门、研究所和商业组织。发布的普查信息的准确性和及时性在许多方面影响着加拿大人的生活。 联邦政府基于普查信息对选区的划分进行确定和调整,联邦基金的分配也是以此为基础进行的。私营企业和政府部门使用这些统计信息来确定未来的运作方向。

  在普查年中,大约有4万名调查人员分布到三千八百万平方英里的国土上去收集数据,再将数据集中到渥太华的总部,输入到计算机中。普查运作组对数据的编辑和发布的整个过程进行监督。最终生成的报告给政府带来的不仅是信息,还有数以百万美元计的收入,因为政府将信息出售给全国范围内的各种各样的客户。

  基于已有的系统的工作

  在七十年代初,Statistics Canada开发了适用于IBM MVS主机的处于业界领先地位的DBMS,用来进行原始数据的收集和输入。如今,尽管该系统仍然用于普查操作的前端,但是面对不断增长的需求,它已经显得越来越力不从心了。正如Ray Lackey(普查运作组的系统和数据库项目经理和关系数据库专家)所说:“尽管旧的软件不错,而且坚固,但是它太不灵活,管理起来也太费时间。它锁定一个面向批处理的、单用户的系统,当然就不可能有GUI和其它的工具。

  创建一个适宜的解决方案

  Statistics Canada邀请Sybase来帮助它实现这样的目标。Lackey说:“我们的RFI需要一个在UNIX环境下运行的数据库系统,它必须能够处理大型数据库,并满足多用户的需求。我们尝试了许多不同的系统(包括所有主要的竞争者),Sybase赢得了最终的胜利。

  普查运作组在Windows环境下使用Smalltalk书写他们自己的桌面界面。它作为大型的、使用两个Sybase SQL Server 10数据库的跨表际的生成器在SGI Challenge 150s硬件上运行。前端是元数据服务器,对企业的数据进行描述,有了它,用户就能够直接在屏幕上构造他们的查询请求了。它产生一个数据库查询的C代码库,针对每一个集成的包有特定的代码,并将他们以批处理的形式发送给运行在SGI Challenge XL多处理器上的第三个SQL服务器,它能够对原始的普查数据进行访问。聚集计算的功能存储在聚集引擎中,产生的报表可以以不同的形式进行发送,如CD-ROM、磁带、磁盘,根据客户的需要而定。

  该系统的核心是Electronic Warehouse,它存储以前创建的表和报表,允许用户浏览以前的查询结果,而不是每一次重新创建查询。该工具现在变得非常流行,如果用户能够找到一个已经存在的表,恰好能够满足客户的需求,那么开发时间就可以大大缩短。Lackey估计随着新的表的创建和存储,数据仓库的规模可能很快就会变成现在的三倍。

  正在普查中心进行测试的一个新的开发项目使得Lackey尤其感到兴奋。他说:“渥太华的Sybase公司为将Statistics Canada作为Sybase IQ测试过程中的一个部分提供了很大的帮助。他们安排培训,为我们提供软件,并在整个过程中对我们提供支持。 Sybase IQ承诺将查询性能提高十倍或更多,而不需要添加任何硬件设备。Lackey解释说:“对于关系查询来讲,SQL Server是非常理想的,但是对于特别的分析处理来讲则不然。在1996年的普查中,Sybase IQ将以并行方式在复杂查询工作中发挥作用。最后,Lackey预计,在原始数据的层次上引进Sybase IQ,将大大提高分析的广泛性和综合性,并能获得更高的访问速度。

  建立一个智能化的后台办公系统

  为了使比赛组织者能更有效的进行工作,开发了一个称为SCORE!的后台办公系统,它使CFO可以管理赛事各个方面。除了全日工作人员外,还有1万2千名志愿者,单是人事管理就有很大的工作量。