简化 DB2 for i5/OS 索引建议

dn001 2008-05-03 13:02:39

　　理解和实现最佳 SQL 查询优化目标可以大大改善很多查询的响应时间。IBM® DB2® for i5/OS® on V5R4 提供了一种新方法，通过一些流行的动态 SQL 接口控制查询优化。本文展示如何用 CLI 实现新的性能调优增强。作为附加的优点，您将必须利用 iSeries Navigator 的性能监视器特性分析任何查询的优化目标。

　　DB2 for i5/OS on V5R4 经过改进，现包含一个 Index Advice Condenser。查询和 SQL 活动会留下一些索引建议。当考虑是否创建永久索引时，很多原始的索引建议可以看作是互补的或者可压缩的。本文解释新的 Index Advisor 压缩特性，并演示如何在 iSeries Navigator 图形界面中使用该特性，或直接用一个定制的用户查询来访问该特性。

　　DB2 for i5/OS Index Advisor

　　Index Advisor 是 DB2 for i5/OS V5R4 中引入的特性，该特性记录关于系统索引需要的统计信息。每当执行一个查询或 SQL 语句时，Index Advisor 都会记录查询优化器建议使用的一些索引，留住提高性能的机会。这方面的基础知识有助于理解这个新的 Index Advice Condenser。

　　每当建议一个索引时，就有一个新行被添加到系统索引建议表中，即模式 QSYS2 中的 SYSIXADV 表。这里是假设该索引之前还没有被建议。Index Advisor 检查以下列中的属性，以判定一个索引是否已经被优化器建议：

　　LEADING_COLUMN_KEYS　　KEY_COLUMNS_ADVISED　　TABLE_NAME　　TABLE_SCHEMA　　INDEX_TYPE　　PARTITION_NAME　　NLSS_TABLE_NAME　　NLSS_TABLE_SCHEMA　　表 3 给出了 SYSIXADV 表的完整布局。假如表中已经有匹配的建议，则更新已有的行。例如，“Number of Times Advised条目加一，“Last Advised for Query Use被更新为当前时间。

　　就原始格式而言，索引建议不一定是冗长的。虽然表中所有条目都是惟一的，但是有些条目仍然存在冗余。一个很好的例子就是，假如有相同的一些列被建议，建议的顺序有所不同，但这些键的顺序无关紧要，那么就会出现上述情况。在这种情况下，可以用这些列创建覆盖不同索引实例的一个索引。对被建议的键重新排序的时机可通过“Leading Keys Order Independent列表明。这一列中列出的键是可以被重新排序，且仍然能够满足被建议的索引的领头键。

　　被建议索引的示例　　我们来看一些索引建议的示例，以便为 condenser 的简化工作搭建背景。下面的例子假设所有建议都是基于相同表、相同分区、相同的索引类型和排序顺序的。

　　表 1. 被建议索引的示例 1　　

被建议的键	领头键，顺序无关
C1, C2, C3	C1, C2, C3
C1, C3, C2	C1

　　在这个例子中，建议的第二行不易变通。为了满足索引建议，一个永久的索引需要有顺序为 { C1, C3, C2 } 的键。但是，建议的第一行有很大的灵活性。领头键顺序无关这个细节表明，键之间可以按任意顺序排列，所以可以通过将 { C1, C2, C3 } 重新排序为 { C1, C3, C2 }，将两行建议压缩成一个永久索引。

　　假如扩展表 2 中的例子，使之包括第三行建议，那么仍然可以得出结论，附加的一个永久索引 { C1, C3, C2, C4 } 应该足以帮助优化器永久地提高这些查询的性能。

　　表 2. 被建议索引的示例 2　　

被建议的键	领头键，顺序无关
C1, C2, C3	C1, C2, C3
C1, C3, C2	C1
C1, C3, C2, C4	C1, C2, C3, C4

　　Index Advisor 与压缩的索引建议的比较

　　压缩索引建议技术要求在服务器上安装以下 V5R4M0 5722-SS1 PTF：SI25391、SI25469 和 SI25470。

　　当压缩索引建议时，原始索引建议变成概要形式。原始建议中的一些字段是特定于建议实例的，在概要形式中没有价值。为了保持压缩的建议的重要性，其它字段则很重要。表 3 逐列解释了在索引建议压缩期间原始索引建议发生的变化。跟 Index Advisor 下相比，压缩的索引建议答应进行与之相同的 iSeries Navigator 动作，只有一个例外。由于压缩的索引建议不是永久存在的，因此没有“Remove from List动作。

　　表 3. Condenser 对列的更改　　

列名	列标题	压缩动作
Table_NAME	建议索引时所基于的表	保留，不作更改
Table_SCHEMA	包含表的模式	保留，不作更改
SYSTEM_TABLE_NAME	建议索引时所基于的系统表的表名	保留，不作更改
PARTITION_NAME	索引的分区细节	保留，不作更改
KEY_COLUMNS_ADVISED	被建议索引的列名	生成
LEADING_COLUMN_KEYS	领头的、顺序无关的键，这些键在 Key_Columns_Advised 字段的开头部分，可以重新排列该字段且仍能满足被建议的索引	使用后丢弃
INDEX_TYPE	基数（默认）或编码向量索引（EVI）	保留，不作更改
LAST_ADVISED	该行的上一次更新时间	使用最新建议时间戳
TIMES_ADVISED	索引被建议的次数	通过总计生成
ESTIMATED_CREATION_TIME	估计创建索引所需的秒数	使用最大值
REASON_ADVISED	表明索引被建议的原因的原因码	丢弃
LOGICAL_PAGE_SIZE	建议用于索引的页面大小	使用最大值
MOST_EXPENSIVE_QUERY	查询的执行时间，单位为秒	使用最大值
AVERAGE_QUERY_ESTIMATE	查询的平均执行时间，单位为秒	通过求平均值生成
Table_SIZE	当索引被建议时表中的行数	使用最新建议中的值
NLSS_TABLE_NAME	用于索引的排序顺序表	保留，不作更改
NLSS_TABLE_SCHEMA	排序顺序表的库名	保留，不作更改
MTI_USED	因匹配的永久索引不存在，而使用与被建议定义相匹配的 MTI（被维护的临时索引，自主索引）的次数	丢弃
MTI_CREATED	这个特定的索引建议被用于创建 MTI 的次数	丢弃
LAST_MTI_USED	上一次因匹配的永久索引不存在而使用 MTI 的时间	丢弃

　　下面的 SQL 语句用于生成图 1a 和图 1b 中包含的原始索引建议。

　　清单 1. 用于生成索引建议的数据库和查询-- Create sample database in CONDENSE schema CALL QSYS.CREATE_SQL_SAMPLE('CONDENSE'); SET SCHEMA Condense; SELECT e.firstnme, d.deptnmae FROM department d, employee e 　　WHERE e.job = 'DESIGNER' AND YEAR(e.birthdate) > 1950 AND e.sex = 'M'; SELECT e.firstnme, d.deptnmae FROM department d, employee e 　　WHERE YEAR(e.birthdate) = 1953 AND e.job = 'DESIGNER' AND e.sex IN ('M'); SELECT e.firstnme, d.deptnmae FROM department d, employee e 　　　　ORDER BY e.job, e.sex, e.birthdate;　　图 1b 只包含图 1a 中放不下的索引建议属性。注重，‘Keys Advised’列下的键的顺序有所不同。

　　图 1a. 被建议索引输出　　简化 DB2 for i5/OS 索引建议　　图 1b. 被建议索引输出（续）　　　　在这个例子中，两个被建议索引的键顺序有足够的灵活性，答应将建议压缩成一个索引。图 2 显示了压缩的索引建议。除了为用户提供压缩列键顺序 { JOB, SEX, BIRTHDATE } 外，压缩的建议还包括帮助确定建议的重要性的上下文信息。通过“Times Advised for Query Use和“Average of Query Estimates等列可以看出永久索引能为这个环境带来多大的好处。而“Estimated Index Creation Time列用于判定是否要将创建索引作为预定的活动。

　　图 2. 压缩的索引建议

　　简化 DB2 for i5/OS 索引建议

　　iSeries Navigator 压缩器界面　　在 iSeries Navigator 中，有 Index Advisor 的地方就有压缩索引建议动作。

图 3 显示了压缩器的图形化界面，该界面可以通过右键单击一个模式对象打开。也可以从一个表对象中进行访问。

　　图 3. iSeries Navigator 压缩器界面　　简化 DB2 for i5/OS 索引建议　

　为了使用压缩器的 iSeries Navigator 界面，需要在客户机上安装最新的 V5R4M0 iSeries Access for Windows Service Pack。

　　可编程压缩器接口

　　除了 iSeries Navigator 界面以外，还可以用一条 SQL 语句以可编程方式访问索引建议压缩器。DB2 for i5/OS 在 QSYS2 模式中提供了一个新的视图 CondensedIndexAdvice。清单 2 显示了新的 CondensedIndexAdvice 视图返回的数据。由于 CondensedIndexAdvice 视图是用一个用户定义表函数（UDTF）实现的，因此该视图本身是只读的。任何修改该视图的尝试都会出现 SQL0150 错误。

　　清单 2. CondensedIndexAdvice 视图定义QSYS2.CONDENSEDINDEXADVICE ( 　　 TABLE_NAME　　　　　　　FOR COLUMN TABNAME　　　VARCHAR(258) CCSID 37 NOT NULL , TABLE_SCHEMA　　　　　　FOR COLUMN TABSCHEMA　　CHAR(10) CCSID 37 NOT NULL , SYSTEM_TABLE_NAME　　　 FOR COLUMN SYS_TNAME　　CHAR(10) CCSID 37 NOT NULL , PARTITION_NAME　　　　　FOR COLUMN TABPART　　　VARCHAR(128) CCSID 37 DEFAULT NULL , KEY_COLUMNS_ADVISED　　 FOR COLUMN KEYSADV　　　VARCHAR(16000) CCSID 37 DEFAULT NULL , INDEX_TYPE　　　　　　　　　　　　　　　　　　　CHAR(14) CCSID 37 DEFAULT NULL , LAST_ADVISED　　　　　　FOR COLUMN LASTADV　　　TIMESTAMP DEFAULT NULL , TIMES_ADVISED　　　　　 FOR COLUMN TIMESADV　　 BIGINT DEFAULT NULL , ESTIMATED_CREATION_TIME FOR COLUMN ESTTIME　　　INTEGER DEFAULT NULL , LOGICAL_PAGE_SIZE　　　 FOR COLUMN "PAGESIZE"　 INTEGER DEFAULT NULL , MOST_EXPENSIVE_QUERY　　FOR COLUMN QUERYCOST　　INTEGER DEFAULT NULL , AVERAGE_QUERY_ESTIMATE　FOR COLUMN QUERYEST　　 INTEGER DEFAULT NULL , TABLE_SIZE　　　　　　　　　　　　　　　　　　　BIGINT DEFAULT NULL , NLSS_TABLE_NAME　　　　 FOR COLUMN NLSSNAME　　 CHAR(10) CCSID 37 DEFAULT NULL , NLSS_TABLE_SCHEMA　　　 FOR COLUMN NLSSSCHEMA　 CHAR(10) CCSID 37 DEFAULT NULL )

　　通过下面的 SELECT 语句可以看到，编写 SQL 语句来访问压缩的建议很简单。如前所述，压缩的索引建议分析可以在表级进行，也可以在模式级进行。

　　清单 3. CondensedIndexAdvice 查询示例-- Condensed index advice for an entire schema, named CONDENSE SELECT * FROM QSYS2.CONDENSEDINDEXADVICE WHERE table_schema = 'CONDENSE' ; -- Condensed index advice for a specific table, named EMPLOYEE in CONDENSE schema SELECT * FROM QSYS2.CONDENSEDINDEXADVICE 　　　 WHERE table_name = 'EMPLOYEE'　AND table_schema = 'CONDENSE'; -- Condensed index advice for a range of schemas, where the average -- query estimate driving the index advice is greater than 10 seconds SELECT * FROM QSYS2.CONDENSEDINDEXADVICE 　 WHERE table_schema LIKE 'Q%' AND average_query_estimate > 10 ;

　　新的 CondensedIndexAdvice 视图使用的 Condense_Advice UDTF 还可以直接通过用户查询来访问。下面是这个表函数的定义，另外还有一个简单的例子，用于演示如何使用该 UDTF。

　　清单 4. Condense_Advice UDTFCREATE FUNCTION QSYS2.Condense_Advice(TABLE_SCHEMA VARCHAR(128), 　　　　　　　　　　　　　　　　　　　TABLE_NAME VARCHAR(128) ) 　RETURNS TABLE(TABLE_PARTITION VARCHAR(128), KEY_COLUMNS_ADVISED VARCHAR(16000), 　　　　　　　　INDEX_TYPE CHAR(14), LAST_ADVISED TIMESTAMP, TIMES_ADVISED BIGINT, 　　　　　　　　ESTIMATED_CREATION_TIME INTEGER, LOGICAL_PAGE_SIZE INTEGER, 　　　　　　　　MOST_EXPENSIVE_QUERY INTEGER, AVERAGE_QUERY_ESTIMATE INTEGER, 　　　　　　　　TABLE_SIZE BIGINT, NLSS_TABLE_NAME CHAR(10),NLSS_TABLE_SCHEMA CHAR(10)) 　LANGUAGE C 　NOT DETERMINISTIC 　READS SQL DATA 　CALLED ON NULL INPUT 　SCRATCHPAD 325064 　DISALLOW PARALLEL 　　　FINAL CALL 　CARDINALITY 1 　EXTERNAL NAME 'QSYS/QDBSSUDF2(CONDENSE_ADVICE)' 　PARAMETER STYLE DB2SQL;　 -- Query the condenser UDTF directly, providing selection criteria and ordering -- the results of the 15 most important condensed entries 　　 SELECT * FROM TABLE(QSYS2.CONDENSE_ADVICE('CRPDTA','B123456')) AS a 　　　 WHERE a.table_size >(1024*1024) AND MONTH(last_advised)= MONTH(CURRENT TIMESTAMP) 　　 ORDER BY average_query_estimate DESC 　　 FETCH FIRST 15 ROWS ONLY ;

　　结束语

　　不管是使用压缩索引建议还是原始索引建议，都是改善索引策略的一个有效的办法。在根据建议采取行动之前，需要考虑的重要的一点是查看已有的索引和它们的使用情况。由于任何索引都隐含着维护成本，因此任何性能调优活动的共同之处就是限制永久索引的数量。本文的主旨是，查看压缩的索引建议，以发现改善性能的机遇，并且在作出任何更改之前和之后，查看索引的使用情况。