BigdataLyn's TECH Blog! 刀不磨要生锈,人不学习要落后 - Thinking ahead

DB2 with BLU Acceleration:快速应用指南

2016-02-21
DB2
 

摘要

在本文中,我们介绍了 DB2 with BLU Acceleration,并展示了如何开始将 BLU 技术应用于您的应用程序和数据。


详细查看 参考资料

2016/02

常见问题解答

在利用按列组织的表继续测量压缩节约和性能改进之前,需要讨论一些在此阶段中经常会出现的问题。

Q:DB2_WORKLOAD=ANALYTICS 的内部秘诀是什么?

A:该设置背后的理念是提供一种简单的方法来配置分析工作负载的数据库。通过这一设置,除了其他方面之外,新创建的表默认情况下都是按列组织的表,内部查询并行性启用,计算 SORTHEAP 和 SHEAPTHRES_SHR 等排序参数,实用程序堆 (UTIL_HEAP_SZ) 经过配置后可将数据加载到按列组织的表中,并启用工作负载管理并发阈值。如果在此设置之后创建的数据库有效,那么默认数据库页大小被设置为 32K,而默认范围大小被设置为 4 页。

问题:我有一个现有的数据库。我是否仍然可以从 DB2_WORKLOAD=ANALYTICS 提供的一键式调优中获益?

答案:是的。设置好 DB2_WORKLOAD=ANALYTICS 之后,运行 AUTOCONFIGURE 命令从所配置的设置中获取最大收益。在表空间创建期间,因为数据库级设置很有可能会有所不同,所有需要显式指定 32K 页大小和 4 页的范围大小。为了避免在每个表空间创建时指定范围大小,可以将 DFT_EXTENT_SZ 更新为 4。

问题:我听说 BLU 推荐使用 DB2_WORKLOAD=ANALYTICS,但如果将我的 SAP BW 环境的 DB2_WORKLOAD 设置为 SAP 会怎么样?

答案:为了避免对您的 SAP BW 应用程序环境产生任何影响,请继续将 DB2_WORKLOAD 设置为 SAP 并手动配置分析数据库,如 此处 所述。

问题:我如何验证哪些表是按行组织的表,哪些表是按列组织的表?

答案:查询 syscat.tables 目录视图的 TABLEORG 列来验证某个表是按行组织的表 (TABLEORG=R) 还是按列组织的表 (TABLEORG=C):

select tableorg from syscat.tables where tabname=’SALES’

问题:首字母缩略词 BLU 代表什么?

答案:BLU 不是首字母缩略词。它是一个开始流行起来的内部项目名称。已经感到满意的用户建议使用 Big Data、Lightning Fast 和 Ultra Easy。

问题:我如何递增地刷新按列组织的表中的表数据?

答案:根据表的可用性需求,您可以通过 INGEST 实用程序或 LOAD 与 INSERT 选项,向现有按列组织的表中添加新数据。INGEST 实用程序允许通过目标表上持续的 SQL 活动实现更大的并发性,这对于满足数据仓库中持续和实时数据刷新等特定需求至关重要。如果使用 IMPORT, INGEST 或 INSERT,建议在每个事务中插入大于 1000 的行来分摊日志记录和其他开销。

问题:在初始 LOAD 之后加载的数据需要压缩吗?

答案:是的, 通过 LOAD, INSERT, IMPORT 或 INGEST 操作以递增方式添加到表中的数据可使用初始 LOAD 操作创建的列级字典进行压缩。此外,BLU 还使用页级压缩来压缩可能不会在列级压缩字典中表示的新值。这个列级和页级压缩的双层方法是一种成熟的技术,可有效处理 “数据漂移(data drift)” 并避免随着时间的推移而使得压缩退化。


参考资料

参考资料



Comments