互联网服务数据库统计

频率(frequency)统计信息和分位数(quantile)统计信息

频率(frequency)统计信息和分位数(quantile)统计信息 ,如何理解??看了官网的解释也没看明白,初学者
参与7

6同行回答

marvelyumarvelyu软件开发工程师IBM
这个绝对要顶显示全部
这个绝对要顶收起
互联网服务 · 2012-02-14
浏览799
marvelyumarvelyu软件开发工程师IBM
这个绝对要顶显示全部
这个绝对要顶收起
互联网服务 · 2012-02-14
浏览816
陈辉陈辉研发工程师IBM
the second-highest data value(HIGH2KEY), second-lowest data value (LOW2KEY),这两个信息在runstats中收集的,用于优化器计算Between 谓词的依据,比如满足C1 BETWEEN KEY1 AND KEY2谓词的行数,可以用下面的公式估算。KEY2 - KEY1-------------------     ...显示全部
the second-highest data value(HIGH2KEY), second-lowest data value (LOW2KEY),这两个信息在runstats中收集的,用于优化器计算Between 谓词的依据,比如
满足C1 BETWEEN KEY1 AND KEY2谓词的行数,可以用下面的公式估算。
KEY2 - KEY1
-------------------            x CARD
HIGH2KEY - LOW2KEY

除此之外,优化器还尝试使用范围统计信息(HIGH2KEY 和 LOW2KEY)来验证父表,方法是确保子表中的值集是父表的子集。收起
软件开发 · 2012-02-10
浏览824
nanjing_2013nanjing_2013系统架构师北京卓望
请问L2KEY,H2KEY是啥意思??显示全部
请问L2KEY,H2KEY是啥意思??收起
互联网服务 · 2012-02-10
浏览806
tongjixianingtongjixianing软件开发工程师IBM
这两个是optimizer统计信息里的重要数据之一。不准确的frequency和quantile会导致optimizer错估filter factor。其实这都是统计学的概念。简单说。frequency是统计column数据出现的频率。比如C1列有100条数据,但是card是10,也就是说只有10个不同的值。其中10个值每一个值重...显示全部
这两个是optimizer统计信息里的重要数据之一。不准确的frequency和quantile会导致optimizer错估filter factor。
其实这都是统计学的概念。简单说。frequency是统计column数据出现的频率。比如C1列有100条数据,但是card是10,也就是说只有10个不同的值。其中10个值每一个值重复出现的次数会不同,比如1出现20次,2出现15次,3出现10次等。
quantile是把一个data range分成几等分,如果quantile是10,就是把L2KEY,H2KEY分成10等分,统计每个等分之前数据的分布情况。
理论上frequency和quantile取的越多,optimizer估算的FF越准。收起
互联网服务 · 2012-02-08
浏览769
wp28556259wp28556259软件架构设计师CMBC
这个讲起来比较复杂了,http://www.db2china.net/club/thread-21853-1-1.html老牛讲的还不错,可以看看显示全部
这个讲起来比较复杂了,
http://www.db2china.net/club/thread-21853-1-1.html
老牛讲的还不错,可以看看收起
银行 · 2012-02-08
浏览809

提问者

nanjing_2013
系统架构师北京卓望

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2012-02-08
  • 关注会员:1 人
  • 问题浏览:5079
  • 最近回答:2012-02-14
  • X社区推广