这两个是optimizer统计信息里的重要数据之一。不准确的frequency和quantile会导致optimizer错估filter factor。其实这都是统计学的概念。简单说。frequency是统计column数据出现的频率。比如C1列有100条数据,但是card是10,也就是说只有10个不同的值。其中10个值每一个值重...
显示全部这两个是optimizer统计信息里的重要数据之一。不准确的frequency和quantile会导致optimizer错估filter factor。
其实这都是统计学的概念。简单说。frequency是统计column数据出现的频率。比如C1列有100条数据,但是card是10,也就是说只有10个不同的值。其中10个值每一个值重复出现的次数会不同,比如1出现20次,2出现15次,3出现10次等。
quantile是把一个data range分成几等分,如果quantile是10,就是把L2KEY,H2KEY分成10等分,统计每个等分之前数据的分布情况。
理论上frequency和quantile取的越多,optimizer估算的FF越准。
收起