tkenichi の日記

毒舌皮肉系恥さらし日記

パレートの法則とロングテール(補足)

(売上の分布がベキ分布に従うという仮定の下で)80対20の法則が崩れるのは、パレート指数が変化するときだけではなくて、分布のグラフ全体が左に移動したときにもおこる。昨日と同じようにγ=1.2の時に数値実験。売上の分布が順位を x として  x^{-\gamma} に比例する場合は、

 \frac{\int_{1}^{2000} ax^{-\gamma}dx}{\int_{1}^{10000}ax^{-\gamma}dx} = \frac{1-2000^{1-\gamma}}{1-10000^{1-\gamma}} \approx 0.92848

となるのは昨日みたとおり。この分布が  (x+b)^{-\gamma} に比例する場合を考えてみる。たとえば b = 100 とすると、

 \frac{\int_{101}^{2100} ax^{-\gamma}dx}{\int_{101}^{10100}ax^{-\gamma}dx} = \frac{101^{1-\gamma}-2100^{1-\gamma}}{101^{1-\gamma}-10100^{1-\gamma}} \approx 0.75590

さらに b = 1000 とすると、

 \frac{\int_{1001}^{3000} ax^{-\gamma}dx}{\int_{1001}^{11000}ax^{-\gamma}dx} = \frac{1001^{1-\gamma}-3000^{1-\gamma}}{1001^{1-\gamma}-11000^{1-\gamma}} \approx 0.51755

となって、上位2割が占める割合は小さくなっていく。

γの値を小さくしたときの計算結果も載せておこう。
γ = 0.8 とすると
 \frac{\int_{1}^{2000} ax^{-0.8}dx}{\int_{1}^{10000}ax^{-0.8}dx} = \frac{1-2000^{0.2}}{1-10000^{0.2}} \approx 0.67294
γ = 0.6 とすると
 \frac{\int_{1}^{2000} ax^{-0.6}dx}{\int_{1}^{10000}ax^{-0.6}dx} = \frac{1-2000^{0.4}}{1-10000^{0.4}} \approx 0.51307
となって、この場合も上位2割の占める割合は小さくなっていく。

さて、どちらが起こっているのでしょう??