tkenichi の日記

毒舌皮肉系恥さらし日記

パレートの法則とロングテール

ページが見つかりません:@nifty朝日新聞デジタル:どんなコンテンツをお探しですか?ロングテールのことが記事になっている、と教えてもらった。

「80対20の法則」と「パレートの法則」とを混同しているし、それをロングテール現象の対立概念にしているところは、どうも違和感あるんだけど。もともとのパレートの法則というのは、所得分布がベキ分布に従うことを述べたものだったはず。それを他の自然現象や社会現象に拡張して使われるようになって、いつのまにかマーケティング用語になってしまったみたい。Amazon の本の売り上げもベキ分布に従っているのは(検証したわけではないけれど)たぶん正しいと思う。ロングテールと呼び出したのは、 小さい売り上げの部分を今までは切っていたのが、Amazon は在庫問題を解決することで切らなくてよくなった、ということで、ベキ分布が否定されたわけじゃない。

パレート指数(ベキ分布のべき指数)が同じであっても、少数の分布をどこから切るかで、「80対20の法則」の80や20の数字は変わってくるのであり、パレートの法則の否定とするのはどうもね。

ちょっと数値実験。γ=1.2として、売上の分布が順位を x として、P(x) \propto x^{-\gamma} なる分布P(x)に従うとしよう。累積密度関数は分布の積分だから  x^{1-\gamma} に比例することに注意しよう。計算を簡単にするため、 x \ge 1 としてさらに x は連続値をとるものとする。x の上限を 10000 とする(つまり売上10000位の本までしか在庫を置かないということ)と、上位20%の占める売上高は、(γ=1.2のとき)

 \frac{\int_{1}^{2000} ax^{-\gamma}dx}{\int_{1}^{10000}ax^{-\gamma}dx} = \frac{1-2000^{1-\gamma}}{1-10000^{1-\gamma}} \approx 0.92848

となり、上限を10000000 とすると

 \frac{\int_{1}^{2000000} ax^{-\gamma}dx}{\int_{1}^{10000000}ax^{-\gamma}dx} = \frac{1-2000000^{1-\gamma}}{1-10000000^{1-\gamma}} \approx 0.98426

となって、むしろ上位20%に占める売上高の割合は大きくなる。なので、ロングテールのおかげで、80対20の法則が崩れたのではなくて、パレート指数が変わったから、とするのが正しい気がする。上の式でγの値を小さくすると得られる値も小さくなります。だから順序としては逆で、ネット上の購買傾向としては、パレート指数が小さくなりがちであり、Amazon はそれに対応して在庫の種類を増やした(ロングテール)ので、大きな利益を上げることができた、ということだと思う。

asahi.com よりも Wikipedia パレートの法則 - Wikipediaのほうがまともなことを書いている気がするけどなあ。

計算ミスしていたら恥ずかしいな。間違っていたら指摘してください。