tkenichi の日記

毒舌皮肉系恥さらし日記

系を特徴付ける尺度

コメントが付いていたので、がんばって説明してみる。

本当はネットワークの話で説明すべきなのだけど、ネットワークの次数分布の話にすりかえます。つまり分布を特徴付ける量がスケールに無関係だということを言えればいいかな?

正規分布を特徴付けるのは平均と標準偏差である。これはスケールに依存する。つまり確率変数を2倍すると、平均も2倍になる。標準偏差は√2倍になる。だからこれはスケールフリーではない。

ベキ分布の場合は、本質的には確率分布の式の確率変数の肩に乗っている次数が分布を特徴付ける量である。p(x) ∝ x のときのγである。∝記号を使ったのは、比例定数は定義域と規格化条件から決まるもので本質的ではないからだ。

さて、このときに確率変数を2倍してみると、比例定数は変わってもガンマの値は変わらない。そういう意味でスケールフリーだといえる。

確率変数を2倍する、という操作だけでなく、上位1割を取り出すなどという操作でも、同じようなことがいえる。

例えば身長のようにほぼ正規分布に従うものについて、上位1割の人の分布を考えると(もはや正規分布ではないが)、その平均は全体の平均身長よりも大きい。

一方、所得分布のようにほぼベキ分布に従うものについては、上位1割のお金持ちの人たちの所得分布を調べても、それは再びベキ分布になるが、そのベキ指数γは変わらない。従ってスケールフリーだと言える。(例えばページが見つかりません:@niftyを見ると資産家ランキングが載っている。トラックバックしてみた。)

こんな説明でどうかな?