自殺の手段による県別デンドログラム
厚生労働省のサイトに平成15年の手段別自殺死亡数構成割合
手段別自殺死亡数割合
というのがあると教えてもらって、これを見て県の特徴が出ているのではないかという話になったので、男性の手段の構成割合について相関係数によるデンドログラムを作ってみた*1。計算自体は統計の簡単な演習問題。クラスター化後の再計算には Ward 法を使っています。等幅フォントで見てください。テキストで無理やり書いているので、樹形図の枝別れの位置についてはいい加減です。html や tex 記法でうまく表現できればいいんだけど。
北海道--+ 福岡 --+--------+ 愛媛 -----------+--+ 石川 --------+-----+--+ 静岡 --------+ | 岐阜 -----+-----------+--------------+ 三重 --+--+ | 広島 --+ | 千葉 --------------+-----------------+-----+ 和歌山--------------+ | 青森 -----------+ | 福井 -----------+-----------------+ | 長野 -----+-----------------------+--+ | 大分 -----+ | | 秋田 --+ | | 山形 --+--------+ | | 岡山 -----------+--+-----------------+--+--+--+ 奈良 --------------+ | | 茨城 -----+ | | 佐賀 -----+--------------+ | | 高知 --------------------+-----+ | | 山梨 --------------------------+ | | 鳥取 -----------------------------+-----+ | 熊本 -----------------------------+ | 埼玉 -----------------+ | 香川 -----------------+-----+ | 京都 -----------------------+--+ | 愛知 --------------------+-----+--------+ | 兵庫 --------------------+ | | 滋賀 -----------------------------------+--+--+--+ 新潟 -----------+ | | 長崎 -----------+-----+ | | 山口 -----------------+-----+ | | 徳島 -----------------------+--+ | | 富山 --------+ | | | 島根 --------+--------+--------+--+--------+ | 沖縄 -----------------+ | | 宮崎 -----+-----------------------+ | 鹿児島-----+ | 岩手 -----------------+ | 宮城 -----------------+-----------------+--------+--+ 福島 --------------------------------+--+ | 栃木 -----+--------------------------+ | 群馬 -----+ | 東京 --------------------------------+--------------+ 神奈川-----------------+--------------+ 大阪 -----------------+
似た傾向にある都道府県はどこだろう?というのが、話の発端。というわけでクラスターを見てみよう。東京、神奈川、大阪が一つのクラスターになっているがこれらは大都市というカテゴリーとみなしていいだろう。京都、愛知、兵庫、埼玉も一つのクラスターになっているので、大都市の次に位置する規模の都市群としてカテゴライズできそう。岩手、宮城、福島、栃木、群馬という東北から北関東の県も一つのクラスターになっている。千葉と和歌山は、大都市に隣接していながら、県内に都市部と過疎部の両方を抱えている太平洋に面した県という共通点が。最後まで他の県とクラスタ化されなかったのは滋賀県。人口動態的にも自然環境的にもユニークなのかな?
当たり前だけど、元のデータに県の間にそれほど差はないので、2つの県の間の相関係数はほとんどが0.95以上。だからこういう分析の信用度はというと疑問なんだけど、その割には意外と傾向が見えたような気がする。
*1:不謹慎なんて言わないでね