tkenichi の日記

毒舌皮肉系恥さらし日記

検索キーをつける


唐突ですが、題名だけわかっている書籍の情報を調べたいときにどうしますか?
Amazon に行きますか?それとも Google でいきなり調べますか?結果としてはかなり高い確率で Amazon の中の同じページがヒットするはず。


Amazon、kakaku.com、OPAC や CiteSeer みたいに著者名や価格、発表年などのメタデータが付加されている検索は、それで並び替えることができるのが便利なところ。
その利便さと、そのような検索キー(メタデータ)を付加するコストのバランスをうまく取っているところが成功していると思う。
e-コマースのような費用対効果の大きなところは、たとえ人力で入力することになっても意味はある。
学術論文や書籍データのようにメタデータの標準的な型が決まっている場合は、オープンなデータベースを作ればいい。CDDBみたいに。


これからメタデータの規格をつくろうとか、メタデータの自動生成のシステムを作ろうとしている場合、よぽどうまくやらないと全文検索に負けてしまうような気がする。
卑小な例で恐縮だが、個人的なメモなどを残しておく場合も、カテゴリーや項目を作って、データベース化して条件をキー(SQLとか)で検索するよりも、テキストで残しておいて、grep したほうが便利だったりする。データベース化するコストと、項目が時間の経過によって増えたり変化したりすることへの対応のコストが結構かかる。


とはいってもこういうキーで検索できたらうれしいなあ(つまりこういうメタデータが付いていてほしいなあ)と思っているものはいくつかある。

  • 動画や音声データの○分○秒にどういう情報があるか
  • 教育用、技術用文書について、読む順序が示唆されるような、対象読者のデータ

など。MPEG7やLOMに携わっている人にはすごく期待しています。