日々の記録

アニメと読書の感想をメインにしたブログです。 ☆ゆるゆるっと更新中です☆

Top Page › 読書 › コンピュータ › 情報検索アルゴリズム/北 研二ほか
2006-05-25 (Thu) 19:10

情報検索アルゴリズム/北 研二ほか

情報検索アルゴリズムGoogleなどの検索サイトやMac OSXのSpotlightなど、このところ多くの情報の中から必要な情報を探し出す技術が注目されているようです。その基礎となる情報検索が、どういった方法で実現されているのか知りたくて、この本を読んでみました。

第1章と2章は、この分野の概要がコンパクトにまとめられていました。3章から、その方法についての解説が行われていました。第4章は、線形代数の知識が必要とされましたので、前半は理解できたのですが、後半は高度な知識が要求されてちょっと読むのが辛かったです。(^^; たぶん理解できないです。(涙)

第5章と第6章が、具体的なアルゴリズムの解説になっていました。読み進むのに時間はかかりましたが、アルゴリズムの解説がPascal風の言語で示されていましたので、何とか内容についてゆくことができました。(じゃあ、実装してみろと言われると困りますけど。^^;)

内容的に一番感動したのは、6章の最初で紹介された特徴ベクトルを使った全文検索でした。前処理として、索引語を特定しておく必要があったり、フォルス・ドロップが発生するという問題点はありますが、ビット演算で検索対象文書を絞り込める手法の素晴らしさがとても印象に残りました。世の中には、なんて頭のいい人がいるんだろうと感心してしまいました。

また、最近の日本語全文検索でよく利用されているらしい、N-gramを使った検索方法も興味深かったです。日本語のように、単語の分け目が明確でない言語では確かに有効な手法だろうなあと思いました。

読むのにそれなりの根気は必要ですが、200ページ程度のコンパクトな本ですので、情報検索に興味がある方は一度手に取られてはいかがでしょうか。

最終更新日 : 2016-04-22

Comment







管理者にだけ表示を許可