テキストマッチ

ロボット型検索エンジンを利用するユーザの入力するキーワードが、ページに含まれていることが検索結果に表示されるための条件になります。この条件のことをテキストマッチと言います。
例えば、「オークション」というキーワードで検索した場合、「オークション」という文字が含まれるページが、検索結果として表示されることになります。
さて、このテキストマッチですが、キーワードがページに含まれていること以外に、検索エンジンの検索結果の表示順位を決定するための評価指標が、下記のようにあります。

キーワード出現頻度

キーワードが、ページ内でどれだけ含まれているかの割合です。
例えば、「A B C D E F G A」と文字が並んでいた場合、「A」は8文字中2文字含まれていることから、出現頻度は 2÷8=25%、他の文字は1÷8=12.5%となります。
検索エンジンは、出現頻度の高いキーワードを、そのページと関連性が強いと判定します。しかし、出現頻度の比率が極端に高いと、逆に評価を落とすと言われています。どのくらいが妥当なのかは、ページ内の全体文字数にも影響されますが、概ね5%前後とよく聞きます。しかし、あまり神経質にならないように。

キーワード強調

ページのタイトル( <title> )、本文見出し( <h1>〜<h6> )など、ある特定のHTMLタグで囲われたキーワードを、検索エンジンはそのページと関連性が強いと判断します。

キーワード位置(注目度)

ページの最初の方に記述されているキーワードを、検索エンジンはそのページと関連性が強いと判断します。論文などでは、文章の概要や結論が最初のほうに書かれていることが多いので、キーワード位置の評価もその考えに基づいているものと思われます。

キーワード近接度

利用者が検索エンジンで入力する複数のキーワードが、ページ内で近くに一緒にまとまっているほうが、検索結果として優先されます。
例えば、「阪神タイガース 選手名鑑」で検索した場合、
 阪神タイガースの投手、野手の情報などは選手名鑑で・・・
よりは、
 阪神タイガースの選手名鑑では、投手、野手の情報・・・
の方が、検索結果として優先されるということです。

おすすめ本