blogが検索上位にきてしまう不具合?

引用元サイトより引用したサイトの方が検索結果の上位に表示されてしまうのは,Googleがまだ成長途中でありGoogleにとって成長とは情報の整理であるからと俺は思う.
有用な情報が掲載されているサイトから一部を引用してエントリーを書く.数日後にGoogleで引用した部分の一部を検索すると引用元サイトより自分が書いたエントリーが上位に表示される.
さて,これはなぜだろう?一番簡単に思い浮かぶ答えは「はてなダイアリーで書いてるから」.それをもっと仕組みから言うと,はてなダイアリーキーワードリンク機能が働いてページランクが高いキーワードから多数のリンクが貼られるのでページランクがぐんぐんあがってしまうから.全体の内容としてアホアホなこと書いてても難しい言葉やそれっぽい単語を使って書けばページランクが上がってしまうわけだ.
この現象を勝手に「はてなが悪い」として,引用して日記を書くのをやめたり非公開にしてみたり書く場所を変えてみたりするのはちょっと待って欲しいなって思う.

Googleの成長と検索結果

Googleってどんな会社?」と聞かれたときに最適な答えは下記の一文であると思う.

Google の使命は、Google 独自の検索エンジンにより、世界中の情報を体系化し、アクセス可能で有益なものにすることです。

体系化という部分を整理に読み替えて,有益という部分を「ユーザにとって最適な検索結果」ととらえる.そうすると整理は各ページの内容をスキャンしてネット上にちらばったデータを情報化する作業,その情報を元に「ユーザにとって最適な検索結果」を出力するためにページランクをつけてランキングをつけたあと有益な情報は検索結果の上位に表示する.

データより情報のほうが有益である

はてなダイアリーで日記を書くという行為は,体裁の完璧に整ったテンプレート*1にそってデータを記述しポストされたエントリーは自動的に情報へと変換整理される.はてなダイアリーにおける変換整理とは正しいタグによる見出しの作成と段落の作成.同時に生成されるRSSによる情報の構造化.
それに対して手打ちやホームページビルダーなどのウェブページ作成ソフトを使って作成したサイトは,真っ白の画用紙に鉛筆や油絵や砂や色紙で自由にデータを蓄積していく,これではデータであってなかなか情報にはなれない.

中身はとにかく情報化されたデータと,中身は素晴らしいが情報になりきれないデータ.現時点でのGoogleは中身はどうあれ情報を有益と判断しているんじゃないかと思う.

時間の問題

ある画家の描いた芸術的な絵が画家の死んだ数世紀後になって評価されるように,まだ情報になれないデータを数ヶ月後か数年後かにGoogleが情報として整理した後は正しく評価され有益な情報は最適な結果としてユーザに届けられると俺は信じているよ.

フィードバック後

自動的に情報として整理されるのがブログで 情報として整理するのをGoogleにまかせてるのが画用紙サイトだと言いたいのかもしれない.

*1:入力フォームのことであってデザインテンプレートにあらず