検索技術が向かう未来〜システム+人間でつくる検索システム

情報過多なウェブの世界で

インターネットが本格的に世界に普及し始めてから十数年。全世界で秒単位でアップロードされるウェブページの総量は現在100億ページとも言われている。この情報の海から自分にとって本当に必要な情報を一発で探し出すことは不可能に近い。これを助ける手段としてGoogleYahoo!と言った検索エンジンはネットの世界で中心的な位置を占める基幹技術となった。初期の検索エンジンは知りたいこととまったく見当違いのページが永遠と表示されることも珍しくなかったが、最近ではページランクといったGoogleの代表的な検索最適化技術をはじめ、さまざまな技術的進歩によってだいぶその精度は向上してきた。人間の手を介さない極端な技術信仰は、Googleの信頼性や公正性のひとつの所以となっている。
しかし技術によって構築されたシステムは技術によってコントロールすることも出来るということも忘れてはならない。SEO(検索技術最適化)と呼ばれる技術がそうである。SEO対策を専門とする業者は数多い。
以前NHKスペシャルGoogle特集で、「Google検索のトップ10に表示されなければ、そのサイトは世の中で存在していないと同じだ。」と声高に叫んでいたSEO業者の言葉が印象深い。
今、企業にとって自社の製品情報がいかに検索の上位に引っかかるかはマーケティングの至上命題である。多くの企業が必死になってSEO対策を行った結果、「調べた人が本当に必要としている情報」よりも、よりコストをかけた「企業が提供したい情報」が検索上位に掲載されることが多くなっているのではないだろうか。

技術の基に立つ「平等」の盲点

人間の手が介入しない技術ベースの検索システムが、その公正性の根拠となっていることは上記で述べたが、ここにひとつの盲点がある。例えば、あなたが今一番信頼できるメディアと言ったらなんと答えるであろうか?おそらくは「新聞」や「百科事典」などだろう。ネット世代の中には「Wikipedia」や「はてなキーワード」と言ったようなCGMメディアを思う浮かべる人もいるかもしれないが、一般的にはまだまだ既存メディアの信頼性は強い。例えば昨今「あるある大辞典」の捏造問題が盛んに取り沙汰されているが、これがもしネットの掲載情報だとしたら、これほどの騒ぎに発展したとは考えにくい。
これらの信頼されているメディアとは、すべて「人の手が介入した情報」である。情報のソースを明らかにし、しっかりと裏取りをした上で編集され、校正が入った上で発信される既存メディアは、しばしばそのバイアスの存在が問題となるものの、情報の質の面で言えばネット上のそれを上回っている。
それに比べすべての情報が一定のルールに沿って平等に評価されるGoogleの検索システムでは、「情報の信憑性」や「情報の質」というのは判断できない。只々、システムがオートマティックに並び変えるのみである。その徹底した技術志向こそがGoogleの公正性と信頼性を担保しているのだが、一方でそれが人間の使い勝手に障害となっている部分もある。

人間+システムの融合−国産検索エンジン「想」

とはいえ、機械による検索システムなしに、知りたい情報を見つけ出すこともまた不可能である。そこで信頼性の高い情報、つまり「書籍」や「百科事典」などの情報に限ったデータベースを構築し、その上で検索エンジンによって最適な情報を抽出するという試みがなされている。
国産の検索エンジン「想−IMAGINE Book Serch」では、「新書マップ・テーマ」「Webcat Plus」「goo Wikipedia記事検索」などの複数のデータベースから、1つの文書や長文を検索キーとし、文書・文章内に現れる複数の単語の関連性(連想)を分析することで、その文書・文章と関連性の高いものを検索できる。
ここでは、人の手が入った信頼性の高い情報(文献、記事、百科事典)をベースに、人の手のはいらない技術的な抽出(全文検索エンジンGETA」)を組み合わせることにより、GoogleYahoo!とは大きく異なった検索結果を表示してくれる。
(図:『想』で「ITのトレンド」と検索したときの表示結果)

「隠れた極上B級グルメ」を探すか、「ミシュランレストランガイド」を見るか

信頼性の高いデータベースから情報を探す場合、一発で有益な情報が表示される可能性は高い。しかしこの結果はネット上にアップされている95%以上の情報を切り捨てることによって得られた結果とも言える。つまり、その切り捨てられた情報の中には、調べた本人によっては重要な情報が紛れ込んでいる可能性だって十分あり得るわけだ。
これは旅先でおいしいお店を探しているときに、ミシュランレストランガイドから三ツ星を選べばほぼ間違いなくご馳走にありつけるが、その代わり地元の安くてうまいB級グルメを堪能する機会はなくなるのと似ている。
どちらが好みかは個人個人違うが、何か調べたいことがあるときは両方使ってみて損はないと思う。