gooが創造する新しい検索技術

NTTレゾナント株式会社 ポータル事業本部 メディア事業部担当部長 小澤 英昭 氏

実際のポータルサイトが使っている検索で,どんな新しいサービスを目指しているのか。NTTレゾナント(7月よりNTTコミュニケーションズに移行)のgooを例に紹介したい。

日本の検索サービスgoo

gooは,国産のインターネット検索エンジンである。NTT研究所の日本語解析技術や,ランキングするためのTFIといった技術を盛り込んだ。gooは日本語にこだわり,日本人のために,日本語で便利な検索サービスを作っていきたいと考えている。例えば,gooは日本語特有の表記のゆれ問題に対応している。表記のゆれとは,送りがなが付いたり付かなかったりする言葉である。引越,引っ越し,引越し。それぞれを単に文字列として検索すると,検索結果が違ってくる。
また,NTTは元電電公社で,非常に公共性が高い会社である。小さい子供でも使えるようなコンテンツとして,キッズgooもあるし,アダルト情報は検索結果からきちんと排除している。
gooのWeb検索で企業検索すると通常の検索結果に加え,画面右側に企業情報やニュースリリース,ニュース記事など,別のデータベースからの検索結果を,枠を分けて表示する。Web検索と連動して個別ニーズに合わせた分類別の検索。日常生活の役に立つ検索サービスを,gooでは行動支援メディアと呼び,すでに複数の検索サービスを実験,商用化している。
キーワードアシストというサービスがある。普通の検索ではキーワードを1つか2つしか入れないし,いっぱい入れると検索結果が出てこない。そこで,あらかじめ別の絞り込みキーワード候補を検索者に知らせる仕組みだ。検索者が情報を自分で探すのではなく,検索サービス側でできるだけ分類・整理して提供するのが,次のステップの検索と考えている。

情報を探しやすい検索とは

ブログ検索では,約4,000万件のブログ情報を毎日集めて,これを検索するサービスを提供している。gooラボでは,現在,BlogRangerという,ブログから評判や,良い書き手の情報を自動分類するサービス実験を行っている。例えば,「宇宙遊泳」と入れて,「感想で選ぶ」を選択する。面白い,好き,すごいなどの言葉がブログに含まれており,その多さによって順番付けを行う。世の中の人は宇宙遊泳を面白いと思っていることが,そこから何となくわかる。このように,多くの人がある1つの話題について書いていれば,その中から単語を拾って解析していくと,皆の意見が大体同じところに収束するのではないか。
また,「ブロガーで選ぶ」を選択すると,信頼がありそうな人の情報を抜き出すこともできる。ブログのトラックバック,感想,誰が書いたかという情報を利用して,そのコミュニティで誰の発言が信頼されているかを判定するアルゴリズムを作っている。
実験的な部分もあるが,gooの画像・動画検索では,例えばある製品画像を選ぶと,類似画像・動画を集めてくる。動画の場合は,内容が少しでもわかるように全編から4画像を抽出し,4コマ漫画風に紹介する。

キーワードから離れた検索

単純なキーワードマッチでない検索の開発を行っている。すべてを言語化して探す必要はないだろうと考えているからだ。キーワード以外の,目的に合った入出力のインタフェースを提供したい。地図からの入力,音声入力検索,将来的には情報家電での検索サービスを作っていけないかと考えている。
地図を使った検索では,Webその他の情報源から自動的に住所を抽出してきて,緯度経度を付与する仕組みを取り入れている。これで緯度経度付きの構造化データベースを作る。地図上から緯度経度で検索すると,例えば地図内のホテル情報などが表示可能だ。さらに,位置に関連付けた情報が検索できる。グルメ,宿泊,美容院などのジャンル別検索,駅からの道案内と組み合わせることもできる。自分が行きたい,欲しい情報をWebから切り出して,それを地図上にマッピングすることでさまざまな比較ができるサービスを提供していこうというのが,gooの基本的な考え方だ。
もう少し発展させたのが,ブログの情報を地図上にマッピングしていく実験である。ブログに書き込む際に,簡単なタグの情報を入れてもらうと,自動的に地図上にマッピングされる。こうすることで,幅広い利用者から,広く浅く構造化された情報を収集していける検索サービスを作りたい。
あるブログに,特派員と呼んでいる人たちが書き込みをする。インターネットから情報を集めるgooのロボット(クローラ)が,その中からタグの情報を抽出して解析し,同時に緯度経度を付与する。これをインデックス化すると,自動的にマッピングされたブログが地図上に出てくる。そこから特派員のブログに返っていくような循環ができてくる。特派員には,gooのブログにコメントでタグの使用をお願いしている。ただし,たくさんだと入れてくれないので,タグは3つにしている。
nameは店舗名などの情報。Addressは住所以外にも,goo地図でその地点の緯度経度がわかる仕組みなので,その緯度経度でも構わない。あとはkeywordをいくつか入れてもらう。ここも構造化したいが,ややこしくなるので,とりあえず単語だけ入れてもらっている。このようにして,goo地図に,「どこで食事をしたらどうだった」という情報が,地図上にマッピングされていく。地図を動かせば周辺のものが探せる。クローラが巡回して,新情報を見つけ次第順次インデックス化していく。現時点では情報品質を確保するため,決まった人に入れてもらっているが,段階的に広く公開していく予定だ。

Vertical Search

インタフェースの幅を広げようということで,PC以外のデバイスへの対応がある。NTTグループにはドコモもあり,携帯は非常に大きなツールの1つだ。
入力のバリエーションとしては,現在,音で検索するサービスを提供している。例えばテレビでCMソングが流れているが,これは誰の何という歌か知りたい。そんなとき,携帯電話を歌の流れている方向にかざして20秒ほど録音すると,自動的に解析して曲名がわかるといったサービスである。やり方としては,別に難しいことではない。gooのセンターに電話をかけてもらい,録音された音をNTT研究所の検査技術を使って音楽データベースと照合する仕組みである。
ローカル系の情報はPCと携帯,両方で使えないと意味がない。そこで,無料で路線検索する仕組みと,携帯用の地図やレストランの検索などを組み合わせたサービスも提供している。さらに,gooラボでは携帯電話で通話して検索する実験を行っている。これは,携帯のgoo路線で路線検索するときに,「電話発信」で音声認識装置に電話をかけてもらい,駅名を言うと,データベースで照合して,出発地と到着地が入るというサービスだ。よほどひどいノイズがなければ,90%以上認識されている。駅名が全国で約1万件しかないことも,認識精度が高い理由の1つだ。今後は普通の検索サービスも使えればと思う。
次のステップは,Vertical Search。Webからできるだけ構造化可能な情報を抜き出して,比較できるサービスや,タグとかフォークソノミーのような形で,ユーザが上げている情報を利用した検索サービスによって,より生活に密着した情報が探せると考えている。他社も同様の取り組みを進めているが,この分野では日本国内で一歩先を行くようになりたい。その先は,概念的にはユビキタスな検索サービスや自然な検索サービスを追求していくだろう。この2つも,相互に連携していくものだ。
映画「2001年宇宙の旅」では,博士が一生懸命コンピュータを賢くしていくが,それが狂ってしまう。しかし,今後は必ずしも,ロボットとかコンピュータにいちいち人間が教える必要はないかも知れない。情報がすべてインターネットの中にあるとすれば,ロボットを教育するより,インターネットから必要な情報を上手に探せるようにすればいい。人工知能に知識を全部積むのではなく,皆が持っている知識を全部出してもらう。それを上手にフィルタリングしてロボットが検索する。そんな時代も作れるのではないか。そのときには当然,音声認識でしゃべって答えが出てこなければ役に立たない。そんなことも含めて,検索は進化していけるだろうと考えている。

PAGE2006 C2「検索技術が創造する新たなコンテンツ」より(文責編集)

会報「VEHICLE」2006年5月号 Vol.18 No.2通巻206号
(C)Japan Association of Graphic Arts Technology