インターネット、WWWにおいて、自分の欲しい情報を探したいとき、通常はキーワードを入力し、テキスト検索エンジンを使っているが、自分の欲しい情報かどうかは、返ってくるURLをいちいち開いて探すしかない。富士通では、画像を手がかりに探索を効率的におこなう、マルチメディア情報検索技術の研究を進め、検索システムを開発している。
ユーザは多くの画像が配置された3次元空間上をウォークスルー、フライスルーしながら、自分が欲しいバッグを視覚的に探索し、最終的に自分が欲しいバッグにたどり着くというのが、大きな流れになっている。また、関連テキストから文書としての特徴を抽出し、テキストの特徴が似たものが近くになるように配置して、それで探すこともできる。
画像の特徴は、どういう色がどれくらい画像上に存在しているかという色のヒストグラムと、画像中の対象物の形状やテクスチャ特徴をあらわすウェーブレット変換係数という2つの画像特徴を用いている。
画像の配置は、ニューラルネットワークの競合学習と言う方法で、特徴の似た画像が近くに集まるように配置する。そして配置した空間をウォークスルーしたり、特徴によってこれを再配置して、いろいろな観点から見たり、何らかのキーワードをさらに追加して、そのキーワードにフィットしたものが前面に出てくるという検索の支援機能により、最終的にこれだと思うものをクリックすると、目的の情報が得られるという仕組みになっている。
インタラクティブに3次元空間上をウォークスルーする仕掛けは、高速にズームができるように、多重解像度の画像を持っている。実際には3段階のサムネイル化した画像を持っていて、視点からの距離に応じてうまく切り替えてインタラクティブな3次元空間上のウォークスルーを高速にできるような手法を用いている。
技術的なポイントは、一つはWebロボットによる情報収集である。二点目は類似性に基づく情報の分類配置ということで、画像なりテキストの特徴に基づいて情報を3次元空間上に似たものが近くなるように分類配置する。そして3次元空間内をウォークスルーしたり、いろいろな観点から情報を再配置することによってインタラクティブに効率的に情報を探索することができる。
また、ビジネス文書検索も可能である。PowerPointの文書等をあるフォルダにしまっておき、フォルダをクリックした時点で全ファイルの特徴を抽出し、似たようなものが近くになるように空間上にサムネイル画像を配置する。空間上をウォークスルーしながら、いちいちファイルを開かなくてもスライドの画像を閲覧することが出来、また情報の再配置により、欲しい文書をインタラクティブに効率的に探すことができる。
人物検索システムも可能である。人事管理とか、ある人物を照会するために、顔画像とその人の何らかの情報をペアで保存しておき、自分が欲しい人材を探すとか、あるいは、何らかのプロジェクトを組むときにそのメンバーとして最適な人を探していくとか、そういった適用の仕方もある。
仮に大阪に住む20代前半の女性によく売れているバッグというデータが集まったとし、その画像を配置してみると、ベージュ系のものが人気があるとか、手提げが若干長めのものが売れているなど、売れているバッグの外観上の特徴が認識できる。人間の画像認識能力を積極的に利用して知識を発見していこうというアプローチである。
また、検索機能を利用したパソコン用の画像検索ソフトが製品化されている。最近、デジカメが非常に普及しているが、それを管理閲覧するソフト、整理するためのソフトが「みよう絵」という名前で、富士通大分ソフトウエアラボラトリから製品化されている。シェアウエアとして販売しており、20日間無料で試すことができる。
また、オンラインショッピングでの商品検索では、ニフティのShopping@niftyで商品画像を一覧検索するサービスを実際に提供している。
(テキスト&グラフィックス研究会)
■出典:JAGATinfo 2002年9月号
2002/08/28 00:00:00