本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

すでにこんなに利用されているメタデータ

Webでは文字,静止画,動画など多種多様なデータを得ることができる。しかし情報量が膨大で,ユーザ側が欲しい情報を適切に入手するのは困難である。テキストについては,Yahoo!やGoogleなどのポータルサイトや検索エンジンからキーワードを入れて探す手段がある。しかし,探している情報が検索の上位に位置するとは限らない。

メタデータを管理することで,効率的な検索が可能になることは前から言われてきた。しかし,例え文章であっても,適切なキーワードをつける作業は手間がかかるし,メタデータを入力する人の立場によってキーワードが変わる可能性もある。いずれにしても,メタデータは情報の検索や再利用の促進を図るためにデータベースの中の見えないところで利用されるもので,意識されることも少なかった。そのような中,ブログの普及をきっかけにユーザのメタデータに対する認知度が少しずつ高まっている。

ブログ・ニュースのメタデータ

日記やジャーナルサイトのウエブログ(ブログ)ソフトには自動的にRSS(RDF Site Summary)を生成する機能があり,XMLに詳しくない人でもXMLベースで容易にメタデータを蓄積することができる。RSSはページのタイトル、アドレス、見出し、要約、更新時刻などのメタデータを構造化して記述するXMLベースのフォーマットである。いまやほとんどのニュースサイトでRSSを提供している。RSSにより,ユーザ側は頻繁にチェックするサイトの更新情報を随時知ることができる。情報を発信する側は更新したことを容易にユーザに知らせることができるので安定したアクセス数を確保できる。

ただし,RSSのページ自体はブラウザで見るような見やすいページではないため,RSSリーダーをインストールして閲覧する。指定したサイトのRSS情報を取り込んで更新状況をWebページにする巡回ソフトや、デスクトップに指定したサイトの更新情報を電光掲示板のように表示するティッカーソフトなどがフリーウエアやシェアウエアで提供されている。例えば,RSSバー(http://darksky.s21.xrea.com/)は,自分のパソコンにインストールすると,ブラウザのInternetExploereのバーにRSSリーダーのボタンが追加される。RSSを見たいときはRSSバーのボタンを押すと,左側にウインドウが表示されて,タイトルを一覧できる。

専門用語のキーワード抽出

「言選Web」というサイトでは,文章の中から専門用語のキーワードを抽出するシステムを提供している。同システムは,東京大学情報基盤センター図書館電子化部門中川裕志教授および横浜国立大学環境情報研究院森辰則助教授が共同で開発した。(http://gensen.dl.itc.u-tokyo.ac.jp/)文章中では複数の単語の組み合わせで複雑な概念を表す場合が多く、内容が専門的な事項に特化すればその傾向はさらに顕著なものになる。言選Webでは文章中からキーワードを抽出する場合、単なる単語分割機能だけではなく,複合語の作成や文章中における重要度の計算などのステップを踏んで,専門用語のキーワードを抽出する。自作の文章からキーワードを抽出したり,特定のWebサイトからキーワードを抽出したい時などに便利である。言選Webにアクセスすると,URLを入れるとそのWebページからキーワードを抽出する機能や文章を全部入れてキーワードを抽出する機能を利用することができる。

今後の課題

テキスト以上に,メタデータの抽出・管理が難しいのが静止画や動画である。データの種類が多く,データ量が大きいためである。特に,動画については,タイトルや撮影時間,撮影した人などはある程度自動でメタデータを保存できても,場面についての情報は手作業が中心になる。このため,色やシーンの切り替え,ナレーション情報を元に効率的で適切なメタデータを自動抽出できるように,NHK技術研究所をはじめ各メーカーで研究が進められている。

RSSはWebで情報発信するだけでなく,ソフトを介して更新情報をプッシュする状況を実現した。適切に蓄積されたメタデータは,情報検索の精度を高める。メタデータは情報資源活用されする場を増やすために,黒子のように目立たず影で活躍する。

◆関連セミナー: メタデータによる検索,編集,配信の効率化 (2004年10月6日)
The Web KANZAKIの神崎氏,TV-Anytimeフォーラム副議長の早稲田大学教授 亀山氏,アドビシステムズ 西山氏,毎日新聞社 小野寺氏が,メタデータの最新情報を紹介。

2004/09/13 00:00:00


公益社団法人日本印刷技術協会