本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

高度な情報検索を実現するメタデータ

ブロードバンドの普及や蓄積メディアの大容量化などにより,大容量のデジタルコンテンツが流通する環境が整いつつある。しかし,ビジネス展開する場合,情報を単に蓄積するだけではなく,利用者が膨大な情報の中から欲しいものを効率良く探し出すようなデータ管理をする仕組みの整備が必要となっている。これを解決する一つの手段が,しばしば「データに関するデータ」とも定義されることがあるメタデータである。

***

メタデータとは何か

メタデータとは,情報資源を効率良く探し出すために,その情報資源に対して付与される情報資源の場所,簡単な内容,権利条件などの記述を含むデータである。
情報提供のメディアとして大きな役割を果たしているWWWは,人が閲覧することを前提に制作されているため,コンピュータによる自動処理にはあまり向かない。WWWを検索をする場合は,インターネットのサーチエンジンにおけるキーワードマッチングが利用されるが,必要な情報にたどり着く手段としては効率が悪い。

そこで,コンピュータが処理しやすいような規則に基づいて各コンテンツに付けられた説明文がメタデータである。例えば,テレビ番組の場合,番組のタイトルや制作日,番組の編成情報,プログラムガイド,著作権保護に関する情報などがメタデータに含まれる。

メタデータシステムとして早くから取り組まれてものに,図書館の分野から発展してきたDublin Coreがある。電子書籍や電子ジャーナルの分野では,DOI(Digital Object Identifier;デジタルオブジェクト識別子),W3Cでは子供に見せたくないページのレーティングを行うPICS(Platform for Internet Content Selection)などが検討されてきた。また,マルチメディア関連では,圧縮技術として標準化が進められてきたMPEGが,MPEG-7やMPEG-21では権利管理情報のメタデータまで含めた規格に発展している。

デジタルコンテンツにおけるメタデータ

DOIは,デジタルコンテンツの電子商取引を促進し,著作権管理システムを実現するために,CNRI(Corporation for National Research Initiatives)の協力で,AAP(Association of American Publishers;アメリカ出版協会)により考案された。デジタルコンテンツの生産者が,情報仲介業者を経由せず,直接顧客に出版物を届けて料金を徴収するために開発された仕組みである。

DOIはコンテンツにユニークなIDを付けて商品管理を行う。ISBNと仕組みは似ており,DOI管理機関が発行する出版社コード(prefix)と出版社自身が付与する文献識別コード(sufix)の2つの部分で構成される英数字の文字列で表される。出版社は,出版社コードの取得・維持のための料金をDOI管理機関であるIDF(The International DOI Foundation)に支払い,出版する個々の文献にDOIを付与する。ただし,DOIに対応する「文献の所在場所」のデータベースを,デジタルコンテンツの出版社自身が作成・維持する点はISBNと異なる。

このデータベースは,IDFのサーバ上で運用される。URLは変更されることが多いが,変更されないDOIとURLの対照データベースであるディレクトリサーバを構築することで,文献の所在場所の変更に対応する。文献の所有者が変更された場合は,新たな所有者がDOIに対応するURLを自社サーバへ変更する。

マルチメディアデータの場合,楽曲や映像,出演者などそれぞれの単位で著作権が発生するため,権利関係に関するメタデータが複雑になる。メタデータが複数の場合,そのメタデータが流通するためのインターオペラビリティ(相互運用)が必要となる。この相互運用を実現するために考えられたのがindecsである。indecsではメタデータとメタデータの間にマッピングを行うという概念が提案された。

indecsでは,まず抽象的な概念を決め,それに対して,構造化されて整合性のある用語と定義を与える。それを一般化して,いろいろな業界で使えるようにメタデータをマッピングし,コンテンツの取得や利用許諾の管理などを行う。

テレビのメタデータ

次世代のデジタル放送へ向けた高機能化として,ストレージ利用とインターネット利用が注目されつつある。デジタルテレビにセットトップボックスと家庭用サーバをつなげることで,サーバ上に蓄積した番組をいつでも好きな時に視聴したり,インターネットや放送サービスとのシームレスな利用が可能となるからである。

そこで,国際的民間標準化団体であるTV Anytime Forumでは,サーバ型放送の実現を目指し,TV Anytimeという規格の標準化を進めている。
TV Anytimeの目的は,「インターネットと放送を融合することによる新しいマルチメディアサービス基盤を実現することである」と川森雅仁氏は説明する。ストレージ利用を前提としたシステム,アプリケーション,サービスの国際標準化を進め,コンテンツの制作から伝送,家庭利用まで,マルチメディアコンテンツの効率的な流通の実現を目指している。

TV Anytimeでキーとなる技術は,(1)メタデータ,(2)コンテンツ識別子,(3)権利管理保護(Rights Management and Protection)の3つである。
第1のメタデータはコンテンツと一緒に送信される。例えば,家庭のデジタルテレビにセットトップボックスとサーバを接続して番組を受信すると,コンテンツの取得と同時にメタデータを取得することになる。メタデータには,番組を識別するための情報に加え,著作権やアクセス制御などの情報が記述されている。

メタデータにより,検索キーによるコンテンツの検索や,蓄積コンテンツのセグメントの再構成,テレビを見ながらのWebページへのリンクも可能となる。エンドユーザプロファイルを利用すると,個人情報によるフィルタリングが可能なので,自分が見たくない番組は流さないという情報をメタデータとして保持することができるからである。TV AnytimeのメタデータはMPEG-7と整合を取るためにXMLベースで取り扱われる。

第2のコンテンツ識別子は,DOIのIDはISBNに似ているが,TV Anytimeのコンテンツ識別子はISBNとは異なる。例えば,同じ作家の本の場合でも,出版社や発行する本の形態が変わればISBNは異なる。しかし,本を探すときにはそれらの情報は重要でない場合もある。内容に対してIDを付けたものがコンテンツ識別子である。

第3の権利管理情報(RMPI:Rights Management and Protection Information)では,著作権保有者の設定した利用条件を満たした環境下でのみ視聴ができる仕組みを提供する。例えば,いつ見ることができるのか,料金,年齢制限,再生回数の制限,暗号方式などが記述されている。

TV Anytimeでは,以上のようなメタデータや著作権管理の仕組みを採用することで,利用価値の高い映像コンテンツの流通促進や新しいビジネスモデルの創造へ向けて標準化が進められている。

メタデータはコンテンツを検索するためだけでなく,著作権管理保護としての機能ももつ。電子商取引を前提でデジタルコンテンツを制作・蓄積する場合に,今後その重要性はさらに増していくだろう。(通信&メディア研究会

■出典:JAGATinfo 2002年4月号

2002/04/12 00:00:00


公益社団法人日本印刷技術協会