新しいコンテンツ視聴環境を実現するTV-Anytime

早稲田大学 大学院国際通信情報通信研究科 教授 亀山 渉 氏

今回は,TV-Anytimeフォーラムで行っている映像情報のメタデータの規格とその周辺の規格について紹介する。これはメタデータだけの話ではなく,ある意味でテレビ視聴を根本から変えてしまうイノベーティブな側面も持っている。
そこで,メタデータを使ってテレビ視聴がどう変わるかというところから話したい。まず前提として,新しいコンテンツ視聴環境あるいはテレビ視聴環境が必要になっているという話をしたい。キーポイントとなるのが,現在商品として出ているコクーン,ガリレオ,DIGAなどで,総称してここではPDR(Personal Digital/Data Recorder) と呼んでいる。このPDRがコンテンツ視聴革命を起こすことになる。少し古い資料だが,視聴者がテレビに対してどういうことを要求しているかを,NHK放送文化研究所の世論調査から一部ピックアップした (図1)。一番トップにあるのは,好きなときに好きな番組を見るという当たり前のことである。現在のテレビは当たり前のことができていない。それがユーザの不満であるということがよくわかる。それに付随するように,予約した番組を自動的に録画できる,見せたくない番組は映らないようにするという要求がある。突き詰めると見たいものを見たい,見たくないものは見たくないという要求を視聴者はテレビに対して求めているということが言える。アメリカの要求を比較する (図2)。Forresterによる抜き打ち調査で,テレビにどんな機能が欲しいかを聞いたものである。グラフの一番目はコマーシャルを見たくないということである。続いてある番組を見ながら別の番組を録画したい,見たい番組を見たいとなる。この表が示しているのはなぜ今のテレビはこれを満足させてくれないのかというところである。

新しいデジタルテレビ

新しいデジタルの世代ということで,デジタルテレビがいろいろ出ているが,これが本当に視聴者を満たしているかどうかを考えなければならないだろう。
究極的なデジタルテレビの世界は,基本的に旧来のテレビにあった制約を取り除くことである。旧来の制約というのは何か。VTRはいちいち予約をしなければいけない。Gコードがあると言っても,スキャンして数字を入れなければという面倒がある。忙しくなってくると,好きな番組があるということがわかっていても,予約すらできないという状況の人も多いだろう。そして全然テレビが見られないという状況になる。現在のテレビのコンセプトは,たとえVTRがあったとしても,決まった時間に,決まった場所で,決まった方法でしかコンテンツを視聴することができないというものである。それをいかにしてなくすかが,デジタル放送のパラダイムであると思っている。

PDR登場の背景

視聴者の要求としては,いつでもどこでもどんな手段でも新しいコンテンツが欲しい,見たいという要求に尽きる。ユビキタスという言葉が流行っているが,言い換えると,空間的,時間的,手段的なユビキタス性というものが求められている。これがデジタルコンテンツ視聴,あるいは新しいデジタルテレビのパラダイムと言える。1990年代,VoD(Video on Demand)が盛り上がった。VoD はある意味その要求を満たす解であるが,大きな公衆サービスとはなっていない。それは経済的に成り立たないからである。現在も研究開発は進んでいるが,実用的なものになるまでにはもう少し時間がかかるだろう。しかし,これでは,今,満足できないので,そこにPDR (Personal Digital/Data Recorder) が登場してくる。なぜPDRが有利かという話の前に,メモリの価格推移について話したい。ムーアの法則というものがある。1年半経つと半導体の価格,特にCPU の価格が半分になる,あるいは同じ価格なら性能が倍になるというものである。
この法則はメモリ,記憶装置にも当てはまる。10時間録画,40時間録画と言われているDIGAやコクーンといった話がもっと鮮明な形で出てくる。例えば,2000年には,6MbpsのMPEG-2のビットストリーム,音と映像を合わせたものを約4時間保存可能なハードディスクが100ドルだった。2000年時点で4時間だったものが,1年半で倍々になると考えると,2010年には100ドルで400 時間録画できるということになる。さらに10ヵ月で倍々になると考えた場合は,2010年には100ドルで14,400時間の録画ができるという計算になる。この中間の現在の予測が,約4000時間という中間くらいの数字になる。現在100ドルで購入できるハードディスクを考えると,200GBくらいのものはすでに購入できる。時間数に直すと約80時間なので,1年間で倍になるというペースでほぼ進んでいるということが言える。後は簡単な計算だが,19テラバイトさえあれば,10局24時間1ヵ月分を録画可能になる。これは7,200時間でしかない。10局とはBSデジタル放送のチャンネル数がちょうど10局なので,1ヵ月分24時間貯めるということを考えると,たった19テラで済むという話になる。19テラが100ドルで買えるのは,1年間で倍々というペースが続けば,2011年という計算になる。
100ドルではなく300ドル,400ドルくらいで買うなら,2009年くらいになる。
2004年のデジタル放送はMPEG-2という方式で放送されている。2005 年にはその6MHz帯域の中を13 個のセグメントに分けて,その1つのセグメントを使って携帯ターミナル向けのデジタル放送を始めることが進んでいる。ここでは最新の映像の符号化方式が使われることになっている。俗にH.264/MPEG-4 AVCと呼ばれているが,約1Mbpsで現在の6Mbpsとほぼ同等の画質が送れる。そう考えると,19テラも必要ない。H.264で符号化すると,約3テラバイトで済む。100ドルで3テラバイトが買えるのは,2008年である。300ドル,400ドルで3テラバイトが買えるのは2006年で,もうすぐである。例えば,CATVの100チャンネルまるごと録画などが可能となる。200テラ,30テラという数字が並んでいるが,10年以内にはこの世界が当たり前になってきているだろう。何10万という価格になっているが,ムーアの法則で考えると,価格は半分,半分で推移していくことが予測される。個人的には,1テラバイトが2万円,3万円程度で買えるようになると,すごいことが起こるだろうと予測している。それはPDR という世界だけではなく,いろいろなものにハードディスクが入り,その蓄積装置を使って,今までできなかったような,ローカルな装置に対するインタラクティブを利用するという新しいコンテンツの利用の仕方,またコンテンツ以外にもゲームのようなものが出てくると思っている。

クリティカルマスを克服する

PDRにとってのクリティカルマスは,1テラバイトが2,3万円になるところと考えている。このクリティカルマスを超えると,この番組を見たいからそれだけ録画するということは全く意味をなさなくなる。見る見ないにかかわらずとにかく全部録って,後でその中から選択して見るというふうにテレビ視聴が根本的に変わる。少なくとも8時にあるテレビ局が放送している番組は視聴者も8時に見ているという法則は根本から崩れる。放送局は来るべきPDR時代に対してどう対処するか,ビジネスモデルはどういうふうにあるべきかを真剣に議論しているところである。典型的なクリティカルマスの例はデジカメである。デジカメには2つのクリティカルマスがあった。第1は画素数のクリティカルマスである。300万画素を超えるとプロでもOKだと言っている。そういった超高性能な画質が安い価格なので,銀塩のカメラがだめになった。第2は,コンパクトフラッシュとかSDメモリカードなどに代表されるフラッシュのメモリの価格が急激に下がったことで,1枚のカメラの中に1,000 枚,500枚も貯めることが可能になった。写真家の篠山紀信さんがなぜプロはいい写真が撮れるのかをインタビューで聞かれているのを昔に聞いたが,「プロはたくさん撮るから当たり前だ」と言っていた。素人が高いカメラを買って,10枚や20枚撮って,すぐその場で現像できないから,いい写真が撮れているのかどうかよくわからない。ところが,デジカメではプロと同じことができる。100枚撮っても関係ない。その中の本当のいいものだけピックアップしているとカメラに興味がなかった人間でもいい写真が撮れる。デジカメは2つのクリティカルマスを克服することで,静止画あるいはカメラに対するライフスタイルを全く変えてしまった。
それと同様に,ハードディスクの価格下落がテレビに対する我々の生活態度を全く変えるだろうということが予測される。PDR とは,Personal Digital RecorderとかDisk Recorder,Data Recorderと言われる。アメリカではDVR,Digital Video Recorderという名前になるようだ。日本ではハードディスクレコーダとかDVD Recorderと呼んでいるので,こちらの名前が定着しそうな気がする。いずれにしても大容量のHDDが載り,番組選択というようなテレビの概念を根本から崩すようなものである。そしてオンデマンド視聴がこれによって可能になる。これはビデオオンデマンドのリプレースメントである。すなわちリアルタイムでの放送局に対する,あるいはビデオサーバに対するインタラクティブ性はないが,すべてをローカルのハードディスクに貯めているので,ローカルのハードディスクに対するインタラクティブ性は,簡単に保証することができる。ユーザにとってみると,ビデオサーバにアクセスしているわけではないが,ビデオオンデマンドと全く同じ効果が得られる。これこそ,いつでもどこでも誰でもというテレビの旧来の枠を外す救世主ではないかと思われている。
また,放送局は嫌うが,ノンリニア視聴が可能で好きなところをつまみ食いできる。さらに現在のインターネットにおけるコンテンツ配信の最大問題は,サービス品質を保証できないことである。ユーザはある程度の品質が保証できないとお金を払わない。PDRを使うと,伝送路上でのサービス品質を保証する必要は全くない。蓄積した後のコンテンツとしてのサービス品質だけを保証すればいい。伝送させるネットワークを,今のようなテレビのインタフェースによるテレビ放送や太いケーブルによるテレビ放送を一切使わなくても,ゆっくり送って,いつの間にかユーザのところに届いて,リアルタイムに再生して見ることができる。すなわちQoSを保証しないネットワークでもコンテンツ配信がPDRによって可能になる。商売的には,ライブ情報と蓄積情報を交換して見せる,あるいは,蓄積されたコンテンツの一部を他の蓄積されたコンテンツとリプレースして見るというのが,ビジネスモデル上,最も重要と言われている。特にCM に対してこれを行うというのを,ターゲッティドアドバタイズメントと呼んでいる。ユーザの好みに合ったCMを再生時に差し替えて放送を見てもらうというビジネスモデルである。CMも興味のあるCMなら見るだろう。一概にCMすべてが悪だというのではない。興味ある商品のCMなら見るし,きれいな映像のCMなら見る。興味のないCMをプッシュして見せようとしているから,CMの悪いところばかりが目立ってしまうが,好きなものは見るという考えからすると,こういうビジネスモデルは当然あるだろうと注目されている。

TV-Anytimeシステム概要

TV-AnytimeフォーラムはPDRがあるということを前提にして,ここでの新しい視聴形態をサポートするための標準作りを行っている。具体的には,放送を主体としたアプリケーションをサポートする規格をフェーズ1と呼んでいる。フェーズ2では,現在進行中で,新しいさらにその先のアプリケーションを目指したようなサービスを支える規格というものを策定中である。ユーザ,コンシューマにたどり着くためのネットワークは1つだけではない。コンテンツプロバイダからさまざまな経路を経てコンテンツをユーザに届けることが,PDR によって実現できるということである。組織は図3のようになっており,私はそこで副議長を引き受けている (図3)。2004年10月時点で,2ヵ月後くらいにはフェーズ2の規格は技術的には凍結し,2005年の夏まではレギュラーな活動を継続することになっている。今まで作ってきた標準は,ETSI (EuropeanTelecommunication Standards Institute: ヨーロッパ電気通信連合) の国際標準規格としても承認されている。主な部分は,メタデータである。しかしメタデータだけではコンテンツにアクセスすることができないので,コンテンツを特定するための手法としてCRIDというものを決めている標準がある。その他,コンテンツ流通ではライツマネジメントが重要な課題になるので,どうハンドルするかを規定したパート,メタデータをうまく検索するためのインタフェース,特に双方向ネットワークにおけるインタフェースを規定したパート,セキュリティを扱うパートという形になっている。テレビ番組と,番組に付随するありとあらゆるメタデータを書けるようにしようというのがメタデータ標準である。番組検索,選択を助けるものは当然だが,そのコンテンツがどこにあるのか,どこのネットワークを使ってアクセスするのか,どういうプロトコルを使ってアクセスするのかというものも必要である。権利情報も,例えば100円払ったら見られる,フリーで見られるといった情報も必要である。
また,もう1つ重要なのは,利用者がそれを利用したということを貯めておくデータも標準化しておかないと,自分の視聴履歴を使ってCM会社や放送局がターゲッティドアドバタイズメントしたいというときは,ユーザが持っている視聴履歴がないとマッチングが取れない。そこで番組そのものとは全く関係ないが,利用ログ,履歴情報に関するメタデータのフォーマットを標準化している。
具体的には,MPEG-7 の中から必要なところを抜き出して,さらに拡張している。TV-AnytimeのメタデータはMPEG-7のサブセットと思っているようだが,そうではない。サブセットでもあるし,ある意味スーパーセットでもある。不必要なところをそぎ落として,さらに必要なところを拡張している。MPEG-7とはありとあらゆるものを全部統一的なフォーマットに記述しようというジェネリック標準なので,スキーマ定義だけでも7,000行以上あるという巨大なスタンダードである。しかしながら巨大なスタンダードですべてを記述することはできない。ボキャブラリを増やせばできると思うのは間違いで,増やせば増やすほど足りないところが目立っていく。そこで,TV-AnytimeフォーラムはMPEG-7の必要なところだけを取ってきて,番組,プログラムに対するところと,あまりにも汎用的すぎたために記述が未熟であったところを拡張したという規格である。
コンテンツそのものを記述するメタデータ,番組がどこにありどういうサービスを得られるのかというインスタンスディスクリプションを記述するメタデータ,また1つの番組の中でコンテクストの違う部分を記述できるようなメタデータ,コンシューマの環境を記述できるメタデータ,という大きく4 つの枠組みでメタデータが記述できるようになっている。

ポイントとなるメタデータ

最も重要なのは,ユーザに対してコンテンツを誘導するためのメタデータであり,プログラムそのものの内容を記述するメタデータ,あるいはシリーズ番組の「何々シリーズ」を記述するためのメタデータ,また日本ではあまり重要視されていないが,海外で重要なのはプログラムレビュー (批評情報) である。
TV-Anytimeフォーラムはメタデータのことをときどきアトラクターと呼んでいる。従来の意味でのメタデータという意味もあるが,これはユーザをコンテンツに誘導するための重要な情報ということで,アトラクティブな要素のあるものならメタデータの中に何でも入れようということになっている。簡単なメタデータの利用例を見ると,コンテンツとメタデータをPDRに取り込み,フィルタリングを使ったりサーチエンジンを使ったりして,好きなものだけを見てもらうということになる。メタデータは図4のような形で記述する (図4)。これは先ほどのプログラムそのものを記述するデータの一部である。番組がどこにあるという情報としてCRIDというものが入っている。これを使うことで,プログラムがどこにあるかという情報を特定することができる。あとはタイトル,シノプシス,キーワード,ジャンルなどが入っている。ジャンルはクラシフィケーションテーブルを使って記述されている。コンテンツのIDは,規格が唯一あるわけではなく,いろいろなIDがあるので,そういうものが書けるようになっている。TV-AnytimeフォーラムのコンテンツIDであるCRIDの特徴は,コンテンツという実体に対してIDを振らず,仮想的なコンテンツそのものに対してIDを振っておき,実体はいくつあってもいい。例えば「スターウォーズエピソード1」は,民放がテレビで放送するかもしれないし,アメリカ西海岸のビデオオンデマンドサーバに蓄えられているかもしれない。あるいは,すでに自分のPDRの中に情報として蓄積されているかも知れない。しかしユーザがサーチしたいのは西海岸にある「スターウォーズエピソード1」ではないし,TV放送される「スターウォーズエピソード1」でもなければ,ローカルの「スターウォーズエピソード1」をサーチしたいわけでもない。あくまでも「スターウォーズエピソード1」であり,その結果,どこにあるかがわかり,取りにいく,100円払えば見られるからと選択肢を最終的にユーザが決めるということになる。これを実現するために,コンテンツそのものに対してIDを付けておき,コンテンツがどこにあるかを示すものをLocatorと呼んでいる。クラスのインスタンスがたくさんあるので,このような形でプログラムコンテンツに対する特殊な事情を回避するようにしている。具体的には,1つメタデータを使ってサーチするとCRID が得られるが,そのID を使ってロケーションを得て,最後にコンシュームする。

ライツマネジメントと保護

ライツマネジメントに関しては,紆余曲折がある。ライツマネジメントの課題に対して挑戦している標準化団体は他にもたくさんあるが,1つも成功しているところはない。ライツをどのように運用するかというビジネスモデルは個々によって全く違う傾向がある。ライツそのものの性格も問題である。ライツを持っている事業者が,ライツをどのように運用したらいいかというポリシーさえも固まっていない。何か条件を決める,リクワイアメントを決めようとしても,際限なくライツホルダからのリクワイアメントが出てくるだけで,システムを設計することができない。そこでTV-Anytimeフォーラムが決めているライツマネジメントは,RMPIというドメインを決め,この中だけでお互いに機器やメディア間でライツの情報を交換できるようなインタフェースを決めることを行った 。

メタデータサービス

メタデータの双方向の検索については,いわゆるWebサービスを使って双方向にメタデータの検索ができるようなインタフェースを決めた。具体的には標準のフレームワークと何も変わらない。UDDIのサーバに行ってインフォメーションディスカバリーをして,実際のメタデータがどこにあるかを検索し,最後にそれを使ってWSDLとSOAPを使ってメタデータのインクワイアリをしてやりとりするというインタフェースを決めている。個人情報をやりとりすることもあり得るので,プロトコルをセキュアなものにしている。TLSやSSLを使ってセキュアなトランザクションにする。これらを使ったデジタル放送がまもなく各国で始まろうとしている。

フェーズ2の課題

フェーズ2で取り組んでいる課題は,大きく3つである。一つは,新しいコンテンツへの対応,特にPDRはAV情報以外を蓄積できるので,デジカメとの連動も考えられる。次はターゲティングである。そして最後はコンテンツの再配信である。これらの技術が新しい放送には欠かせない。具体的には,次の5つの技術が新たに規格に加わる予定になっている。1つはパッケージとターゲティングで,視聴者の好みに応じたコンテンツをいかに送り届けるかということを標準化したものである。2つ目はRMPIだが,プロテクションの話を進化させて,クローズドドメインではなく,もう少し広げたようなドメインで提供できるようなライツマネジメント技術である。3つ目は個人情報をいかにして交換するかということで,Liberty Allianceというフォーラムとスクラムを組んで進めている。4つ目は交換性のあるデータフォーマットで,テレビの業界だけにクローズドではいけないので,外界とのインタフェースを策定している。そして5つ目は,リモートからPDRをコントロールできるインタフェース規格である。
これでTV-Anytimeフォーラムの仕様が全部出そろうという形になる。詳細の情報は,TV-Anytimeフォーラムのサイトを見てもらうと,すべてわかるようになっている。

コンテンツ流通とコンテンツアダプテーション

今はインターネットがあるが,コンテンツネットワークとしてはほとんど商売になっていないので,現実的なコンテンツネットワークはテレビのネットワークしかない。テレビに代表される映像ネットワークは,均一なネットワークである。端末間の機能差が全くない。そのために制作されるコンテンツの規格や品質も全く変わらない。NHKが作っているコンテンツも,日本テレビが作っているコンテンツも,TBSが作っているコンテンツも,規格は全部同じである。
NTSCという規格でNTSCの品質で取られている。受信機も全く同じというネットワークである。こういうところにおけるサービスのユビキタス性,拡大性は何かというと,単純に端末をたくさん安く作ってばらまいてサービス地域を拡大するということで,これが旧来の映像ネットワークのユビキタス性であった。
それに対して直面している課題は,このネットワークだけではなく,他にもネットワークがある。特にインターネットに代表されるような対応性の高いネットワークに直面していて,そこの上での映像サービスのユビキタス性が求められているのが,我々の課題である。ここでの特徴は全く逆になり,ネットワーク機能も違う。インターネットというのは結合されたネットワークの総称である。電話線を使ったインターネットもあるし,無線を使ったインターネットもあるし,光ファイバを使ったインターネットもあるし,ADSLを使ったインターネットもある。これらは全部ネットワークの性質が違う。さらにつながっている端末も全部ばらばらである。あるところは古めかしいPC,あるときはPDA,あるときは携帯電話,またあるときはスーパーコンピュータかもしれない。ありとあらゆる機能差がある端末がつながっている。そういう端末でコンシュームできるための最適なコンテンツの品質や規格は全部ばらばらになる。スーパーコンピュータでコンシュームできるコンテンツと携帯電話でコンシュームできるコンテンツが一緒では何の意味もない。誰もスーパーコンピュータを買わない。ネットワークにおけるサービスのユビキタス性を達成するためには,コンテンツを消費される環境に適応化させるコンテンツアダプテーションという考え方がないとコンテンツは流通しないということになってしまう。ところで,最近注目を浴びているのは,携帯電話のネットワークである。
KDDIがなぜコンテンツビジネスで成功しているかの図式を見ると簡単に解明できる。携帯電話のネットワークは,限りなくこちらに近い。
端末の能力差はほとんどゼロである。したがって,制作できるコンテンツの品質や規格はすべて同じである。またクローズドネットワークなので,ある程度基地局から端末に届くまでの品質を予測することができる。条件が限られているようなところで行うコンテンツサービスはうまくいく。適応性を考えなくてもうまくいくということが,KDDIの先行例になっていると言えるだろう。現在,世の中でユビキタスと言っているのは,ネットワークのアクセス性のユビキタスだけを論じている。しかし必要なのは,ネットワークのユビキタス性を使ってアクセスできたネットワークから,意味のあるコンテンツを引っ張ってくることである。それは必ずしもテレビプログラムでなくてもいいが,意味のあるコンテンツを引っ張ってきて,意味のあるときにそれを消費したいということが,我々の欲求である。ここには映像と書いてあるが,我々はサービスのユビキタス性が欲しい。それを実現する要素の1つは,ネットワークのユビキタス性がなければだめだが,ここだけ一生懸命やっているだけではユビキタス性は成り立たない。そこで重要なのが,このコンテンツアダプテーションという考え方である。我々が持っている端末やネットワークは全部違うので,それぞれに適用化されたコンテンツに変換して受ける環境を作らなければならない。簡単な例では,つながっているネットワークは細いので,コンテンツのビットレートを下げて送る,品質は少し悪い,画面サイズは小さくてもいいというアダプテーションがある。さらに,小学生なのでコンテンツをこういう見方で見て欲しい,大人なのでこういう見方で見て欲しい。あるいはこういうふうにコンテンツを変換して見て欲しいということがある。コンテンツを適用化させていくということは,端末の能力に対して適用化させていくだけでなく,端末を使っているユーザに対しても適用化させていく。この2つがないと,最終的なサービスのユビキタス性はあり得なくなる。

メタデータの記述

ここで重要になるのが,コンテンツのメタデータとユーザそのものを記述するメタデータである。1つはユーザのプロファイル情報,プリファレンス情報,ユーザの視聴履歴情報がある。また端末の能力を記述するメタデータも必要になる。この2つを合わせて,初めてコンテンツアダプテーションができる。
コンテンツアダプテーションという考え方は,急に出てきたわけではなく,以前からある。例えば,SMILという規格でコンテンツアダプテーションの芽が出ている。 というエレメントを使うと,再生コンテンツをユーザの使用言語やビットレートやスクリーンサイズを使って選択できるような機能がある。1998 年,1997年の5年以上前の話である。インターネットで使うマルチメディアのシンクロナイゼーションランゲージなので,インターネットにあるコンテンツの多様性に対して,対処しなければならなかったということがSMIL に現れている。また,ICAPということで,HTTPリクエストを途中でモディファイして届ける,返ってきたHTTPレスポンスをモディファイして返すという規格もある。さらにMPEGグループが作っているDID,DIAという規格,TV-Anytime フォーラムのPackage規格がある。SMILの記述は図5のとおりである (図5)。この場合はビットレート,この場合はオランダ語か英語かの好きなランゲージを選択するようになっている。ICAP の例は,HTTPのレスポンス変更モデルだが,あるHTTPのリクエストを出し,コンテンツサーバに行ってレスポンスが返ってくる。返ってきたレスポンスをインターセプトして,ユーザのプリファレンス情報に対してモディファイして返すというのがICAPの基本的な考え方である。例えば朝日新聞のサイトにアクセスすると,いろいろな広告情報が載っているが,ユーザプリファレンス情報を使い,Web広告をプリファレンスに合うように差し替えて送るということが考えられる。それに対してMPEGのグループがどう動いているかというと,まず,DID,Digital Item Declarationを説明する。MPEGでは,コンテンツという言葉を使わない。
コンテンツは多義的な意味を持っており,コンテンクストによって意味が違うので,コンテンツという言葉は良くないという考え方である。そこでディジタルアイテムという言葉を使用している。ここではXMLのエレメントとしてのItemとしてしか書かれないが,これがディジタルアイテムである。そして,このItemがどういう構造情報を持っているかを記述できるような方式を決めた。
具体的にはContainer,Item の中に入っているComponentを決めて,あるコンテンツがどういう要素から成り立っているという構造情報を記述できるようにしている。さらに注目すべきは,この構造情報中にというものがある。この3つのXMLエレメントを使って,条件に合致したらあるディジタルアイテムを選択するということを記述できるようにしているのが,Digital Item Declaration規格の特徴である。
この例で言えば,を2 つ持っている。1つはMP3のフォーマットで,もう1つはWindows Media Audio のフォーマットだが,どちらかを選択してくれと書いてある。コンテンツそのもののインスタンスは2つ指定してある。もしMP3フォーマットをチョイスするなら,ここに行ってMP3フォーマットのデータにアクセスすること,Windows Mediaをチョイスするなら,こちらに行ってこのデータにアクセスすることと書くことができる。これは簡単な例だが,ボキャブラリを増やしていけば,ユーザの端末情報や端末の特性情報やユーザそのものが持っている情報等をうまく合わせて,いろいろなターゲティング,コンテンツの適用化ができる。例えば蓄積されたテレビプログラムがある。クリスマス前に見るならこのコマーシャル,クリスマスを過ぎたら,違うコマーシャルを見て欲しいということがある。これは広い意味で捉えるとコンテンツの適用化になっている。そして,これを具体的に実現しようとしているのがTV-Anytimeフォーラムのパッケージ規格である。

まとめ

PDRは放送を根本的に変えるだろう。まもなく今まで見ていたようなテレビの不自由さはなくなる。まだテレビ局がいろいろ抵抗することも考えられるが,少なくとも日本では2006年頭にはサービスが始まろうとしている。ARIB (電波産業会) のSTD B-38「サーバ型放送における符号化,伝送及び蓄積制御方式標準規格」がある。この規格をさらに運用プロファイルに落とすという規格を,約100社が参加しているサーバPという団体で作業を行っている。WOWOWはすでにPDRを利用したサービスをやると言っているので,早ければ2005年終わり,遅くとも2006 年頭には,PDR型の放送が始まる。逆に言うと,空からこういうリッチなメタデータが降ってくるということになる。2点目としては,その考え方を進めていくと,コンテンツアダプテーションという考え方にたどり着く。
これは狭義の意味で現在放送局が汲々としているようなコマーシャルの視聴を目的としたターゲッティドアドバタイズメントだけでなく,広い意味でブロードバンドを有効に使っていく手段として考えていかなければいけないことである。現在,TV-Anytimeフォーラムが実用的な標準作りに取り組んでいる。日本でもTV-Anytimeのメタデータを使う,アメリカでもヨーロッパでも使うというのが現状なので,TV-Anytimeメタデータが浸透していくにつれて,さらにパッケージの規格も広まっていくと,ブロードバンドにおけるコンテンツアダプテーションという考え方が広まり,さらにコンテンツ視聴の多様性が生まれてくるのではないかと予測している。

2004年10月6日CM研究会techセミナー「メタデータによる検索,編集,配信の 効率化」より(文責編集)

会報「VEHICLE」2004年月11月号 Vol.16 No.8通巻188号
(C)Japan Association of Graphic Arts Technology