XML文書技術を取り巻く環境
2005年2月4日PAGE2005コンファレンスで開催されたグラフィックストラックの「XML文書技術の新展開」では,トライデントシステム 代表取締役 鶴岡仁志氏,W3C HTMLアクティビティリード 石川雅康氏,ジャストシステム 代表取締役専務 浮川初子氏にXML複合文書を中心に標準化活動とプラットフォーム技術についてお話を伺った。
XMLを取り巻く時代背景や社会全体がどうなっていくかを考えてみる。そこでは,知識情報という「資産化」が鍵になってくるのではないだろうか。
「知識創造型社会」では,バラバラに存在している知識・経験・ノウハウ・知恵などを情報資産として組織的に共有・活用することによって,組織全体の競争力を高める「価値創造のイノベーション」を起こしていくことが求められる。
バラバラに存在する情報化知識を,組織全体の知的資産として再利用が可能な形で共有するためには,このXMLの持つ力をいかにうまく活用していくかが鍵となる。
インターネットはコミュニケーション分野の革命であったが,XMLは価値創造の方法そのものの革命ではないだろうか。
XMLの流れと進化
XMLの世界がどのようになっていくかを考えてみると,
1.インターネット上のすべての情報はXMLになる
2.XMLはSGMLのサブセットという枠を超え,独自の進化を遂げる
3.元々文書を扱うための技術であるXMLは,主にデータ処理のために使われるようになる
4.すべてのデータベースソフトはXMLを扱えるようになる
5.インターネットを利用するすべてのアプリケーションはXML対応となる
6.XMLは情報の定義と交換だけでなく,蓄積・検索・変換・表現・処理・印刷にも利用される
7.アプリケーションは独自のファイル形式ではなく,XMLで保存するようになる
8.XML化しない独自ファイルは,XMLでラッピングして検索可能にするようになる
9.XMLは,裏方の技術としてその存在を誰も気にしないようになる
10.XMLについてのプロの重要性が増すようになる
以上のようなことが考えられる。
XML技術の進化の過程は
1.要素技術の時代
専門の技術者がXML技術を使う時代
2.既成技術の時代
多くのアプリケーションがXMLに対応する
専門知識がなくてもXMLが使える時代
3.利用技術の時代
利用環境が確立すると「XMLを使って何をするか」のほうが重要になる
XMLの役割
XMLの役割は,情報の形を定義するだけではなく,次の項目がある。
1.情報表現
データを構造化し属性をつけて意味付けすることができる。
紙面やWebやデータベース上での情報の形を定義できる。
XMLはメタ言語であり, 「○○○ML」のような言語を設計することができる。
また,XMLはアンチオブジェクト指向?という考え方もある。
2.情報検索
構造検索,タグと内容の組み合わせ検索,メタデータ検索,全文検索などさまざまな検索方法を提供する。
既存のデータベースとの連携も容易であり,表構造のデータとXMLデータの共存や協調も可能である。
3.情報変換
XMLデータを操作して,必要なデータを取り出したり加工したりするのに,さまざまな関連規格(XSLT・XSL-FO・DOM等)が用意されている。
例えば,WORD文書から一部分を取り出してXMLファイルを作り出すことも容易にできる。
Webブラウザ上でソートや合計計算等も可能。
XMLデータをレイアウトして,PDFに変換することも可能。
4.情報処理
XMLは自己記述形式,つまり自明なデータ形式であるため,プログラムが自立分散的な処理を行ないやすい。
XMLをプログラミング言語として使用することも常識となる。
XMLの関連規格
関連規格は情報を貯め表現し,検索,変換等の処理をするために利用される。
XML Schema……構造と属性を指定
CSS……Web画面上のレイアウト情報を指定
XSL-FO……紙への出力の際の組版情報を指定
XPath……構造の特定の部分を指定
XLink,XPointer……リンクを指定
XSLT……構造を切り出し,変換する
DOM……外部のアプリケーションから操作する
XMLの適用順序
1.XMLをシステム間のインターフェースとして使う
各システムの内部では依然として独自のデータ形式が使用されるが,システムとシステムの間はEDIのような交換規約としてXMLを使用する。使われるDTDは固定的である。
各種フォーマットをXMLに片方向で変換するコンバータを利用することになる(他形式 対 XMLのコンバート)。
2.XMLをアプリケーション間のインターフェースとして使う
システム内の各アプリケーションが標準的にXMLに対応するようになり,XMLがアプリケーション間のネイティブなデータ形式になる。使用するDTDは多様化し,アプリケーション側の柔軟な対応が求められる。
また,各種フォーマットをXMLに双方向で変換するコンバータと,XML間の構造コンバートつまりXML対XMLのコンバートが必要となる。
3.XMLを情報の保管に使用
データベースシステムがXML対応機能を高め,Tree構造をそのまま扱えるようになる。
XML形式でデータを保管できるようになり,システム依存だった開発スタイルも,データモデル確立の方向へ向かっていく。したがって,データは短命なシステム依存ではなく,独自のライフサイクルを持つようになる。
4.オブジェクト指向によるデータ管理
Webサービスの時代となり,データとプロセスを両方オブジェクト指向で捕らえ,分散環境の小さなアプリケーションを動的に組み合わせる時代になる。
今までは業務プロセスをプログラミングで定義していたが,これからはプロセスモデルの形をとってXMLで定義するようになる(データだけではなくプロセスもXMLで定義する)。
やってはいけないこと
1.システム依存開発
単にシステムを組み合わせて,その機能に客先の業務プロセスを合わせるシステムインテグレーションの手法ではだめである。
顧客が持つ情報のあるべき姿と利用形態をそのままモデル化し,それに応じたシステムを作成する時代になるべきである。
2.システム依存データ
特定のシステム上でなければ動かないデータは,扱いにくい情報になってしまう。それは,システムの寿命が短く結局コスト高になり,陳腐化すればただのゴミになってしまう。
3.アプリケーション機能依存のプログラミング
特定のソフトウエア環境や特定のプラグインがないと動かないコンテンツは,情報の共有と再利用を大きく阻む要因になる。特殊なプログラミングを行なったWebページについても同様である。
情報のモデルと表現と処理は分ける方向へ行かなければならない。Webブラウザの仕様はXHTML対応となり,今後既存のHTMLは作り変えが必要となるだろう。
印刷業界とXMLについて
情報の資産性を高める仕組みとしてアプリケーションの機能に依存してきたのは多少の問題がある。OSやソフトウエアの寿命が短命になった今,例えば特定のDTPソフトに関する高度技術をもっていても,1〜2年でそのソフトが使われなくなるという問題もある。
またソフトウエアそのものも進化し,ユーザ自身である程度の品質の作品を作ることが可能になってきている。
目先の簡便さに惑わされず,特定のアプリケーションに依存しない付加価値の高い技術を手にすることが,コストダウンと新ビジネス創造の両方を行なう印刷業にとって生き残りの方策となる。
印刷業としてXMLに取り組むことも重要である。最近では多くのアプリケーションがXMLに対応し,ユーザがXMLを意識しなくても良い環境が整ってきている。
一般のユーザにとっては,これからはXMLは裏方に回り,特にXML技術がいらない時代となるであろう。
しかしデジタルコンテンツのプロとしてXMLを扱うには,文書モデルの構築,文書の構造化,見栄えへのマッピング,データベースとの連携等さまざまなXML技術を理解しなければならない。
XML複合文書について
XML文書を記述するためには,要素や属性を使用する。要素や属性は,利用目的に応じて意味のあるまとまりとして規定され,このまとまりをボキャブラリと呼んでいる。
現在,さまざまな分野で標準化へのベースを築くため,データに意味を付けるためのボキャブラリの整理が行われている。例えば,HTMLをXMLで定義し直したXHTMLや,数式を記述するためのMathML,ベクターグラフィックスを描くためのSVGなどがある。それぞれの性質からXHTML文書の中にMathMLやSVGで記述されたデータが組み込まれることが多い。
XML複合文書とは,このように複数のXMLボキャブラリが混在した文書である。Web標準を策定している国際的な団体W3Cは,XML複合文書をCompound Document Formatと呼んでおり,標準化への取り組みをスタートさせている。
一方,ジャストシステムは,2004年11月に開催されたXMLコンファレンスにおいて,
「xfy technology(エクスファイ テクノロジ)」を発表した。xfy technologyは,多様なXML文書を1つの文書データとしてシームレスに作成,編集を可能にする技術であり,高度なプラグインの集合により構成される。プラグインシステムやアプリケーション開発機能を実現し,広範囲に応用が可能なソフトウェア基盤技術を目指している。
これらを利用することによって,新しいボキャブラリの開発時に既存ボキャブラリ表示編集環境が利用でき,さまざまなXMLを混在させる用途においても,複雑で大規模なモジュールを開発する必要がなく,アプリケーション構築のプロセスを大幅に改善することが可能になる。
(PAGE2005コンファレンスD5セッションより)
2005/02/22 00:00:00