本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XML一問一答 第2回〔基本編〕

Q : XMLはなぜ重要か?
A : 最も適切な答えは,「すべてのベクトル(時代の方向性)がXMLを指している」というものである。つまりほとんどすべての技術者が,要素技術の点からも利用技術の点からも各アプリケーションの機能的要求の点からも,XMLを最善の解決策と考え,それに取り組んでいることである。今後,IT技術の重要な基本部分をXMLが担うことになることが確実だという証拠はいくつもある。
少し前までは,アプリケーションを開発する場合,そのファイル形式は自社の独自形式を採用するのが普通だったが,今ではオープンスタンダードでないものは市場から淘汰される時代になっている。
マイクロソフト社は,1990年代半ばに社運を懸けて自社の製品をインターネット対応にしたが,2000年を目前にしてさらに膨大なコストを掛けて自社製品をXML対応にした。他社もこぞってXML対応を打ち出しており,皆がXMLに多大な開発投資をしているという事実自体,その素性の良さと将来性を物語っている。
ほかにもXMLには,応用範囲の広さや柔軟性など「最も重要なIT技術」と呼ぶにふさわしいいくつもの利点がある。

Q : XMLは印刷業にとってなぜ重要か?
A : 印刷業は極論すれば,情報を目に見える形に編集し加工する仕事であるということがいえる。
紙に印刷することが前提であった時代は,情報の価値はその見栄えにあったといえるかもしれない。
デジタルの時代になり,情報の価値が単なる最終的表現(つまり見栄え)だけでなく,情報の中身そのものやその形,管理や検索のしやすさ,処理加工のしやすさや紙以外のメディアへの対応などさまざまな基準で測られるようになった。
印刷業は今,情報の資産性をさらに高めるために,情報表現・情報検索・情報変換・情報処理のおのおのの必須技術であるXMLに取り組むことが求められている。

Q : なぜ今XMLに取り組む必要があるか?
A : 情報の形態と価値の多様化に対応して,印刷業の多くは入力から出力までのさまざまなアプリケーションやシステムを作成したり購入し,この要求に答える努力を行った。しかしそれは,非常なコスト負担を強いただけでなく,印刷業に構造的なジレンマを生じさせる結果になった。
その1つが,情報の資産性を高めるしくみとしてアプリケーションの機能に依存してきたという点であり,高付加価値の技術を支えるプラットフォームの陳腐化が早くなると大きな問題を抱えるようになった。インターネット時代となりOSやソフトウエアの寿命が短命になった今,例えば特定のDTPソフトに関する高度技術をもっていても,1〜2年でそのソフトが使われなくなるという問題がある。
またソフトウエアそのものも進化し,ある程度の品質の作品を作ることが可能になってきているため,いよいよ差別化が困難になってきている。つまり,特定のアプリケーションに依存しない付加価値の高い技術を手にすることが,収益改善の処方箋ということである。

Q : XMLって何?
A : 一言で言うと,XMLにできることは「ツリー構造を表現する」ということだけである。
XMLは,あるデータから見て自分の親がだれで兄弟がだれかを指定することができる。その指定を積み重ねることによって,木のような構造全体を表現することが可能になる。XML関連規格(XSLT・XPath・DOMなど)を使うと,そのツリー構造を操作して必要なデータを取り出すことが可能になる。

TREE構造 TREE構造

Q : XMLに取り組むにはまだ早いのでは?
A : 最近では多くのアプリケーションがXMLに対応するようになり,データベースシステムはもちろんプログラミング環境からオフィス製品までがXMLを扱うことができるようになってきた。この点,技術的なハードルは確実に低くなってきている。
しかし印刷業としてXMLを扱うには,組版とは全く違う文書の構造化という概念を理解しなければならない。情報を本来あるべき姿でモデル化してツリー構造で定義するには,XML/SGMLに特有の利用技術を習得する必要がある。つまり,将棋の駒の動かし方が分かるだけでなく,戦術を使って勝つための技術が必要となるわけだ。そのためには,デジタルコンテンツを扱う技術背景がなければならないが,この点で印刷業にはアドバンテージがある。
この技術の習得にはある程度の時間が掛かる。XMLに取り組むつもりがあるなら,技術者の育成を今すぐ始めることが重要である。

Q : XMLが理解しにくいのはなぜか?
A : これには以下のようないくつかの原因がある。
@メタ言語である
XMLはさまざまな言語を作り出す元となる言語であり,そのためいろいろな人が勝手な定義をし,勝手な使い方をすることを許している。またHTMLのようにアプリケーションによる「振る舞い」が定められていないため,理解することが難しい要因になっている。
Aアプリケーション対応の違い
最近は多くのアプリケーションがXMLを扱えるようになっているが,その対応の度合いにはばらつきがあり,相互の互換性は保証されていない。
Bメリットが多い
XMLの利点や特徴は数多くあり,その一部を利用するだけでも効果がある。そのため利用者が,その一部を偏って紹介する傾向があり誤解を招く原因になっている。
C立場の違い
XMLはデータベースプログラマーやWebプログラマーにとっても重要な技術となっており,情報もデータ処理やプログラム分野に偏っている。XMLは本来デジタルドキュメントのための技術だが,現状その分野の情報はなかなか入手できない。
D真髄を分かっていない
XMLは,単なるインタフェイスとしてだけでなく,情報そのもののモデル化と,その処理という分野で力を発揮する。特に印刷業では文書の構造化というXML/SGMLの技術を習得する必要がある。通常のプログラマーでは,構造化の価値さえ理解できないことだと思われる。
E関連規格が多い
XMLにはXSLT,XSL-FO,XPointer,XPath,XLink,Namespace,DOM,XML Schema,XML Queryなど多くの関連規格があり,それらをうまく利用することで威力を発揮する。
F応用規格が多い
技術的な側面から見ると,SOAP,WSDL,UDDIなど,これからのWebサービス時代を支える基幹技術だけでなく,マルチメディア,電子署名,セキュリティ技術,音声処理,知的所有権などさまざまな分野でXMLが採用されている。また各種団体が規定したXMLによる標準化は,建設,自動車,電子部品,機械部品,金融,放送通信,出版メディア,科学,旅行,医療などあらゆる分野に及ぶ。

Q : 書店に並ぶXMLの本や雑誌はなぜ難しいのか?
A : XMLはもともとデジタルドキュメントのための技術だったが,現在ではデータ処理やプログラミングのための技術として広く受け入れられている。XMLに関する技術情報を積極的に開示しているのは,オラクルやIBMやマイクロソフトなどのデータベースメーカーとJavaに関連したSUNやLinuxなどがほとんどで,書店に並ぶXML関連の情報もプログラマー向けのものとなっている。そのため,デジタルドキュメントを扱うための技術や文書構造を定義するために必要な情報はなかなか入手できない。

Q : XMLの勉強はどうすればよいか?
A : 印刷業にとって必要なXMLを使ってデジタルドキュメントを扱うための技術は,独学ではなかなか習得するのは難しい。それは本などによる情報が足りないだけでなく,要求されているのがより実践的な実務知識だからである。たとえXML関連の資格試験に合格したとしても,実際の業務に生かす方法は別物であるといえる。各種のセミナーや講座を受けることも必要であろう。

Q : XMLはPDFとどこが違うか?
A : 人間は,文書を見た時にその見栄え(インデントやフォントやサイズ)や文書の内容文脈から文書構造を理解しているが,実のところそれは情報の関連をツリー構造の形で認識している。つまり見栄えは重要だが,人間は情報の認識のためにそこからさらに構造を類推するという作業を行わねばならないことが分かる。
PDFはPostScriptの技術を応用したものであり,事実上プリントアウトした結果をデジタル情報として保持したものである。検索機能やコメント付加機能があり,入力機能やXMLを吐く機能を付けたりしているが,結局は出力結果を保証するための見栄え重視のものといえる。またアドビ社はオープンスタンダードな仕様であると主張しているが,実際には特定のアプリケーションに依存したフォーマットであると評価されている。
XMLは,情報を実体と構造と属性に分けて管理しているが,これはデータのモデル化としては理想的な姿である。情報のモデル化とスキーマ定義,情報の受け渡しのためのインタフェイス,情報の検索方法の提供,あるツリーから別のツリーへの構造変換,情報を処理するプログラミング言語など,さまざまな形で情報を表現・検索・変換・処理できるのはXMLだけである。もちろんXMLは見栄えを無視しているわけではなく,それを付加するためのXSL-FOという関連規格を備えている。

Q : XMLとは新しいHTMLとなるものなのか?
A : HTMLの後継規格としては「XHTML」というものがある。これは従来のHTMLタグの多くをXML形式で宣言し直したものだが,構造を意識させるため厳しい構文チェックを行うようになっている。
XMLのタグはHTMLのようにアプリケーションによる「振る舞い」が定められていないため,そのままではレイアウトされた文書としてWebブラウザで表示することはできない。CSSやXSLTなどを使って,Webブラウザが表示できる形式にコンバートする必要がある。 今後はWebページをデータベース化するためにXMLを使うケースは増えてくるだろうが,それがどの程度使えるかはWebブラウザやデータベースシステムなどのアプリケーション側の進化に依存している。

後継規格XHTML 後継規格XHTML

Q : 現在あるHTML文書はXMLにする必要があるか?
A : 必要があるかどうかはその文書にどれくらいコストを掛けるか,つまりその資産価値による。しかし,Webページが単なる使い捨てのものではなくなってきている今,HTMLをXMLやXHTMLにすることのメリットは明確に存在する。その一つがメンテナンスコストである。構造化が全く考慮されていないHTML文書は,スタイルが直接テキストなどの実体に結び付いているため,膨大なメンテナンスコストが掛かる。これはリンクに関しても同じである。
別の面はデータベースとの親和性や検索性という問題である。
もう一つの重要な要素は,今後WebブラウザはXHTML対応を基本として進化していくことが予想されていることである。現在のHTMLファイルはそのままでは将来生き残れない可能性もあることを考えなければならない。

はじめに | 第2回〔基本編〕|第3回〔システム編〕第4回〔ツール編〕第5回〔XSLT編〕

2002/11/04 00:00:00


公益社団法人日本印刷技術協会