本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

Office2003によるコンテンツのXML化

ドキュメントをXML化したり,XMLデータベースを構築するには,入力ツールやエディタのカスタマイズが必要で,XML活用の障壁となっていた。Microsoft Office2003では,これらの問題を解決すべく,XML対応機能が大幅に強化された。WordやExcel等でXMLが扱えることにより,どのような活用法があるのか。PAGE2004コンファレンスでは「Office2003によるコンテンツのXML化」をテーマに,トライデントシステムの代表取締役,鶴岡仁志氏にお話を伺った。

XMLに関する近い将来の予想

1.インターネット上のすべての情報がXMLになる。したがって,インターネットを利用するアプリケーションもXML対応となる。
2.元々文書を扱うための技術であるXMLは,主にデータ処理のために使われるようになる。
3.すべてのデータベースソフトが,XMLを扱えるようになる。アプリケーションは独自のファイル形式ではなくXMLで保存するようになる。
4.XMLは,裏方の技術としてその存在を誰も気にしないようになる。

Office2003では,特に3.4が実現しつつある。

印刷業にとってのXMLの重要性

今までの印刷業は,情報を加工し最終的に紙の見映えでその腕が測られていた。これからの情報の価値は,加工途中の形態も重要である。管理しやすいか,検索しやすいか,加工しやすいか,さまざまなメディアに対応しやすいかによって情報の資産価値が判断される。したがってその価値を高めるには,XMLを使うことが必要になってくる。
今までの印刷業では,紙のページ単価で対価をもらい,デジタルの部分はおまけで納入することも多かったが,データの形で対価をもらうサービスモデルに変えることが必要である。そのとき,XMLの形にしておくことで,顧客に価値を認めてもらえる。

アプリケーションが進化し,XMLが裏方に回っても,情報の資産価値を高める立場にいるプロとして,印刷業はその中身を知っているべきであり,XMLをきちんと扱えなければならない。
XMLはプレーンテキストにタグをつけることにより,データにさまざまな意味を付加することができる。このタグ付けされたデータに,XMLの関連規格を使って外部から構造を指定したり,レイアウト情報を指定したり,組版情報を指定したりすることができる。さらに,構造をたどって特定の部分を指定したり,リンクしたり,構造の一部を切り出したり変換したりする機能がある。また,外部のアプリケーションから構造を操作するAPIも備えており,検索,変換の処理に利用できる。

たとえば,Webブラウザ上で条件を指定して,内容の絞込・検索を行ったり,SORTや合計計算などをおこなうには,今まではバックエンドのRDBサーバで検索を行い,その結果を表示するCGIを書くか,JavaやJavaScriptを使ってプログラミングする方法がおこなわれている。しかし,XMLでデータが管理されていれば,XSLTを使ってWebブラウザだけ,つまりノンプログラミングで実現できるようになる。
また,XSL-FOは印刷業のメインビジネスとなる技術だろう。多くのアプリケーションがサポートすればハブフォーマットになる可能性がある。ハブというのは,たとえばWordで入力した文書をXML形式(XML+XSD+XSLT+XSLFO+CSS)で書き出し,それをQuarkXPressやInDesignで開いて編集できると言うことであり,XMLでも見映え保証が可能な時代となっている。

マイクロソフト社の新Office戦略

プラットフォームとは異なる環境でも同じ動作を保証する仕組みを指す。かつてはハードウエアを指す時代があり,またOSを指す時代,アプリケーションを指す時代もあった。現在では,Webブラウザを指すことが多い。Webブラウザとさまざまなプラグインがあれば,何でも表示できる時代になってきた。しかし,Webブラウザも各社によって,またOSによっても違いがあり,万能ではない。マイクロソフト社が目指しているのは,Officeを業務システムのプラットフォームにすることである。新機能の多くは,Officeをクライアントのフロントになる戦略を打ち出している。そしてバックエンドにデータベースが繋がったネットワーク環境を想定している。そのため新OfficeのことをOfficeSystemと呼んで,サーバとクライアントの両方がセットになって機能するものだと位置付けている。

各アプリケーションのXML対応

(1)Access 2003
ACCESS 2003で強化されたポイントは2つある。1つは,XSDというW3C勧告のXMLスキーマを採用していることである。もう1つは,入力時にXSLTで変換して受け取ったり,出力したデータをXSLTで加工して渡すなど,さまざまな変換がXSLTの機能を使ってできるようになり可搬性が向上したことである。

(2)InfoPath 2003
新たにOffice(エンタープライズ版)に加えられた,XMLデータを入力するためのフォーム作成ツールである。従来は,Visual BasicやWebブラウザでCGI,ASPを使うなどして入力フォームを作成していた。このツールは,非常に簡単にプログラミングなし,画面操作だけでフォームを作成することができる。スキーマ定義が既に出来ている場合は,さらに簡単にフォームが作成できる。
フォームを使って入力されたデータは,XML文書としてサーバに送ることができる。各フィールドにはデータ型を指定できるため,フォーム上だけでチェックが可能になる。W3Cでも,フォーム入力の仕様をXFormsとして標準化を進めていたが,ワーキングドラフトの段階であり,マイクロソフトは独自の製品として先行してしまった。
出来上がったフォームから,XSD(XMLスキーマ,またはDTD)を自動生成することもできる。SQL-ServerやWebサービスのフロントエンドにすることも簡単にできる。

(3)Word 2003
Word2003では,直接XMLデータを書き出すことができるようになった。また,自社の独自のスキーマをライセンスフリーで公開している。このことにより,他社のアプリケーションでも,Word上での見映え(体裁)を保証しつつ,XMLのデータを作成することができる。また,Wordの文書をXML経由で他社のアプリケーションで開くことなども可能になる。Word文書が,ハブテキストとしての可能性をもつことになる。その他,XMLエディターとして使用することも可能になっている。

(4)Excel 2003
任意形式のXML文書を出力できるように機能が強化され,また文書内の任意の個所をXML文書の要素に対応付けられるようになった。EXCELは,データベースのフロントエンドとしてだけでなく,さまざまな分野での応用が期待される。

(5)XML対応機能の進化
2003年末,MicrosoftはWord,EXCEL,InfoPathに関して自社の独自スキーマをライセンスフリーで公開した。これを利用すれば,他のアプリケーションもWordとの互換性を高くすることができ,Wordが吐き出すXML文書がDTPのファイル形式としてハブドキュメントとなる可能性がさらに増すことになる。

Microsoftは方向性を間違えずに製品,XML対応機能を進化させており,これからもOfficeに注目すべきである。

「JAGAT Info 6月号より」

2004/06/22 00:00:00


公益社団法人日本印刷技術協会