本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

Office2003によるコンテンツのXML化

ドキュメントをXMLデータ化したり,XMLデータベース構築の開発コストや導入期間の長さは,XML活用の障壁になっていた。マイクロソフト Office2003では,XML対応機能が強化された。WordやExcelでXMLデータが扱えることにより,どのような活用法があるのか。
PAGE2004コンファレンス・グラフィックストラック【B3】セッションでは「Office2003によるコンテンツのXML化」をテーマに,
 ■トライデントシステム 鶴岡仁志氏
 ■デジタルコミュニケーションズ 福重青史氏
からお話を伺った。

Office2003によるコンテンツのXML化

■近い将来のXMLの位置付けとして,以下のことが予想される。
1.インターネット上のすべての情報がXMLになること。したがって,インターネットを利用するアプリケーションもXML対応となる。
2.元々文書を扱うための技術であるXMLは,主にデータ処理のために使われるようになる。
3.すべてのデータベースソフトが,XMLを扱えるようになる。アプリケーションは独自のファイル形式ではなくXMLで保存するようになる。
4.XMLは,裏方の技術としてその存在を誰も気にしないようになる。

■プラットフォームの変遷
プラットフォームとは,異なる環境でも同じ動作を保証する仕組みのことである。かつては,ハードウエアそのものを指す時代があり,またOSを指す時代があった。近年は,アプリケーションやWebブラウザを指すことが多い。しかし,Webブラウザも各社によって違いがあり,Windows/Macでもいろいろと問題があり,万能ではない。
今後,ポストWebブラウザの時代のプラットフォームは何であるかは分からない。マイクロソフトは,「これからはリッチクライアントの時代だ」と言っている。フロントエンドに高機能なアプリケーションがあれば,ネットワーク上をやり取りするデータを最小にすることができる。要するに,Officeを広めたいという思惑だろう。

■マイクロソフト社の新Office戦略と各アプリケーションのXML対応
マイクロソフト社が目指しているのは,Officeを業務システムのプラットフォームにすることである。新機能の多くは,Officeを汎用的なプラットフォームとするためものである。

1.Access 2003
Access2003は,W3Cの標準のスキーマ言語(XMLスキーマ)に対応した。また,AccessからXMLデータをエクスポートする際に,XSLT変換することができる。また,XMLデータをインポートする際にもXSLT変換することができる。

2.Info Path 2003
新たにOffice(エンタープライズ版)に加えられた,XMLデータを入力するためのフォーム・ツールである。従来は,Visual BasicやWebブラウザでCGI,ASPを使うなどして入力フォームを設定していた。このツールは,非常に簡単にプログラミングなし,画面操作だけでフォームを設定することができる。スキーマ定義が既に出来ている場合は,さらに簡単にフォームが設定できる。
フォームを使って入力されたデータは,XML文書としてサーバに送ることができる。各フィールドにはデータ型を指定できるため,フォーム上だけでチェックが可能になる。W3Cでも,フォーム入力の仕様をXFormsとして標準化を進めていたが,ワーキングドラフトの段階であり,マイクロソフトは独自の製品として先行してしまった。
出来上がったフォームから,XSD(XMLスキーマ,またはDTD)を自動生成することもできる。SQL-ServerやWebサービスのフロントエンドにすることも簡単にできる。

3.Word 2003
Word2003では,直接XMLデータを書き出すことができるようになった。また,自社の独自のスキーマをライセンスフリーで公開している。このことにより,他社のアプリケーションでも,Word上での見映え(体裁)を保証しつつ,XMLのデータを作成することができる。また,Wordの文書をXML経由で,他社のアプリケーションで開くこともなど,やりとりが可能になる。Word文書が,ハブテキストとしての可能性をもつことになる。その他,XMLエディターとして使用しすることも可能になっている。

4.Excel 2003
任意のスキーマが取り込めること,またExcel上のデータをXML要素に関連付けすることができる。

Word2003のXML機能を検証する

■デジタルコミュニケーションズが取り組んできたビジネス
XMLコンテンツ制作サービス,XMLコンテンツ制作支援ツール,XMLコンテンツ管理ツールやソリューションの開発,XMLコンテンツ制作やドキュメントの電子化に伴うコンサルタント業務を手掛けてきた。
近年は,WordをXMLエディタとして活用して,XMLデータを生成するソリューションなどの実績が多い。XMLはスタイル情報を切り離したものではなく,必要に応じてスタイル情報を分離することで,効率的に利用することもできる。このようなアプローチで,Word→XML→Word(あるいは,Quark・InDesign)を双方向にやり取りできるシステムを構築してきた。

■Word2003のXML機能
Word2003では,XMLファイル(WordML形式:WordのためのXMLスキーマ)としてドキュメントを保存できる。Word文書をXMLデータで保存しても,ドキュメントの特性を保持したままなので,Word文書として再編集することができる。WordML形式で保存されたデータをInternet Explorerで開くと,元のWord文書の体裁が再現される。またDTD,XMLスキーマがなくても,XMLデータを作成することができる。
XMLエディタとしても,利用効果が高いと思われる。ただし,本格的な検証はまだなので,最も効率的かどうかは断言できない。従来はXMLデータに変換するのがたいへんで,データ変換をビジネスとしていたが,ユーザ自身がXMLデータを作成できるようになる。

■XSD(スキーマ)を組み込む方法
空のWordファイルで,スキーマファイルを登録し,スキーマのタグと要素を関連付けする。この作業は,他のエディタでも同じである。Wordのスタイルを定義しておき,文章にスタイルを適用することで,XML要素と文章の関連付けがおこなえる。

■論文審査システムの例
大学・研究所・学会・団体向けに,論文審査システムを構築した。Wordテンプレートを使って論文を作成してもらい,Web投稿をする。受け取った管理者は,XML変換して登録する。電子メールによるやり取りで,審査・校正作業の繰り返しと履歴を管理し,論文承認後にXMLデータを利用して公開・出版するソリューションである。
Word2000をベースに構築したが,Word2003が発売されたことで,より効果的な部分と,不足する機能がある。
Word2000の場合,Word文書からXMLファイルにするには,コンバータが必要であった。またスタイル名が固定であったため,変更する必要があった。Word2003の場合はスタイル名変更可能で,コンバータは不要になった。

Word2003になっても足りない機能で,われわれが用意している支援ツールとして以下のものがある。作成されたWord文書が正しくスタイル設定されているかどうかは分からない。スタイルの自動チェック,自動修正マクロを用意している。また,その他にWordでのXML文書用に開発したマクロには,記号挿入支援,2バイトチェック,ブックマークチェック,パーレンチェック,文字種変換,選択文字上下ルビ設定,選択文字上下罫線設定などがある。

印刷業としてOfficeとXMLに取り組む

Office製品では,ユーザがXMLを意識しなくても良い環境が整ってきた。一般のユーザにとっては,特にXML技術がいらない時代となりつつある。
しかしデジタルコンテンツのプロとしてXMLを扱うには,文書の構造化と文書モデルの構築という概念を理解し,XML/SGMLの利用技術に習熟する必要がある。

2004/03/09 00:00:00


公益社団法人日本印刷技術協会