本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XML・自動化処理・組版

JAGAT主催関連セミナーはこちら

 SGMLとHTML
 人間が文書を読むときには,書体や文字サイズ,レイアウト,内容などから,どれが文書のタイトルで,著者は誰で,要約はどれかなどを判断することができる。しかしコンピュータは,書体や文字サイズなどの体裁では,どれがタイトルで,どれが著者名か判断することができない。
 コンピュータを用いた情報の交換,共有,再利用のためには,コンピュータで判断できる文書形式が必要である。このようなことから,ISOでは文書の体裁は別に指定することにして,文書の構造,意味,内容を記述するSGML(Standard Generalized Markup Language)を1986年に規格化した。
 しかしながら,このSGMLは,文書処理の中でも特定の分野(例えば技術文書,学術論文,法令集,マニュアル,技術ジャーナルなど)以外に,なかなか利用分野を広げることができなかった。その理由には,機能の複雑さ,文書型定義設計の難しさ,タグ付けの煩わしさ,対応アプリケーション不足などいろいろなことが挙げられよう。

 そのような状況の中で,CERN(欧州合同素粒子原子核研究機構)のTim Berners-Lee氏が所内の論文閲覧システムとして,シンプルなWebブラウザとSGMLを応用して作られたHTML(HyperText Markup Language)を使用したWorld Wide Webを1990年に開発した。
 SGMLがなかなか利用分野を広げられない中で,HTMLはSGMLと同じようにタグ付けの煩わしさを持つにもかかわらず,文書間のリンク機能の便利さや,その後開発されたグラフィカルな表示機能を持つWebブラウザなどによって,瞬く間に世界を席巻するとともに,インターネットを利用した情報交換を急速に広めた。

 XMLの登場
 1996年11月米国ボストンで開かれたSGML’96コンファレンスでドラフトが公表されたXML(Extensible Markup Language)は,そのわずか1年3ヶ月後の1998年2月にW3C(World Wide Web Consortium)の勧告となった。
 インターネットでの情報活用や情報交換をより一層活発にするために,W3C内のワーキンググループが検討を開始してから2年足らずで勧告になるという短期間の開発だった。これほど短期間で勧告となったのは,既にISOの規格となっていたSGMLがベースであったことも要因であろう。
 しかし,インターネットでHTMLを利用したWebが普及し,ドキュメント情報の発信・閲覧だけではなく,B to B や B to C 等の電子商取引などへの広がりを見せるとともに,HTMLの限界が問題となりインターネットによる情報活用をより活発に行うことが出来るメタ言語の開発が待たれていたことも見逃せない。

 HTMLの限界
 HTMLでは,使用できるタグが決められており,かつ表示体裁を重視したものである。書籍リストの例を表1に示す。

   表 1  書籍リスト
プリンターズサークル (社)日本印刷技術協会
印刷雑誌 (株)印刷学会出版部

 この表1は,図1のようにHTMLでタグ付けされている。

  図 1  HTMLによるタグ付け例
    <TABLE BORDER="1">
     <TR>
      <TD>プリンターズサークル</TD>
      <TD>(社)日本印刷技術協会</TD>
     </TR>
     <TR>
      <TD>印刷雑誌</TD>
      <TD>(株)印刷学会出版部</TD>
     </TR>
    </TABLE>

 人間は,表1の表示を見て書名か出版社名かを判断することができる。しかし,HTMLのタグ付けデータでは,図1のように個々のセルに入るデータを<TD>と</TD>で括るだけである。したがって,タグ付けデータだけを見て,どれが書名で,どれが出版社名なのかをプログラムで判断することはできない。
 もし,セルの出現する順番で判断するプログラムを作成した場合には,書名の後に著者名などのセルが追加されるとプログラムを変更しなくてはならない。電子商取引など,コンピュータとコンピュータが会話することによる自動処理を目指す分野で,新たなメタ言語を望んだゆえんである。

 そこに登場したメタ言語がXMLであった。

  図 2  XMLによるタグ付け例
    <Booklist>
     <Book>
      <title>プリンターズサークル</title>
      <publisher>(社)日本印刷技術協会</publisher>
     </Book>
     <Book>
      <title>印刷雑誌</title>
      <publisher>(株)印刷学会出版部</publisher>
     </Book>
    </Booklist>

 図2のタグ付テキストは,表1のデータ部をXMLで記述した例である。
 このようなXMLデータであれば,タグによって<title>〜</title>が書名で,<publisher>〜</publisher>が出版社名であるとプログラムで判断し,各種のアクションを起こすことができる。

 データ処理分野で注目
 XMLがSGML’96で登場したことからも分かるように,HTMLとWebに刺激されたXMLの開発者たちは,文書処理分野で使用するためにXMLを開発したはずである。
 しかしながらXMLは,

ことなどから,文書処理分野もさることながら,コンピュータによる自動処理を考えていたデータ処理分野に,大きなインパクトを与えた。
 それまで,データ処理分野では標準的なデータ表現手法がなく,個別対応を余儀なくされていた。そこにデータの意味や階層構造を表現できるXMLが登場し,一気に注目を集め情報処理関連のあらゆる分野の関係者に,インターネットをより高度に活用する道を提供した。

 その結果,IT(Information Technology:情報技術)をベースとした企業間ビジネスの推進,業務プロセスの標準化や自動化,異機種情報システム間のデータ交換などXMLをベースにした情報システムの構築が進められた。
 また,各種業界や団体では,ビジネス上のプロセスやデータをお互いに交換・共有・再利用するために,XMLというメタ言語を使って自らの言語(データ形式や表現形式)を作成するようになった。
 例えば,2000年12月にデジタル放送が開始された放送業界,iモードに代表される通信業界,世界的規模でニュース配信を行っている通信社や新聞業界,有価証券報告書等のビジネスレポート制作業界や公認会計士団体,電子カルテや診療情報などの交換を目指す医療関係団体,位置情報や地図情報交換に関わる業界,繊維産業のEDIを目指すアパレル業界,建設業界,電子出版業界などである。

 このようなXMLの利用は産業界ばかりでなく,e-Japan重点計画に基づき2003年度の電子政府実現を目指す中央省庁や,都道府県・政令指定都市などの自治体でも急速に進められている。
 例えば,行政サービスの向上や行政内部の効率化などを目指した「インターネットによる各種届出や申請の電子化」では,2001年8月にXMLを使用する汎用受付等システムの基本的な仕様が決められた。
 この仕様では,申請書のXML化はもちろんのこと,その申請書類を入れる電子申請文書パッケージ(いわゆる電子封筒)の申請者情報,宛名,申請内容等の記述もXMLである。現在この仕様に基づく電子申請システムが各省庁や自治体で構築されつつあり,経済産業省,総務省などのように既に稼働を開始しているところや,実証実験などを開始している自治体もある。
 国土交通省では,建設CALS/ECにおける公共事業成果物のXMLによる電子納品,観光情報の収集とカーナビ・携帯電話・携帯端末・Webへの提供をXMLで自動化する実証実験などを開始している。

 XML文書の閲覧
 タグ付きのテキストデータであるXML文書は,コンピュータによる自動処理にとっては都合がよい。人間が,その内容をテキストエディタで確認することも,もちろん可能である。しかし人間が閲覧するためには,図2のようなタグ付きテキストより,表1の体裁付き表示のほうが適していることは明らかである。

 この体裁付けの指定に使用するのがXSL(Extensible Stylesheet Language)で,2001年10月にW3Cの勧告となった。このXSLの勧告より一足先に,XSLの一部をなしているXML文書の変換部分が,XSLT(XSL Transformations)として1999年11月にW3Cの勧告となった。
 XSLTは,スタイルシートの記述にしたがって,XML文書を別のXML文書に変換するものである。XSLTの勧告が急がれたのは,この変換機能を使用してXML文書をWebブラウザで閲覧するためである。マイクロソフトのIE 5.0以降にはXSLTプロセッサが組み込まれており,スタイルシートを用いてXML文書をHTMLに変換して表示することができる。

 XML文書のパブリッシングツール
 XSLTプロセッサとスタイルシートを用いてXML文書をXSL-FO(XSL Formatting Objects)に変換し,そのXSL-FOをレイアウトし画面表示・印刷・PDF化することができるXML組版エンジン「XML Formatter」が,アンテナハウスから販売されている。同社には,サーバ上でXML文書のレイアウト結果をPDF出力する製品「PDFネイティブ出力エンジン」もある。

 XMLのタグによる意味情報や構造化を利用して,文書の作成・管理や,自動組版によるクロスメディア・パブリッシングなどをサポートする製品もある。
 シンプルプロダクツは,XMLネイティブDBエンジンを搭載したXML自動組版エンジン「XML Automagic」を販売している。自動組版は,組版対象要素とその組版順序,対象要素相互の位置関係,詳細な組版体裁などを対話形式で指定して作成した自動組テンプレートを使用して行われる。したがって,スタイルシートを記述する必要はない。また,目次自動抽出,ツメ自動発生,脚注組版,画像最適配置,参照ページ自動入手などの機能も持っている。

 XML Automagicに搭載されたXMLネイティブDBエンジンは,メディアフュージョンの「Yggdrasill」である。この製品は,リレーショナルデータベースなどのようなデータベーススキーマの定義を必要とせず,XML文書の要素定義やツリー構造を保持したままで格納・管理・抽出することができる。

 日立ソフトウェアエンジニアリングのXMLドキュメント制作システム「Enterprise Publisher」は,ドキュメントファイルサーバ,検索用データベースサーバ,制作クライアントなどで構成される。制作クライアントはEnterprise Publisherソフトを使用し,タグ付けなどを意識せずに,スタイルシートを用いて画面で表示確認しながら,ドキュメント編集,XML文書の生成などを行うことができる。

 ケイ・ジー・ティーのクロスメディア・パブリッシング・ソフトウェア「Object Publisher」は,既存のデータベース上の素材を制御するドキュメント素材管理システム,デザインルールに基づく自動組版などを行うページレイアウト管理システム,PDFやHTML生成を制御する出力系管理システムを基本パッケージとしている。同社では,このソフトについて印刷業向けのセミナーを企画している。

 DTPソフトや編集ソフトの中にも,XML文書の取り込み,書き出し機能をサポートしたものがある。
 住友金属システムソリューションズの高機能ページレイアウトシステム「SMI EDIAN WING」と,ページレイアウトソフト「SMI EDICOLOR」の最新版では,XML形式によるデータ書き出し機能が追加された。

 グラフィックアーツビジネスでは上記のような制作面以外に,ネットワーク時代に対応した受発注やワークフローまでの標準化が関連し始めている。また,クライアントのサプライチェーンマネージメントへの対応も要求されてきている。これらの動きは,いずれもXMLをベースとしたものである。
 このように,XMLは情報交換や情報活用等における汎用のインターフェースの地位を確立し,身近にあるアプリケーション(例えば,マイクロソフトのIE,Excel,Access等)もXMLを扱えるようになった。XMLは要素技術から利用技術へとステップアップし,その応用範囲をさらに広げようとしている。

▽お問い合わせ先
定型レイアウトでの印刷やデザイン性の高い印刷を自動化するソフトウェア
「Object Publisher」
  (株)ケイ・ジー・ティー

専門知識がなくてもだいじょうぶXMLドキュメント製作システム
「Enterprise Publisher」
  日立ソフトウェアエンジニアリング(株)

XMLのレイアウトと印刷に最適!W3C勧告(2001/10/15)に準拠の組版エンジン
「XSL Formatter V2」
  アンテナハウス(株)

あらゆるコンテンツのクロスメディア化を支援する高機能ページレイアウトシステム
「SMI EDIAN WING 2.0」
  (株)住友金属システムソリューションズ

XMLデータベースエンジン搭載したプロ用XML自動組版システム
「XML Automagic」
  (株)シンプルプロダクツ

■出典:JAGAT発行 プリンターズサークル 2002年5月号

[JAGAT主催関連セミナー]

  [1]XMLデータベースエンジンの活用と自動組版 開催日時:2002年5月7日(火)14:00〜16:00
  [2]4日間でわかるXML入門 開催日:2002年5月21日(火)〜24日(金)
  [3]XML提案編(3日間) 開催日:2002年6月26日(水)〜28日(金)
  [4]XML自由自在(実技)−コンバート編(2日間) 開催日:2002年7月17日(水)〜18日(木)
  [5]XML自由自在(実技)−データベース編(1日間/コンバート編のオプション講習) 開催日:2002年7月19日(金)
  [6]XML自由自在(実技)−変換・出力編(2日間) 開催日:2002年7月22日(月)〜23日(火)

2002/05/07 00:00:00


公益社団法人日本印刷技術協会