本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XMLをベースにした出版制作

出版物はDTP化が進んだものの,コンテンツのデジタル資産化や効率的な管理運用,多メディア出力など,重要な課題がまだ残されている。この解決法としてXML技術が注目されている。その中で,業界のリーダーである大日本印刷と凸版印刷では,独自の高い技術によるXMLパブリッシングの標準化や制作フロー作りを着実に進めている。

 PAGE2003コンファレンス クロスメディア・トラック「XMLをベースにした出版制作」セッションでは,大日本印刷と凸版印刷の,各々のXMLパブリッシングへのアプローチについて伺い,目前に迫ったXMLパブリッシングのあり方について探るものとなった。

XMLをベースにした出版制作
 イースト 常務取締役 下川和男氏(モデレータ)

 XMLには,大きく二つの用途がある。一つは文書構造の記述であり,構造記述言語としてのSGMLの延長にあり,一般的にXMLドキュメントと呼ばれている。もう一つは,データ構造の記述でコンピュータとコンピュータがデータ交換をおこなうためのもので,電子部品マーケットのRosettanetや財務諸表のXBRLなどがある。
 また,各社のアプリケーションも,着々とXML対応をすすめている。MicrosoftのOffice XP,Excel,Accessも内部的にはXML対応されており,近々には直接XMLを扱うことが出来るようになるだろう。

 XMLドキュメントの規格としては,2000年に財務省印刷局による官報プロジェクトの際に官報DTDが策定された。他に,新聞の国際規格のNewsML,米国のOpen eBook,日本電子出版協会のJepaXなどがある。
 XMLの弱点として,大量文書の検索が困難,編集ツールの不足,DTPツールとの相性が良くないなどが指摘されていたが,2003年には対応したツールが出揃うだろう。
Webサービスの機能も充実しつつある。コンピュータが別のコンピュータにSOAPというXMLを使った手順にしたがって指令を送ると,相手方のコンピュータ内部で自立した処理をおこなうことが出来るものである。イーストでは,これを応用して,小学館,自由国民社,日経BP社の複数の辞書サーバを串刺し検索する仕組みを開発した。
また,辞書の構造をXML化したDicXは,オープンなフォーマットだが三省堂,小学館の辞書で採用されている。
 このように多方面でXMLを利用する環境が整いつつある。出版社は,電子書籍,オンデマンド印刷,Webページなどの展開を睨んで,自社のすべての出版物をXMLデータとして保管・管理すべきだろう。

大日本印刷におけるXMLパブリッシングへの取組み
 大日本印刷 C&I事業部 IT開発センター 前川真二氏

 インターネット書店や電子書籍ダウンロードサービスなど,出版物の流通形態が変化している。大日本印刷でも販売面では,「専門書の杜」や「ウェブの書斎」といった自社の出版系販売サイトを構築,運営している。製造面では,DTP工程からのデータ流用による,オンデマンドブックとT-Time形式など電子書籍の制作の同時進行を実現している。
 DTPから電子書籍へ変換には,電子書籍フォーマットの多様化やレイアウト変更による販売展開に対応することを目的に,中間フォーマットとしてXMLを採用し,運用している。

 電子書籍を制作するにあたっては,DTPにて編集・出力したゲラにて得意先校正を実施し,文字校正完了後の完全データをプログラム処理によって電子書籍データに変換している。こうすることで,印刷物を制作する際と全く同じ作業にて編集者の校正が可能となる。さらに,DTPデータはそのままオンデマンドブック製造工程で利用できる。

 DTPからT-Timeなどの電子書籍へ変換する場合,表現力に違いがある。また,電子書籍には目次と本文のリンクなどの機能もあり,すべてプログラム処理のみで自動変換できるわけではない。そこで,変換過程でのマニュアル編集をゼロにするのではなく,その作業負荷をいかに低くするか,また複数の電子書籍フォーマットに対応できることを前提に変換方法を検討した。その結果,変換の中間段階で一定レベルのレイアウト情報を含んだオリジナルXML形式のデータを生成し,スタイルシートにて電子書籍フォーマットへ変換する方法を構築することとなった。

 この方法により,スタイルシートの変更のみでさまざまな電子書籍フォーマットやJepaXなどに容易に変換することが可能となった。また,オリジナルXMLのレイアウト情報部分を画面上で確認しながら編集できるツールを開発し,XMLや電子書籍フォーマットに関するに知識を持っていなくても,簡単な指示に基づいて電子書籍のレイアウト変更がおこなえるような工程を実現した。

   また,大日本印刷が有する秀英体の資産を活用し,DTP編集,電子書籍製作,オンデマンドブック製造,ユーザー側パソコンの全ての環境において,豊富な外字が表示できるような体制も整えている。
 このように電子書籍を制作する工程において,データフォーマットの交換の効率化,拡張性の視点からXMLとスタイルシートによる変換を採用し,既存印刷物製作の資産を十分生かした形で,新しい出版コンテンツの制作および流通に繋げる取組みを実施している。

XMLパブリッシングのための出版標準フォーマットへの取り組み
 凸版印刷 情報・出版事業本部ソリューション開発部 部長 鎗田和夫氏

 凸版印刷では,出版制作において,いかなる出力媒体に対しても,XMLを中心とした運用が行えることを目指している。それは,出版物の標準フォーマットとして,XMLデータベースを作成することである。XMLデータベースへの入力は,紙からの新規入力によるXML化,CTS,DTPからの変換,スキーマの異なる外部データの取り込みなどを考えている。XMLデータベースからの出力は,組版システム経由での書籍印刷,オンデマンド印刷,PDF出力の他,Web展開,CD-ROM,DVDなどのパッケージ展開,電子書籍などへスタイルシートを介して展開,またeラーニングへ展開することもある。
 出版業界には,現在XMLの標準フォーマットは存在しない。XML対応の組版システムがいくつか市販されているが,保存形式は独自のフォーマットになっている。電子出版関係では日本電子出版協会のJepaXがあるが,一般書籍印刷用には不足している要素があり,活発に利用されているとは言いがたい。

 凸版印刷では,出版コンテンツに対しアクセス性,正確性,拡張性などに加え,社内での展開,及び業界のガイドラインとして利用することも考慮し,出版標準フォーマットを作成した。これは既存の標準フォーマットとの互換性も考慮したものとなっている。具体的にはJepaXをベースに,JIS X 4052 「日本語文書の組版指定交換形式」,OEB1.0,HTML4.0などを参照している。
対象はJIS X 4052と同等な,一般書籍,学術論文集など,編,章,節,項,段落,見出し,といった文書構造や,表現体裁がパターン化できるものに限定している。将来的には各種分野に対応していくことを考えている。

 このフォーマットは,コンテンツの論理構造と,スタイル指示の分離に努めている。スタイル指示は,利用目的に応じスタイルシートにて対応することを前提にしている。要素数は,論理構造要素,ブロック要素,インライン要素合わせて102種類ある。他の出版関連仕様と比較して強い所は,日本語文書の論理構造単位をJepaXの26から47種類と細分化している点や,配列処理機能を「読み50音順」「姓名+読み50音順」「読み50音順+画数」「電話帳配列」など,いろいろなバリエーションに対応可能なように高めてあるなど数多くある。
 この出版標準フォーマットは概ね完成しており,現在は社内での業務に適用した検証フェーズであり,その有効性や合理性を確認中である。検証がまとまった段階で,多方面から評価してもらう意味でもフォーマットはオープン化したいと考えている。

 運用における課題は,必ずXMLデータを直すというデータ更新サイクルを作りあげることである。その鍵は出力ゲラなど出力メディアでの確認方法と,XMLエディタの使い勝手である。赤字ゲラの修正箇所を,元のXML上での特定と修正が,いかに簡単にできるかが,出版系のXMLエディタにおける重要項目である。現状この要望にこたえられるXMLエディタは存在せず,社内開発を含め検討している。
 また,現在のフォーマットは,辞典,事典系をはじめ,まだ対応していない部分も多くあり,今後詰めて行く必要がある。

2003/03/11 00:00:00


公益社団法人日本印刷技術協会