本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

XMLパブリッシングのための出版標準フォーマットへの取り組み

凸版印刷株式会社 情報・出版事業本部
技術開発本部ソリューション開発部 鎗田和夫
はじめに
インターネットの発達により、ネットワーク全体が大きな一つのデータベースになりつつある。ブロードバンド時代に対応するためには、データベース上の情報を、いつでも、誰でも、どこからでも取り出せ、利用できることが重要である。そのためには、データベース上の情報表現ルールが統一されていることが望ましい。XMLの利用が各分野において非常な勢いで拡大している最大の理由である。
出版分野においても、XMLの利用は広がっている。XMLを利用することにより、「コンテンツ」「文書構造」「文書体裁」を分離して持つことが可能となる。データベースに蓄積し一元管理による資産管理が容易になるとともに、検索性の向上、多メディアへの展開、処理の効率化、時間短縮、コスト削減、正確性向上などが可能となる。

市販組版システムの現状
市販組版システムもXML対応のものが数多く出てきた。ネイティブXMLデータベースと連動し、コンテンツ管理を容易にし、自動組版による処理の効率化、時間短縮、多メディアへの展開などが実現されている。
しかしながら、各システムは、従来の組版システムを活かした内部フォーマットを利用しており、コンテンツ受け渡しには変換プログラムが必要となり、データ流通という面から見ると問題がある。またエディタが弱く、複数ページにまたがる赤字修正システムは少ない。

凸版印刷の対応
凸版印刷が考える理想のモデルは、図1のメディア対応のXMLパブリッシングに示すように、入力から出力まで、いかなる出力媒体に対しても、XMLを中心とした運用が行えることである。その中心となるのは、データ展開が容易に行える標準フォーマットによるXMLデータベースである。入力系は、紙からの新規入力によるXML化、CTS、DTPからの変換、スキーマの異なる外部データの取り込みなどを考えている。
出力系は、組版システム経由で、書籍印刷、オンデマンド印刷、PDF出力の他、Web展開、CD-ROM、DVDなどのパッケージ展開、電子書籍などへスタイルシートを介して展開しており、最近はeラーニングへの展開も出てきている。


▲図1 メディア対応のXMLパブリッシング

出版標準フォーマット
現在、出版業界におけるXMLの標準フォーマットは存在しない。XML対応の組版システムが各社より市販されているが、利用しているフォーマットは独自である。電子出版関係では日本電子出版協会のJepaXがあるが、活発に利用されているとは言いがたい。一般書籍印刷用には不足している要素があり、印刷会社で不足分を追加する必要がある。
他システムで作成されたデータを利用する場合には、そのシステムごとの変換アプリケーションを作り対応することになる。よって、できるだけ早く業界の出版標準フォーマットが決定され、負荷なくデータ流通がなされることが望ましい。
凸版印刷では、出版コンテンツに対しアクセス性はもちろんの事、正確性、拡張性などに加え、社内での展開性、及び業界のガイドラインとして利用することも考慮し、出版標準フォーマットを作成した。これは既存の標準フォーマットと互換性が取れるように考慮し、作成している。具体的には、JepaXをベースに、JIS X 4052 「日本語文書の組版指定交換形式」、OEB1.0、HTML4.0などを参照している。
対象はJIS X 4052と同等な、一般書籍、学術論文集など、編、章、節、項、段落、見出し、といった文書構造や、表現体裁がパターン化できるものに限定している。将来的には各種分野に対応していくことを考えている。
このフォーマットは、コンテンツの論理構造と、スタイル指示の分離に努めている。スタイル指示は、利用目的に応じスタイルシートにて対応することを前提にしている。
要素数は、論理構造要素、ブロック要素、インライン要素合わせて102種類ある。
他の出版関連仕様と比較して強い所は、日本語文書の論理構造単位をJepaXの26から47種類と細分化している点や、配列処理機能を「読み50音順」「姓名+読み50音順」「読み50音順+画数」「電話帳配列」など、いろいろなバリエーションに対応可能なように高めてあるなど数多くある。
この出版標準フォーマットは概ね完成しており、現在は実際の業務に適用した現場での検証フェーズであり、その有効性や合理性を確認中である。検証がまとまった段階で、多方面から評価してもらう意味でもフォーマットはオープン化したいと考えている。

課題
運用における課題は、必ずXMLデータを直すというデータ更新サイクルを作りあげることである。その鍵は出力ゲラなど出力メディアでの確認方法と、XMLエディタの使い勝手である。赤字ゲラの修正箇所を、元のXML上での特定と修正が、いかに簡単にできるかが、出版系のXMLエディタにおける重要項目である。現状この要望にこたえられるXMLエディタは存在せず、社内開発を含め検討している。
また、現在のフォーマットは、辞典、事典系をはじめ、まだ対応していない部分も多くあり、今後詰めて行く必要がある。

■関連イベント
PAGR2003 クロスメディアトラック
 B6「XMLをベースにした出版制作」では凸版印刷 鎗田氏,大日本印刷 前川氏がスピーカーとして参加されます。
PAGE2003 XML Publishing ZONE

2003/01/14 00:00:00


公益社団法人日本印刷技術協会