本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
広辞苑の印刷データと電子辞書データはXMLデータベースから制作された。
***
1998年にW3CによってXMLが規格化されて、10年が過ぎた。
コンテンツをXML化することは、印刷物やデジタルメディアでの活用に適しているだけでなく、将来の陳腐化リスクの少ない方法と言える。
テキスト&グラフィックス研究会では、モリサワの枝本順三郎氏にXML技術を活用して広辞苑などの辞書や書籍出版ソリューションの事例について話を聞いた。
■書籍制作とXML技術
印刷利用という観点からXMLを見ると、XMLでは、見出しだからと言って書体や文字サイズを指定するのではなく、「見出し」というタグで囲む。具体的な体裁ではなく、抽象化することによって文章をデータベース化する技術である。体裁情報を含まないので、2次利用が可能になる。外部から体裁情報を与えることにより、ほかの媒体での利用も可能になる。これらが、印刷分野、特に書籍系でのXMLのメリットである。
タグ付きとはいえ、非常にプレーンなテキスト表現である。特定企業に依存することがなく、長いスパンでの利用を保証できる。書籍の場合、10年、20年という長いスパンでデータの再利用が保証されることは非常に重要である。また、処理ツールが非常に充実しているということも、XMLを採用する一つのポイントである。
一般書籍でのXML利用は、幾つかの試みがあったことは知っているが、うまくいったということは少ない。その原因は、まだ電子書籍の需要自体がしっかりしていなかったところにあるのではないか。
XML化するには、人手やコストが掛かる。電子書籍が見えていないころには、コストを掛けて得られるメリットが薄いということで進まなかった。
逆に言えば、XML化にあまりコストを掛けずに2次、3次利用ができるようになれば、XMLの需要、さらに電子書籍も普及していくだろう。
■XMLとの親和性が高い組版システム
昨今の組版分野では、組版精度や生産性の向上だけでなく、一つのコンテンツをさまざまな形態で提供したいといったデータ流用を望む声も多く聞かれるようになった。このような要望にこたえるべく、2000年にリリースした組版システムがMC-B2である。
MC-B2の特徴は、XML技術に倣いスタイル組版という方式を採用し、タグ付きのテキストデータで画像や数式まで制御できる仕組みを取り入れた。これにより、スタイルを変えるだけで、例えばハードカバーで作成した書籍データを文庫の体裁に置き換えるなど、元のデータに手を加えず、多様な用途に対応させる融通性を実現している。
MC-B2はPostScript環境で大量ページ物の組版、データの2次利用からXMLとの親和性も重視し、開発された。データの2次利用を重視し、内容と体裁の分離というXMLの考え方を採用した。段落単位にスタイルを保持し、入力者に違和感なく、かつ文章構造も維持される内部テキストフォーマットを採用した。内容と体裁の分離により、別のテンプレートに流し込むだけで全く異なる体裁に加工できる。
MC-B2では、インポートするデータ形式とエクスポートしたデータ形式が、全く同じものとなっている。内部のデータ形式自体が、プレーンテキストに近い形式で管理しているため、このようなことが可能となっている。このことは、当初の想定以上に効果を発揮している。当初は、印字しないデータを保持できるメリットを想定していた。コメント扱いにすることで、組版に関係しない情報を内部に保持して、そのまま出力できるということである。しかし、元の形式に戻すことができることで、レイアウト修正し、出力したテキストを元のデータベースに反映することも可能となっている。
■広辞苑の事例
2008年1月に、広辞苑第6版が10年ぶりに改訂され出版された。この作成システムとして利用されたのがMC-B2である。出版元の岩波書店は、広辞苑というデータベースを構築し、そこから電子辞書やCD、DVD、冊子組みのプレビューなどを展開するワンソースマルチユースの実現を目指していた。
例えば、大元はXMLのデータベースだが、編集者や校正者が見るゲラは校閲のために最適化された体裁となっている。辞書ならではの紙面に現れない管理情報なども掲載している。このようなゲラの体裁変更も定義を変更するだけで容易にできたという。
DNPユニプロセスは、広辞苑の製作作業を担当しており、ワンソースマルチユースを実現するためのプログラム開発を行い、MC-B2での自動処理を行った。PCやネットワークを活用することで、順調に作業を行えたという。
(この続きは、Jagat Info 2008.10月号、詳細はテキスト&グラフィックス研究会会報誌 Text & Graphics No.271に掲載しています)
2008年10月