コンテンツをXMLとして記述しスタイルシート技術によって書籍を自動組版する方法には、アプリケーションやシステム環境に依存せず、コンテンツの2次利用が容易など、多くのメリットがある。
テキスト&グラフィックス研究会では、この方法で書籍を出版したアンテナハウスの石野恵一郎氏に、スタイルシート技術による自動組版について話を伺った。
■XSL-FOを使った自動組版
2007年9月に、毎日コミュニケーションズから「Open Office XML Formats入門」という書籍を出版した。表紙のカバー以外、中身は全部XMLで原稿を書き、アンテナハウスのXSL用組版ソフトウエアであるXSL Formatterで組版し、印刷した。
XSL(Extensible Stylesheet Language)とは、標準的なスタイルシート技術のひとつである。
XMLでの自動組版では、元の原稿さえあれば、同じ体裁のページは自動生成するので、同じ体裁のページが多いほどコストは抑えられる。また、システム構築者には、最低限のXML知識は必要である。
組版にはXSL-FO(XSLフォーマッティング・オブジェクト)という形式のXMLを使用するため、原稿のXMLからXSL-FOに変換するためのXSLT(XSL Transformations)という規格も理解する必要がある。
これらのXMLは、W3Cが策定した標準規格であり、誰でも参照することができる。
■書籍の製作過程
原稿をXMLにする必要がある。それぞれの書籍の構造を定義するスキーマを決め、そのスキーマに従ってXMLで原稿を書く。XML Schema、RELAX NGやDTDなどの方式がある。
通常の書籍程度なら、XHTMLで書いても問題ない。原稿をXML化するには、オーサリングツールを使用する場合もあるが、人によってテキストエディタで書くほうが早いこともある。画像類は高解像度が要求されるため、SVGとかMathMLに変換して使用している。
XMLができると、次にXSLTを作る。XSLT は、原稿 XML を XSL-FO に変換するために使用するスタイルシートである。構造化された文書でしかないXML に、ページレイアウトのための情報を与えるものである。HTMLに対するCSS と、ほぼ同じ役割である。
スタイルシートは、同じ体裁なら1個作れば使い回しができる。スタイルシートを変えるだけで、出来上がりの体裁を変えることができる。また、XSLTの重要な役割として、元原稿にない情報を付け加えることができる。目次や索引、柱、ノンブルなどは、XSLTが原稿から自動的に生成することができる。
本文と目次・索引部分が完成すると、組版してPDFを出力する。間違いがあれば、原稿を直し、また組版してPDFを出力する。これを繰り返す。時には、XSLTを修正することもある。完成したら、印刷して出版というフローとなる。
■日本語組版の問題とW3Cへの提言
XSL-FOでは約物の詰めを設定することや起こし食い込み、ぶら下げなどの機能もない。禁則処理はUnicodeの仕様で規定されているが、それだけでは完全ではない。また、和欧文字間空白という概念もない。そのため、XSL Formatter 側で機能を拡張し、対応している。しかし、そのままではローカルルールであり、コンテンツを再利用する際に制約が残ることになる。
今まで、W3Cの内部では日本語組版に関する知識が共有されていないため、日本語組版に関する仕様はほとんど採用されていない。
そこで、W3Cの中でタスクフォースを立ち上げ、JIS X 4051:2004をベースにした日本語組版の内容をスタイルシート技術に関する要求仕様としてまとめている段階である。
W3Cの公開文書:ワーキングドラフト
Requirements of Japanese Text Layout W3C Working Draft 11 April 2008
(この続きは、Jagat Info 2008.7月号、詳細はテキスト&グラフィックス研究会会報誌 Text & Graphics No.266に掲載しています)
2008年6月
2008/06/17 00:00:00