JAGAT Japan Association of Graphic arts Technology


本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

印刷データからWebコンテンツを自動生成

掲載日: 2010年08月27日

DTP編集システムで印刷用のデータを制作しながら、Web用のHTMLに自動変換する仕組みを開発した。XMLを中間データとすることでコンテンツの一元化をも実現している。


印刷会社では、印刷物とWebコンテンツを一元化するよう、クライアントから要請されることが増えている。しかし、内容や組版が複雑でボリュームの大きい書籍は、難易度が高いことも多い。
宮嶋印刷の平林淑民氏に、印刷物製作とデジタルメディアの一元化を実現した実例について伺った。

■印刷物とWebコンテンツの同時製作

クライアントは、社会保険の専門誌、医療・年金・介護・健康の実務書を刊行している出版社である。900ページ以上の年金関係の解説書があり、この本の最新版の出版に合せ、その内容をWebで配信したいということであった。先方の意向は、印刷物は従来と変更なく制作し、その上でHTMLを生成して欲しいというものであった。

通常の文章だけならば、HTML変換は容易である。しかしこの解説書では、文字列による分数表示や図形表示等が多用されており、これらはHTMLでは表現できない。
また、Web上ではUnicodeの文字しか使えないという制約がある。さらに、HTML上では、明確な階層構造を持たせなくてはならない。また、リンク情報を自動的に付加できなければならないなど、多くの課題があった。

■XMLを中間フォーマットとする方法

そこで、モリサワの編集ソフトMC-B2を使用して印刷データの編集制作をおこない、MC-B2データから中間データとしてXMLに変換し、さらにHTMLに変換する仕組みを構築した。
HTMLで表現できない内容は、XML化する時点で画像化し、リンク情報も付加する。すべてのデータがそろった時点で、XMLからHTMLに変換する。
また、XML上で修正したデータは、即時にHTML、印刷データの両方に反映される。
XMLを中間フォーマットとしたことで、HTMLだけでなく、電子書籍データなどへの展開も可能である。

MC-B2上の組版データは、テキストと組版スタイルが別々に管理されており、また誌面上に表れない付加情報を持たせることができるため、XMLへの変換やリンク情報の付加が容易である。そのため、組版データとXMLとの双方向の変換が可能である。

図形化しなければならない組版コマンドや数式等、HTMLで表現できない内容を画像にする作業は、自動化している。外字については、変換テーブルに設定するだけで、画像へ変換される。コンバージョンの際にこれらの部分を抽出し、画像を生成するソフトが組み込まれている。

HTML上の階層構造については、スタイル名と階層のテーブルを関連付ける仕組みが組み込まれている。ドキュメント内のリンクについては、組版編集の際、リンク先ごとに文字スタイルを作成し、リンクを埋め込む文字列をそのスタイルで囲むような形にすることで、自動変換する仕組みが組み込まれている。

このように、図とテキストの混在した書籍をHTML化するという要請は、これからも増えていくだろう。その場合、技術面だけでは解決できず、クライアントと調整して、対応することが不可欠になってくる。

■今後の課題と可能性

今後、紙だけにとどまっていくことは難しく、デジタルコンテンツとの共存を模索している。印刷物の制作とXML技術との連携を充実させていければと思っている。

このシステムを構築することができたので、他の印刷会社との協力体制等も実現していけたらと考えている。今回のパートナーであるモリサワやデジタルコミュニケーションズとの連携に加え、複雑な印刷物から制約の多いHTMLへの変換ということになると、全体のコーディネートの経験やノウハウが必要とされるだろう。また、Webデザインにおけるカスタマイズにも対応していきたい。

(テキスト&グラフィックス研究会)

(C) Japan Association of Graphic Arts Technology