本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
※国内のXMLユーザーグループが、XML入力ツールとXML組版支援ツールのフリーウエアを開発した。
第1節 XMLコンテンツを一元管理するメリットとデメリット
第1項 コンテンツをXML化して、ワンソースマルチユースを目指す理由
1.1 電子書籍、デジタルコンテンツをめぐる現状
海外での電子書籍販売が急拡大してきた近年の状況をうけて、携帯コミックなどすでに出版コンテンツの電子化が進んでいた日本国内でも、文芸や実用書など新たなジャンルの電子書籍への関心が高まってきた矢先、IDPFから新たな電子書籍フォーマットのEPUB3が公開された。
それまで電子書籍販売ストアごとに必要となるデータフォーマットの違いや、異なる電子化データの製作コスト面で悩んできた出版各社は、世界標準のフォーマットとなるEPUB3の登場を自社の書籍コンテンツを電子で展開する追い風として、がぜん電子書籍市場への参入意欲を高めることとなった。
電子書籍を販売するプラットフォーム数の拡大も続いた。2012年夏には楽天が、e-Ink電子書籍端末のkoboを投入すると共に電子書籍販売へ新規参入した。
2012年末にはいよいよAmazonが日本での電子書籍ストアを開始し、e-Inkと液晶のkindle電子書籍専用端末も満を持して導入された。
スマートフォン販売数の急増、iPad miniやNexus7など持ち歩きに便利なサイズのタブレット端末の発売とも相まって、電子書籍を手軽に購入してストレス無く読書できる環境が、いまや日本国内でも急速に整備されてきている。
出版社が電子書籍に乗り出す別な理由が、ここ10年以上も紙の書籍・雑誌の販売減に歯止めがかからないことにある。
雑誌・書籍取次大手の日販の2012年度の上半期売上(○月~○月)は6%あまりの減少となった。景気低迷の影響をうけて、書店への来店者数の減少がその理由にあげられている。
また販売拠点である書店数の急激な減少も、出版全体の売上に暗い影をおとしている。日本全国の書店数は○○年の約24,000店をピークとして、2012年にはその2/3の15,000店弱にまで落ち込んだ。これはチェーン書店の支店数を含めた店舗数であって、法人としての書店数は日書連加盟の数字で見ると20年前の14,000あまりから、2012年にはその1/3の5,000弱になってしまった。いまや地域内に一軒の書店もない市町村は珍しくない。
このような状況の中、電子が紙を食ってしまうのではないかという危惧を抱きつつも、出版社が自社コンテンツを再利用した電子書籍市場への進出を急ぐ流れは、ますます加速していくであろう。
1.2 ワンソースマルチユースを目指す意義
走り出した電子書籍や各種の電子出版サービスへのコンテンツ提供のために、ひとつのテキストデータからEPUB、PDF、オーディオブックなど多様な出力形式への効率的な展開をめざす、いわゆるワンソースマルチユースの手法は、コンテンツの有効活用や再利用という目的から今後は最優先で考えられ、またワークフロー構築されていくと思われる。
提供先もPCやタブレット、またスマートフォンと画面サイズやOSの異なる複数のデバイス端末に対応する必要があり、そのための効率的な制作方法が求められている。
またそれと併行して、ワンソースマルチユースを推進していく上で、自社の出版コンテンツデータを適切に管理していく環境整備も重要になってくる。
書籍の場合、初刷りには必ずどこかしら直しがあるのが通例で、重版ごとにどこが変わったかをきちんと把握しておかなければならない。これがさらに文庫化や全集に収録されたり、またロングセラーとなって時代に応じた表現へと加筆修正されたりした場合など、いったいどこに修正したデータが履歴とともに存在し、誰が管理しているのかということが、ともすればあいまいなままになっていたのが現状ではないか。
出版社が虎の子の書籍コンテンツを、DTPデザイナーまかせでも、印刷所に置きっ放しにもせずに、きちんと自社で保持管理して修正を加え、必要な時にはいつでも変換をかけて紙にも電子にも出力できるという体制が求められている。
ワンソースマルチユースを目指すワークフロー作りは、そのためにも大いに寄与するであろう。
この他にもたとえば教科書をデジタルデータ化することで、画面での拡大表示や文章の白黒反転、音声読み上げ環境の実現を通しての教育全体のアクセシビリティの向上など、Webとも親和性の高い新しい電子教科書・電子教材の可能性が開けてくるだろう。
1.3 コンテンツの持ち方について。InDesign保持で大丈夫か?
では自社内における出版コンテンツの製作と保存について、どのような点に留意したらいいのだろうか。
最近では、急速に普及したAdobeの組版ソフトInDesignで製作し、そのまま保存しておけばいいのではという声を耳にする。
しかしInDesignはあくまで組版ソフトであり、プラグインで作製されたテキストデータはコンテンツの活用・再利用を考えた場合には、必ずしも使い勝手のいいものにはなっていない。最新のCS6.0からは、InDesignデータからEPUB3を生成する機能が追加されたが、できたEPUBはさらにいろいろ修正の手を加えないと再利用が難しい。
さらにInDesignデータからテキストデータを抜き出した際に、文字変換システムの特性による印刷時のフォント字体からの文字化けも生じることがあるなど、本来印刷用のInDesignデータに頼っていては、コンテンツの電子化における手間とコストの削減はなかなか困難だろう。
これはまた.bookやXMDFなどの従来型の電子書籍フォーマットや、いわゆる中間・交換フォーマットと呼ばれるものにも共通にあてはまる。
最終的な再利用フォーマットに保存していたそれらの形式から変換をしようとした場合にも、やはり変換時の細かな修正作業や検証が欠かせず、ワンソースマルチユースの目標とする自動的に容易に複数の出力を得るということからは遠ざかってしまう。
1.4 EPUBデータは、ワンソースマルチユースにむくか?
では標準フォーマットとして策定されたEPUBで書籍データをはじめから作り、紙と電子に展開していくのではどうだろうか。EPUB3については規格公開以来、すぐれた製作ツールやマニュアルが次々と発表され、日本語縦書きに対応したビュワー類や電子書籍端末も開発されてきている。EPUBで日本語書籍を読むという読書環境は、順調に整備されつつあると言ってよいだろう。
しかし電子書籍コンテンツとしてのEPUBには、文芸書やコミックス、写真集といった文書の構造があまり複雑でないものを表記する場合はタグ的に問題がないが、辞書や辞典、教科書・教材など、文書構造が比較的複雑で多様なタグ指定による検索・再利用のニーズが高いものについては、果たしてEPUB仕様データで十分なのかということが懸念される。
内容の検索や更新の頻度が高いような出版コンテンツについては、EPUBよりも属性をつけて構造化したXMLデータのほうがより有効ではないだろうかと思われる。自社が持つコンテンツ内容の理解と、電子化してからの利用方法の冷静な分析とがここにおいて重要になってくる。
1.5 XMLパブリッシングの有効性
従来から書籍出版においても辞書・カタログ分野などで、XML化したデジタルデータは広く活用されてきた。その理由としては、
・XMLは世界標準としての仕様が確定しメジャーなフォーマットなので、データの長期保存にむく。(データの寿命がソフトウェアに依存しない)
・Word、InDesignなどの市販ソフトはXMLとの連携技術を備えている。XMLで最初からデータを作っておけば、各種フォーマットへの変換はスムーズにいく。
・XMLなら電子書籍端末の種類、あるいはメーカー独自仕様に依存しない。
・フォーマッターソフトを利用してのデータからの自動組版や、目次・索引の自動生成が可能になる。
などがあげられる。意味づけされた汎用データ(XML)から各出力先の求めるフォーマットへ直接変換していくのが、効率的にもっとも望ましい形であろう。
1.6 アクセシビリティ向上ほか、広い応用分野
2009年に成立した教科書バリアフリー関連3法により、出版社は努力義務として義務教育における拡大教科書の提供が求められるようになった。現状ではPDFデータをもとにして拡大版を作製せざるを得ないが、それには多大な費用と労力がかかる。もし教科書データを初めからXML化しておけば、通常版と拡大の作り分けというワンソースマルチユースをデジタル的に簡単に実現することができ、同時に一つのコンテンツからデジタル拡大や音声読み上げなど多様な出力をするという、アクセシビリティの課題解決にも大きく寄与することが可能になる。
このように利用方法に応じた多様なデータ変換をコンテンツのXML化によって可能にすることは、紙とWebにまたがってのコンテンツ展開という、まさに理想的な状況をも作りだすことにつながるわけである。
第2項 紙からWebへ、新たな展開を求めて
2.1 コンテンツのXML化の先にあるもの
IDPFがEPUB3の策定にあたって意図したことは、紙の書籍データとWebとの従来の垣根を越えたデジタル技術的な融合であったと聞いている。
今は紙書籍の印刷データから電子書籍を製作するフローが一般的だが、本質的にちがうタイプの書籍をできあがった製作物から変換するのは無理が多い。XMLを元データとしてきちんと作って製作工程の上流に置き、そこから変換するフローを作れば時間とコストの削減につながることになる。
2.2 コンテンツ電子化のメリット
XMLを制作に利用するメリットとしては、紙でも電子でも複数の成果物に同一のデータを利用することができるので、実質的に同じ内容のコンテンツを何度も繰り返し作り込む手間が不要になる。紙の書籍と電子書籍(リフロー型、固定レイアウト型)、そしてWebへのコンテンツ公開を、一貫した流れの中で実現できるのである。
また紙を電子化することで、従来のコンテンツに新たな可能性を拡げることもできる。
例えば紙版の防災マップを電子化したとしよう。われわれの研究会による検証では、紙版での地域地図と防災チェックシートコンテンツに加えて、XML化した電子版では家族の緊急連絡先を入力管理する機能や、定期的な防災グッズの更新チェック、さらに災害発生時に行く緊急避難場所の位置案内など、Webと連動させることによりさまざまな付加価値を発生させることができた。同じ書籍コンテンツでも出力先の特性を生かして、様々な展開ができることが実証された。
2.3 XMLとEPUB3、HTML5。Webとの連携
はじめにXMLで書籍コンテンツを記述しておけば、Webで使われるXHTMLもXMLの一種である。XHTMLからは、よりリッチな画面表現を可能にするHTML5への変換も容易にできる。さらに日本国内の電子書籍形式としてはポピュラーなXMDFやMcbookなども、すべて本文は書式はちがうがXMLで、これらも同一のXML元データから分岐して生成させることが可能である。
Web向けに作る際は文書構造としてのXHTML(XML)と視覚表現としてのCSSとを分離し、ちがったデバイスに対応させる場合はCSSだけを切り替えれば済むようにしておくことが、効率的な複数デバイス対応のキーとなる。
2.4 XMLで一元管理する上での、デメリットはあるか?
まず考えられるのは、XMLに対する知識・スキル不足からくる敷居の高さ(「XMLって何?」)があげられる。既にDTPが一般的な製作工程になった出版印刷業界においても、従来は産業用ツールと見なされてきたXMLに対する技術や知識の習得はまだまだ足りないし、辞書やカタログ以外のジャンルでは十分に使いこなせていないのが現状であろう。
また書籍データとしてのXMLコンテンツを作成するための、XMLエディタやデジタル組版のためのツールがいままで少なかった。あっても高価であり、試験的に導入するにはためらわれた。
さらに大きな問題点は、書籍コンテンツを構造化していくための知見や指針の不在だと書籍データの検証を重ねていて実感をした。もともとの書籍DTPデータは、紙の本の上でのレイアウトは考慮されていても、電子書籍コンテンツになった場合の構造化ということは全く意識されていない。その書籍から、誌面の内容を分析して構造化の道筋をつけ、テキストデータを作製してXMLエディタに入力していくのは、試行錯誤をしながらの大変な労力を必要としたのが実情だった。そんな手間と労力をかけても過去の出版コンテンツをXML化して再利用していくかどうかは、各出版社が自らのコンテンツの強みをふまえながら判断していくことが求められてくる。
ワンソースマルチユースを実現するためには、こうした状況をふまえながら、最初から複数の出力データ製作を前提としてXMLで元になる書籍データを整備し、そこから分岐制作していくというワークフロー整備が不可欠である。同時に書籍の編集サイドでもXMLへの知識を深めながら、紙でも電子でも構造化しやすい誌面づくりとは?と常に意識しながらの編集作業が必要になってくるだろう。実際の編集作業にあたっては、編集者は常にタイトル、小見出し、本文、キャプションといった項目を意識しながらの誌面の構造化を行っているわけであり、適切なトレーニングをすれば電子書籍になった時の構造化に対する意識づけも、無理なく養うことができると思われる。
?
以下はInDesign、EPUB、XMLの、保存データフォーマットとしての比較表である。
2.出版物の企画・編集・制作の現場で起こっている課題
3.「紙書籍」と「電子書籍」のコンテンツ作りの考え方の違い
(XMLパブリッシング研究会)