JAGAT Japan Association of Graphic arts Technology


本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

電子出版における外字・異体字問題と実証実験

掲載日: 2011年11月11日

電子出版における外字・異体字対応は、簡単に解決することができない、やっかいな問題である。解決に向けたステップとして、字形データベースが構築され、実証実験が始まった。

■電子書籍と外字・異体字問題

通常の書籍出版では、使用したい文字(字形)がない場合、「外字として作れば良い」「印刷会社に頼めば、すぐに外字を作ってくれる」「印刷物では外字かどうか判らない」となる。
大量生産である印刷を前提にすると、外字の製作コストは微々たるものである。つまり、印刷物において外字は最も簡単で低コストな解決策であったと言える。

しかし、デジタル出版においては、外字は簡単に解決することができない、やっかいな問題となる。
タブレットPCや電子書籍リーダー、スマートフォン、WindowsやMacなど、さまざまな表示デバイスやOSによって利用できる字種や字形が異なる場合がある。

コンテンツの一元化を考えると、表示できない文字は外字とならざるを得ない。かと言って印刷を前提としない電子書籍の制作において、外字は作成からチェックまで含めると大幅なコストアップとなる。さらに、複数のデバイス対応やテキスト検索に対応できないなど、大きな問題となってしまう。
結果的に、外字は電子書籍コンテンツの充実・普及を妨げるものなのだ。

2010年のデジタル出版の三省懇談会では、このような「電子書籍の外字・異体字問題」が提起された。
それを受けて、経産省では「外字・異体字が容易に利用できる環境の整備」を進めてきた。ここでは、「字形共通基盤」を構築し、その機能や効果について実証実験をおこなうものである。

■「字形共通基盤」の実証実験

「字形共通基盤」とは、字形のデータベースである。約23,000種類のAJ1-6の文字セットをベースに背番号が振られ、漢字の字形、読みや画数などの属性情報、JIS、AJ1-6、UCS、IVS、大漢和など漢字を特定する文字コードが参照できる。
データベースに登録されている各文字集合の例示字形は、128×128のビットマップで、いくつかの書体サンプルとして表示される。例えば、小塚明朝、秀英体明朝、凸版明朝、文字鏡明朝の字形が一覧で表示され、書体によるデザインの差なども把握することができる。また、異体字がある場合は異体字の字形、JIS90・JIS2000・JIS2004で字形が異なる場合は、各々の字形が表示される。各文字集合の字形の違いも、一目瞭然となる。

つまり、必要な字形がどの文字集合に含まれているか、どの文字集合にも存在しないものなのか、容易に検索し判別するためのデータベースなのである。
望んでいる字形が同じコードを持つ異体字の場合もあるし、フォントデザインの差によるものかもしれない。このような字形と各文字集合における位置付けを容易に判別することができる。

どの文字集合にも存在しない字形(つまり現時点では外字・異体字)は、将来拡張すべき字形の候補とも言える。したがって、継続的に外字・異体字候補の申請を受付け、審査する運営組織が必要になる。

データベースはWebサーバー上に構築されている(ログインが必要)が、エディタ形式の入力・検索ツールは、アプリケーションとして提供される。

■今後の対応

今回の実証実験は、これらの仕組みや構想が妥当かどうかを検証するものである。そのため、出版・印刷・国語研究分野などに公開され、検証を行い、意見を集約することになる。

■■■

JAGATでも、近日中にこの「字形データベース」「入力・検索ツール」の説明会と意見交換の場を設ける予定である。外字・異体字問題に関心のある方は、注目していただきたい。

(JAGAT 研究調査部 千葉 弘幸)

■11/22(火)外字・異体字問題のための字形データベース 公開説明会(参加無料)

 
(C) Japan Association of Graphic Arts Technology