本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。

実用が始まったUnicodeの現状と課題

Unicodeに関する議論は,国内では文化的な側面からの批判も少なくないものの,国際的な文字の規格として徐々に浸透しつつある。OS,IME(入力メソッド),フォント,アプリケーションがUnicodeに対応することで,本格的なUnicodeの利用が可能になる。OSではWindowsに加えて,MacOS XもUnicodeに対応された。主なOSやアプリケーションの対応状況を整理し,Unicodeで何が可能になるのか,課題は何かについて,『図解でわかる文字コードのすべて』(日本実業出版社2001年刊)の著者,清水哲郎氏に話を聞いた。

WindowsにおけるUnicode

OSレベルではWindows2000で初めてUnicodeに完全対応したと言われ,さらにWindowsXPでサロゲートにも対応された。Unicode対応のOSを使うには,Unicode対応のフォントも当然必要になる。Windows98以降のMSフォントには,JIS漢字,補助漢字のほかに,「草g」の「なぎ」や「はしごだか」などIBM拡張文字も収録されている。それ以外のフォントで手に入りやすいものには,Office2000以降に添付されているArial-Unicode MSがある。Unicode 2.1に含まれる5万377グリフを収録している。JS平成明朝体W3は一太郎10以降に添付されているフォントで,JIS漢字と補助漢字とIBM拡張文字を含んだ上に,CJK漢字の中の諸橋漢字と,漢字で2万2280グリフを収録している。
IME(入力メソッド)は,ほとんどがUnicode対応になっている。MS-IMEでUnicode文字を入力するには,単漢字変換,文字一覧・部首一覧からの選択,手書きでの呼び出し・選択というやり方がある。
テキストエディタでは,秀丸,EmEditor,NoEditor,WZEditorと,Windows2000およびXPに添付されているメモ帳がUnicodeに対応している。
ワープロソフトではMS-Word,一太郎,OASYS がUnicodeに対応している。
ExcelやAccessといったデータ処理のソフトでは,入力ができるだけでなく,例えば並べ替え,検索もできるかどうかが重要である。Excel2003で文字コード順に並べ替えすると,JIS漢字はJISコード順に並び,JIS外の漢字はUnicode順にソートされてしまう。
ハガキ作成ソフトの「筆まめ」「筆ぐるめ」はUnicodeに対応している。なぜUnicode対応したのか分からないが,これらのソフトは両方とも住所録を共有するため,XML対応する方向に向かっている。XMLではUnicodeが標準なので,そのためにUnicode化を進めているのではないか。
データベースに関してはAccess,OracleといったものがUnicode対応している。

インターネットにおけるUnicode対応

WebブラウザはInternet Explorer,Netscape Navigator,OperaなどがUnicode対応している。多言語のWebページも表示できる。世界中の文字が同じHTMLのページに表示できるのがUnicodeの特長である。
検索エンジンのGoogleで,「ケ小平」を検索すると,日本語(JIS)のほかに,中国語(GBコード),台湾のコード(Big5)で書かれたものがヒットする。Google自体の詳しい仕組みは非公開なので分からないが,世界各国の文字コードを自社の中でUnicodeに変換して記録しているようだ。
HTMLのオーサリングツールでは,ホームページビルダーは,まだUnicode対応していない。それ以外のDreamWeaverやGoLive,マイクロソフトのFrontPageはUnicode対応している。
主要なメールソフトは,ほとんどUnicode対応になっている。

MacにおけるUnicode対応

MacOS Xになって,本格的にUnicode対応になった。しかし,MacOS Xは10.0から10.3.3まで,こまめにバージョンアップされ,それごとに添付のヒラギノフォントも違っている。グリフセットに関してもAJ1-4だったり,APGSだったり,AJ1-5だったりする。Unicodeに関しても,3.0,3.1,3.2となっている。従って,MacOS Xを使っていると言っても,いろいろなバージョンが混在している。
Unicodeに対応しているアプリケーションには,Office2004 for Mac,FileMaker Pro7,Jedit,WebブラウザのSafari/Mail,Netscape Navigatorがある。従来のOffice v.Xに付いていたMSフォントはJIS漢字だけであったが,Office2004 for Macでは,JIS漢字+補助漢字+拡張漢字で,3つの文字集合に含まれている漢字がすべて入っている。
また,MacOS Xの場合,Unicodeで対応できる文字のほかに,Unicodeが振られずにグリフだけが存在する文字が含まれている。これらのグリフだけが存在する文字を入力できるソフトは,ことえり,EGBRIDGE,ATOKと,MacOS Xに標準添付されているTextEdit,InDesign CS,Illustrator CS,EGWORDしかない。

文字コードの最新事情と実装

2000年に新しく拡張漢字を収録した文字コード,JIS X 0213が作られた。拡張漢字3685字を含むものである。
Unicodeは本来16ビットで世界中の文字を表そうとした文字コードであり,2の16乗で約6万5000のコード領域をもっていた。途中から「代わり」という意味のサロゲートという仕組みが導入された。これは,最初の6万字のところは,BMP(Basic Multilingual Plane)として,本来の16ビットでアクセスできる。しかし,1面から16面は,32ビットでアクセスしなければいけない。OS,アプリケーションがきちんと対応する必要があるが,実際にはUnicode対応と言ってもそこまで対応しているものは少ない。
数年前まで,文字コードは将来的にUnicodeで収れんする方向になると予測されていた。現状でもマクロで見ると,その見方は間違っていないが,ミクロで見るとなかなかそうもいかない。文字コードとグリフの関係の問題がある。MacOSの中ではコードが振られていない文字,異体字がある。 また,ソフトウエアのサロゲート対応も不十分である。Unicode対応と言っても,サロゲートに対応しているソフトはマイクロソフトのOfficeくらいである。
Macに関しては,OS Xのバージョン間でも違いがある。Office2004に収録されている漢字と,OS Xに標準添付のヒラギノフォントに収録されている漢字が違っている。
WindowsではJIS漢字と補助漢字が含まれており,拡張漢字は含まれていない。MacOS XはJIS漢字と拡張漢字が含まれていて補助漢字が含まれていない。補助漢字と拡張漢字はほとんど重なっているが,重なっていない一部の扱いをどうするのか。
InDesign CSは,サロゲートに対応しており,アプリケーションの中だけで使っている分には問題ないだろう。ただし,InDesignからUnicodeやJISでテキスト出力する場合,この違いが影響を及ぼす可能性がある。現場では混乱を来すこともあり得るのではないかと懸念している。
全体の流れからすると,Unicodeは普及しつつある。しかし,細かいところで見ると,特にMac分野ではマイナーバージョンを含めて,注意点がまだ相当存在するのではないか。
(JAGAT info 2004.8より )

2004/08/20 00:00:00


公益社団法人日本印刷技術協会