本記事は、アーカイブに保存されている過去の記事です。最新の情報は、公益社団法人日本印刷技術協会(JAGAT)サイトをご確認ください。
眼の機能をふまえた新しい画像表現技法とともに、画像の視認性評価方法も開発されるべきだろう。
目に映った光景が他人にはどのように見えているのかは、全く想像がつかないのに、現代社会においては人々が画像を共有してコミュニケーションが成り立っているのは不思議である。聴力なら、弱ってもそれは主に音の強弱の問題なので、補聴器を使ったからといって聞こえる内容は損なわれない。また茶の間にTVの音と家族の会話が同時にあっても、人はこれらを聞き分けることが出来るロバストな点がある。音情報は記号性が高く、脳にとっては部分情報を集合として組み立てられるものと考えられる。
ところが視力はメガネのような光学的な補正で済む範囲は限られていて、また傷病がもとで弱ることがあるし、先天的に色の識別が困難な場合もある。視覚の障害ははっきりした壁がある場合が多い。2つの画像を重ねてしまった場合にも識別することは困難である。視覚的な認識は複雑で全体性が重要なように思われる。
しかし画像処理で昨今発達してきた顔認識は、部分の認識を集合として組み立てているという音と同じような要素が多い例である。眼の構造からして視力が優れているのはレンズの中心部の5度の範囲であり、文字の読み取りもそこでしかできないので、眼球を動かして文をスキャンしている。それと同じように、画像の中で視線を動かして部分認識をしながら、それを脳で組み立てて全体像としているような事柄は多くあろう。顔認識もそのひとつで、これからも部分と全体の両方を処理するとか、部分の情報と全体の情報が補間しあうようなアプリケーションの開発が多くなるだろう。
眼の中心部の5度以外は解像度が劣るとしても重要な役割があるに違いない。第一の役割は動きの認識で、第二は形状の認識であるが、それ以外も全体の明るさを把握するとか、分光分布的な把握とか、体のバランスとか、それらから脳でいろんな情報が解釈されて、それらが階層的に積み重なって、視覚を形成しているのだろう。
音情報の方が人が要素分けして理解しやすいのに比べて、視覚情報の方が組み合わされているものが要素分けしにくいと考えられる。画像の良し悪しや画像のインテントに関する従来の評価軸を分析し、眼の機能にどう関連しているか、また脳での基本的な視覚認識のレベルにどう関連しているかを考え、それらの要素の組み合わせで画像のインテントの表現を置き換えるような作業が必要になる。
しかし画像表現においては、色対比を大きくしたい場合や、逆に微妙なトーンの変化を見せたい場合、またまぶしさをだしたいとか、薄暗さを現すなど、いろんな技法を使って行うが、こういった技法も極端になると視認の障害要素にもなりえる。だから技法レベルのアルゴリズムと別に、人の「見え」に関する総合的な仮説検証を積み重ねて、視認性を客観的に評価できる方法も、平行して研究すべきである。
(テキスト&グラフィックス研究会会報『T&G』282号より)