印刷画像検査へのディープラーニングの適用

AIによる印刷画像検査ソリューションを提供するタクトピクセルの取り組みを紹介する。

タクトピクセル（株）は、印刷業界向けのAIソリューションを提供することを目的に2018年1月に設立された。深層学習を始めとした機械学習や画像処理のノウハウとアプリケーションの開発技術を活かし、印刷製造業への効率化や省人化のためのシステム開発とコンサルティングを行っている。代表取締役 CEO/CTOの玉城哲平氏に印刷画像検査へのディープラーニングの適用について伺った。

印刷画像検査として当社が対象としているのは、出荷前の目視による全品検査である。この作業をディープラーニングのモデルを使って自動化することを目指している。すでに多くの印刷現場では画像検査システムの導入が進んでいるが、依然として多くの現場では目視チェックが不可欠となっている。その理由として、エラーの認識は人間の感性によるところが少なくなく、印刷特有のノイズ判断や微妙な色の変化を現在のカメラ・センシング技術でエラーとして認識するのは難しいからである。品質検査の精度を高めると歩留りが悪くなるというトレードオフの関係にある。

一般的な機械学習のワークフローは次のようになる。

1)データ収集

　学習に必要なデータを収集してデータベースに格納する。

　収集したデータに対して、人間が分類してラベルをつける。これをアノテーション作業という

2)前処理

　モデル化のための基本的な画像処理や高い精度のモデルを作成するためのデータの増幅などの処理を行う

3)モデル作成

　学習処理を行うためのパラメータの探索やニューラルネットワークの構造を決定し、精度を確認する

4)システム化

　予測モデルを実際の現場で使用するため既存のシステムや装置への組み込みを行う

これら一連の流れのなかで、1)データ収集から、3)モデル作成までの範囲をカバーするのがPOODL（プードル）という製品である。印刷物の画像認識に特化した学習済みモデル作成のためのクラウドプラットフォームである（図1）。

印刷物の画像は、検査装置から直接アップロードしてもらうことを想定している。アップロードのプログラムを簡単に作成できるようなツールキット（SDK）を提供している。Webブラウザから手動でアップロードすることもできる。正しい画像とエラー画像とをセットで登録していく。

印刷画像のエラー判断の難しさ

一般的な深層学習による画像認識では、犬なら犬の画像を何枚も学習して、ひとつひとつの画像から特徴を認識していく。一方で、印刷物の画像検査は、正しいマスター画像と欠陥の画像の2つがペアになっている。画像にゴミのように見えるキズがあったとしても、マスター画像にも同じように映っていればそれは欠陥ではない。比較して初めてわかるものなので学習するときに工夫が必要になってくる。

人間がエラーと判断するものを単純に機械に置き換えるだけだろうと取り組んでみたが、なかなか精度が上がらなかった。その理由は、人間による良品か不良品かの判断は曖昧である。判断する人が同じであれば判断のぶれは少なくなるが、異なると判断結果が異なることが出てくる。同じ現場であってもコンセンサスがきちんと取れていないことが多い。基準があいまいななかでAIに学習させても、いい加減な結果しか出てこない。

そこでエラーの分類項目を定性的にする必要がある。例えば、毛ゴミであれば、10人に聞いたら10人全員が毛ごみだとわかるような分類項目の表現にしないと精度が上がらないということがわかってきた。

人間の頭の中では、例えば「これは毛ごみだが、小さいから良品にする」といった抽象的（感覚的）な思考とルールベースの論理的な思考とが組み合わさって、良品か不良品かの判断をしている。こうした判断のプロセスを順番に分解して追っていくことで、AIの精度が上がると考えている。

画像を見て分類項目のラベル付けをする作業がアノテーション作業である。画像と分類項目の例を図2に示す。

このアノテーション作業は人間が行う。一つの分類項目当り1,000画像（組）以上は最低限必要となる。これに分類項目数が掛け算されるので、非常に負荷のかかる作業となる。また、作業を進める中で当初の分類項目や判断基準では適当ではないと変更を余儀なくされる場合があるが、そのときは最初から作業をやり直すことになる。

アノテーション作業は大変なので、省力化するために「半教師あり学習」や「アクティブラーニング」についても対応している。

独自の深層学習モデル

POODLでは、DLC-Tianという独自の深層学習エンジンを採用している。数百万枚規模の大規模のデータセットの学習が可能である。欠陥流出を最小に抑えるための数値最適化手法や過学習を抑えるための工夫など小ロット多品種の印刷製造現場に適した汎用的な学習済みモデルを生成できる。

作成したモデルの精度が実用に耐えられるかどうかの検証作業は非常に重要であるが、POODLでは、Webブラウザ上でさまざまな角度から結果解析が行えるようになっている（図3）。

中小企業の多い印刷業界においても容易にAI活用できるようなソリューションを今後とも提供していきたい。

＊2019年10月8日開催「プロセスオートメーションがもたらす未来」より

（JAGAT 研究調査部　花房賢）