AIによる数字の画像認識 畳み込みニューラルネットワークの研究

製品への付加価値創造が期待できる、AIの研究を行っています。

研究開発

近年、CPUの性能向上やビッグデータにより、機械学習やディープラーニングなどのAI技術が急速に進歩し、ビジネスに導入され始めています。また、社会的課題となる労働力不足や生産性向上の対策としても期待されています。
愛知時計電機の主力製品であるメーターに搭載されているマイコンにAI技術を取り入れることで、製品への付加価値創造が期待できるため、AIの研究を行っています。

一般的なAIは教材データと教師データを与え、学習させることから始まります。例えば、教材データとして犬や猫の写真を見せ、教師データとしてそれが「犬である」とか「猫である」という答えを与えて学習させます。学習が成功すると、そのAIは教材データにはない犬の写真を見せても、その写真に写っているものが犬であると推論できるようになる技術です。
AI技術は様々な分野がありますが、今回はその中でも画像認識技術の研究として畳み込みニューラルネットワーク(以下CNN)を用いた数字認識の事例について紹介します。

CNNについて

CNNでは画像処理分野でも登場する畳み込みと呼ばれる演算が、入力画像に対して適用されます。この演算により画像の特徴を強調させることができます。従来の機械学習では人が特徴を指定する必要がありましたが、この方法では特徴を自動的に抽出することが可能です。

正確な予測を行うためには、まず頭脳を作るために学習を行う必要があります。学習用の画像とその画像の正解値を与えることを繰り返します。画像の予測結果と正解値のズレから、畳み込み演算などに使用される内部パラメータを最適化します。これにより、例えば学習用データとして数字の画像を用いれば、数字認識に特化した(数字の特徴を抽出することに長けた)頭脳が完成します。

CNNを用いた数字車認識

水の使用量を、メーターの数字車の画像からCNNを用いて予測するという試みです。
今回のケースでは、学習用データとして以下に示す数字車の画像を用いました。データに対し、正解値として0~9の数値を与えます。AIは画像内の数字が0~9のどれに分類されるかを出力します。

様々な数字に対応可能とするため、異なる数字を示す画像を千枚以上学習させ、完成した頭脳をマイコンで動作が可能となるよう変換・圧縮し、数字認識を実施した結果、高い精度で数字を予測できるAIを完成させました。

CNNを用いた数字車認識

研究者の声

■AIによる数字の画像認識ではどのような課題、発見があったでしょうか?

現在、AI技術の中で最も注目されているディープラーニング手法を用いて、AI頭脳を作成しています。
作成したAI頭脳により、計測したデータを入力して要求する答え(例:カメラによる画像データから数字を認識)を求めることとなりますが、100%の正解率が得られないことや、答えがどのようなアルゴリズムで導きだされているのか、理論的な根拠がみえないブラックボックス状態で利用することに多少の不安を感じています。

■さらなる改善点や今後の改良をお聞かせください。

今後、このような不安を払拭すべく、さらなる調査・研究を行うことでより多くの検証を積み重ね、社会へ提供しても問題のない技術として立ち上げていきたいと考えています。


最新技術の研究開発に関するお問い合わせ



愛知時計電機株式会社 経営企画室  青井


TEL:052-661-0567 または総合お問い合わせフォームよりお問い合わせください。






ピックアップ記事