AIによる数字の画像認識 畳み込みニューラルネットワークの研究
製品への付加価値創造が期待できる、AIの研究を行っています。
近年、CPUの性能向上やビッグデータにより、機械学習やディープラーニングなどのAI技術が急速に進歩し、ビジネスに導入され始めています。
また、社会的課題となる労働力不足や生産性向上の対策としても期待されており、例えば小売業での無人レジ管理、医療分野での介護ロボット制御、農林業での農薬散布管理、製造業での画像認識による異常品検知など、多岐にわたって導入されています。
一般的なAIは、教材データと教師データを与え、学習させることから始まります。例えば、教材データとして犬や猫の写真を見せ、教師データとしてそれが「犬である」とか「猫である」という答えを与えて学習させます。学習が成功すると、そのAIは教材データにはない犬の写真を見せても、その写真に写っているものが「犬である」と推論できるようになる技術です。
愛知時計電機の主力製品であるメーターにもAI技術を導入することで、計測信号に重畳するノイズ除去による流量計測精度の向上や、数字車の画像認識による遠隔自動検針の実現など、さらなる付加価値創造が期待できます。
このように、AI技術は様々な応用が可能ですが、今回はその中でも画像認識技術の研究として、畳み込みニューラルネットワーク(以下CNN)を用いた数字認識の事例について紹介します。
CNNについて
CNNでは画像処理分野でも登場する畳み込みと呼ばれる演算が、入力画像に対して適用されます。この演算により画像の特徴を強調させることができます。従来の機械学習では人が特徴を指定する必要がありましたが、この方法では特徴を自動的に抽出することが可能です。
正確な予測を行うためには、まず頭脳(AIモデル)を作るために学習を行う必要があります。学習用の画像とその画像の正解値を与えることを繰り返します。画像の予測結果と正解値のズレから畳み込み演算などに使用される内部パラメータを、勾配降下法や誤差逆伝播法などを利用して最適化します。これにより、例えば学習用データとして数字の画像を用いれば、数字認識に特化した(数字の特徴を抽出することに長けた)AIモデルが完成します。
CNNを用いた数字車認識
水の使用量を、メーターの数字車の画像からCNNを用いて予測するという試みです。
今回のケースでは、学習用データとして以下に示す数字車の画像を用いました。データに対し、正解値として0~9の数値を与えます。AIは画像内の数字が0~9のどれに分類されるかを出力します。
様々な数字に対応可能とするため、異なる数字を示す画像を千枚以上学習させ、完成した頭脳をマイコン(エッジ側)で動作が可能となるよう変換・圧縮し、数字認識を実施した結果、高い精度で数字を予測できるAIを完成させました。
研究者の声
■AIによる数字の画像認識ではどのような課題、発見があったでしょうか?
現在、AI技術の中で最も注目されているディープラーニング手法を用いて、AIモデルを作成しています。
作成したAIモデルにより、計測したデータを入力して要求する答え(例:カメラによる画像データから数字を認識)を求めることとなりますが、100%の正解率が得られないことや、答えがどのようなアルゴリズムで導きだされているのか、理論的な根拠がみえないブラックボックス状態で利用することにため、実験や検証を積み重ねて、開発したAIの信頼性をあげていく必要があると感じています。
さらなる改善点や今後の改良をお聞かせください。
今回の事例ではCNNで数字の認識と分類を行うAIモデルを作成し、AIモデルをマイコンに搭載させ動作させました。今後は弊社の主力製品であるメーターにもAIを搭載することで品質の向上や、さらなる付加価値創造を期待しています。そのためにも、最新技術であるAIの調査・研究を行うことでより多くの検証を積み重ね、安心・安全な社会を築いていきたいと考えています。
本ページの研究開発は、内容が見直されている場合がございます。ご了承ください。