AIによる画像分類とは|概要や事例を紹介
近頃、OpenAIが開発したAI(人工知能)を活用した対話型チャットボットである「ChatGPT」がTwitter等のSNS上で話題を呼んでおり、AI(人工知能)が身近な存在になりました。「ChatGPT」は1例に過ぎず、他にも「テキスト生成AI」、「画像生成AI」など、現在あらゆる分野において自動生成AIサービスの開発が進んでいます。本記事では、AIのディープラーニングによる画像分類にフォーカスし、その概要や開発プロセス、活用事例を紹介していきます。
目次
AI(ディープラーニング)による画像分類とは
まずは、AI(ディープラーニング)による画像分類の概要について説明します。
AI(ディープラーニング)による画像分類とは、「ある画像において、ディープラーニング(機械学習)により過去に蓄積されたデータを元に特徴を分析し、分類すること」です。例えば、以下の1枚の画像を例にとってみましょう。
この画像を御覧になった読者のほとんどの方が、画像に映っている動物を猫でも鳥でもなく、“犬”だと判断したのではないでしょうか。なぜこの画像に映っている動物を“犬”だと判断したかと聞かれると一瞬戸惑ってしまうかもしれませんが、私たち人間は過去の経験から感覚的になんとなく(しかし、高い精度で)犬だと判断することができます。
一方で、AIはこの画像を見て、人間と同じように「感覚的になんとなく」画像に映っている動物を“犬とを分類できるのでしょうか。答えはYESでもありNOでもあります。具体的には、「まったくデータを与えられていない状態では、“犬”だと分類することができないが、膨大な犬や猫、その他の動物のデータを与えられ、学習した場合に分類できるようになる」ということです。
画像分類AIの開発プロセス
次に、上述したような画像分類AIを開発するためのプロセスを見ていきましょう。
開発プロセスは以下の4つのプロセスに分かれます。
①画像データの用意
②特徴の学習
③分類精度の評価
④チューニング
それぞれのプロセスを具体的に説明していきます。
①画像データの用意
AI(ディープラーニング)によって画像を分類するには、分類したい対象物の特徴を学習させなければなりません。
例えば、上で紹介した犬の画像を犬だと分類するためには、犬の特徴を学習しなければなりません。そのため、犬の特徴を学習させるための画像を大量に準備する必要があります。
また、学習用のみならず、後ほど説明するテストフェーズで使用するテスト用の画像も用意する必要があります。学習用とテスト用では、異なる画像を準備します。
②特徴の学習
画像の用意ができたら、いよいよ学習フェーズに移行します。例えば、「とがった耳」「4本足」「長い舌」「茶色い毛」といった犬の特徴を学習させていきます。具体的には、耳や口、鼻、体毛等を“畳み込み”と“プーリング”という2つの手法を用いて学習させていきます。
畳み込みとは、画像をカーネル(フィルタ)と呼ばれる四角形で少しずつずらしながら切り抜き、それぞれのカーネルにおいて対象物の特徴がどれくらい含まれているかを数値化する方法です。
プーリングとは、畳み込みで得られたカーネルの中で、数値が高いつまり、対象物の特徴を良く表しているものだけを抽出する処理のことです。
ちなみにですが、人間は画像を見たときに、それが何の動物であるかを過去の経験から感覚的に判断しますが、AIは上記の学習から対象物の特徴を分析し、それが何であるかを“確率”で判断します。例えば、【耳が立っていて、4本足で、鼻が黒くて、舌が長いという特徴があるから犬である確率は70%であり、猫である確率は25%であり、鳥である確率は5%である。よって、これは犬である】というように画像を分類します。
③分類精度のテスト
画像の学習が完了したら、次は分類精度をテストするプロセスに移行します。ここでは、学習に用いた画像とは異なる画像により精度を評価します。例えば、犬と猫と鳥を分類したい場合に、テスト用の犬の画像を与えて、AIがそれをちゃんと犬に分類するのかを確認します。
このように複数の対象物を評価する場合、それぞれの対象物の学習におけるデータ量に偏りがあると、分類精度にも影響が出てきます。例えば、鳥の画像データが不足していた場合、鳥の画像を与えても猫と分類されたりする場合があります。そのような場合には、新たに鳥のデータを用意し、再度学習させる必要があります。
④チューニング
最後は、それぞれの目的に合わせて分類精度をチューニングします。
例えば、犬、猫、鳥を分類したい場合に、以下の2つのパターンが考えられます。
①犬だけ分類したい(猫であるのか鳥であるのかはあまり重要ではない)
②3種類を正確に分類したい
①のパターンにおいては、犬以外の分類に重きをおかないため、「犬にある特徴」と「犬にない特徴」を中心に学習させることで、犬だけを確実に分類できるようにチューニングします。
②のパターンにおいては、それぞれ正確に分類したいため、求められる分類制度が得られるまで、3者の特徴をそれぞれ細かく学習させる必要があります。
画像分類AIを活用した事例
最後に、AI(ディープラーニング)による画像分類を活用した事例を3つご紹介します。
①アリババによるeコマースにおける画像分類AIの導入
「アイテムが多すぎて欲しいアイテムになかなかアクセスできない」
アマゾンや楽天、メルカリを利用したことがある方であれば一度は抱いたことがある悩みなのではないでしょうか。中国のアリババ社は、「淘宝(タオバオ)」や「天猫(Tmall)」などの通販サイトにおいて画像分類AIを導入することでそのクレームに対応しました。具体的には、機械学習と深層学習を活用した同社独自の画像検索エンジンである「Image Search」により、欲しい商品の写真をアップロードするだけで一瞬にして類似商品にたどり着ける画像検索システムを導入しました。
②マグロの品質判定における画像分類AIの導入
日本人が愛してやまない「マグロ」ですが、当然マグロにも品質があります。
これまで、マグロの品質は熟練者により判定されていました。しかし、高齢化により、熟練者の数は全盛期と比べ半減してしまい、ノウハウの継承という課題が生じました。そこで、電通と電通国際情報サービス、双日により、天然マグロの品質を判定することができる画像認識技術である「Tuna scope」が開発されました。焼津の水産工場において約4000本のキハダマグロの尾の断面画像が収集され、AIに機械学習させることで、10年かかると言われていたマグロの目利き技術をたった1か月で習得しました。気になる品質判定精度ですが、驚くことに、その道35年の熟練者と比べておよそ85%精度であることがわかっています。
③ワインの検査業務における画像分類AIの導入
こちらのワインの検査業務もマグロの品質判定と同様、人間の目視によって行われてきました。ワインボトルを光に透かすことで液体の中に異物が混入していないかを確認します。
この作業は非常に繊細なのですが、アサヒビールとNECによって、輸入ワインに異物が混同していないかを自動で検査できる機器が開発されました。この機器はAI(ディープラーニング)による画像分類技術を活用しており、ワインの品質安定に貢献しています。
まとめ
本記事では、AIの機械学習による画像分類の概要や開発プロセス、活用事例について紹介しました。AIがどのようなプロセスを踏んで画像を認識し、分類しているのかや身近なところで画像分類技術が活用されていることを理解していただけたのではないでしょうか。
AI開発やAIソリューションの導入をご検討している企業様は是非CMC Japanにお任せください。CMC Japanは30年の開発実績とAIを含む最先端のテクノロジーに精通している2200人以上のエンジニアをもって、お客様のプロジェクトをサポートいたします。当社独自のAIソリューションである「CIVAMS.Face:動画解析、顔認識ソリューション」、「CMC Voices:テキスト⇔音声変換ソリューション」、「C-Chatbot:AIチャットボット」などの導入をご検討している企業様もお気軽にお問い合わせください。