セミナーレポート
少量データ向け深層学習技術NECデータサイエンス研究所 佐藤 敦
本記事は、国際画像機器展2019にて開催された特別招待講演を記事化したものになります。
>> OplusE 2020年1・2月号(第471号)記事掲載 <<
パターン認識と深層学習 特徴抽出と識別の関係
2012年の大規模画像認識コンテスト(ILSVRC)で,トロント大学チームが深層学習(ディープラーニング)を使い圧勝したのをきっかけに,深層学習がブームになりました。その後,認識精度が飛躍的に向上し,2015年には人間の精度を超えたと言われています。それはまさに,大量の学習データと,膨大な計算リソースによる試行錯誤的なアーキテクチャーの探索にあります。計算リソースに関してはGPUを大量に使えば何とかなりますが,データに関しては簡単に集めることはできず,コストもかかることから,深層学習を活用する際の課題になっています。学習データがどれくらい必要かは一概には言えませんが,Yoshua Bengio(モントリオール大学)らによる経験則では,認識対象あたり5000件の正解つきデータを集めれば受け入れ可能な精度が得られ,人間と同等以上の精度を出すには1000万件集めなければならないと言われています。現実にはそんなにたくさん集められません。少ない学習データでの機械学習は,産業上非常に重要になっています。例えば,異常データなど本質的にデータの発生頻度が少ない場合,医療データなど正解づけコストが非常に高い場合,スタートアップを早くしたい場合などでは,少ない学習データでも深層学習を活用したいニーズがあります。
パターン認識とは,属すべきクラスにパターンを対応づける操作のことで,パターンは信号の空間的・時間的変化,クラスは同等とみなされるパターンの集合概念で,カテゴリとも呼ばれます。パターン認識では,観測されたものを「前処理」し,「特徴抽出」して「識別」する処理過程があります。「前処理」では信号の正規化やノイズの除去,「特徴抽出」では多次元特徴量の抽出,「識別」では類似度計算によるクラス判別を行いますが,高精度を得るにはすべての過程を最適化することが重要です。特徴抽出と識別の関係では,特徴量の分布がクラスごとにまとまっていれば容易に識別できますが,クラス間で分布の重なりが大きいと識別できません。逆に言うと,よい特徴が得られれば,少量のデータを登録するだけでも高精度が得られるのです。
<次ページへ続く>
NECデータサイエンス研究所 佐藤 敦
1989年 東北大学大学院理学研究科博士課程了。理学博士。同年NEC入社,中央研究所にてパターン認識,機械学習の研究開発に従事。郵便区分機向け文字認識の開発,顔認証エンジンNeoFaceの開発にも携わる。1994~1995年 米国ワシントン大学客員研究員,2008年 米国マサチューセッツ工科大学客員研究員。現在,NECデータサイエンス研究所主席研究員。東京大学大学院情報理工学系研究科客員教授,理研AIP-NEC連携センター 副連携センター長を兼務。2010年度情報処理学会喜安記念業績賞,2012年度電子情報通信学会業績賞,2014年度全国発明表彰発明賞など受賞。