セミナーレポート
行動解析技術の最前線オムロン(株) 技術・知財本部 研究開発センタ AI制御研究室 主査 高橋 智洋
本記事は、国際画像機器展2021にて開催された特別招待講演を記事化したものになります。
Unsupervised domain adaptation
機械学習の分野で最も有名な画像データセットの1つであるMNISTでtest accuracy(テストデータに対する精度)が99%出るようなニューラルネットワークが用意できたとします。それに対して,ほとんど同じような画像データであるUSPSのtest accuracyをこのニューラルネットワークで測ると,70%程度しか出ないと言われています。これは,deep learningの実運用面において,手元の環境でデータを集めてラベル付けして学習しても運用環境では違うドメインのデータで精度が出ない可能性を示唆しています。時間的な問題などで,運用環境のデータにラベル付けができないことはよくあります。そのときは,手元の環境(以下,ソースドメイン)の画像とラベル情報,運用環境(以下,ターゲットドメイン)の画像だけで,精度のよいものを作る必要があります。そのために必要な技術がUnsupervised domain adaptationであり,ここでは,例えばGANを使ったUnsupervised domain adaptationの手法を紹介します。
そもそもなぜドメインが違うとうまくいかないのでしょうか。ソースドメインで学習したニューラルネットワークを,前半を特徴量抽出器,後半を識別機と,便宜的に2つに割って考えます.このとき,ソースとターゲットで特徴量抽出器にかけてできた特徴量ベクトルの分布を見ると当然それらは変わってしまい,その結果,うまく後半の識別機が機能しなくなります。そのためドメインが変わると学習したニューラルネットワーク全体が機能しなくなります。そこで,別途ターゲットの特徴量抽出器を用意して,「ソースの画像群をソースで作った特徴量抽出器にかけてできる分布」と「ターゲットの画像群をターゲットの特徴量抽出器にかけてできる分布」を合わせるようにターゲット特徴量抽出器を学習することを考えます。もしこのようにできれば,ターゲットの特徴量抽出器とソースで作った識別機を合わせたニューラルネットワークはターゲットでも有効になります。この分布を合わせるためにGANという「寄せる学習」を利用する,というのがGANを使ったUnsupervised domain adaptationの最も基本的なやり方となっています。例えば,ADDAなどが初期からある有名な手法となっています。
最近の研究では,Object detectionに対するdomain adaptationの精度向上や,Semantic segmentationに対するdomain adaptationの精度向上が図られています。また,脳波など日ごとに違うものをdomain adaptationで吸収できるという研究があります。さらに,街中の監視カメラで,それぞれのカメラ画像が違うドメインであることを意識して新しいカメラ画像にアダプテーションする研究も進んでいます。
GANと言えば画像生成ですが,何に使えるのか,「CAN We GAN?」と思われている方もいると思います。それに対して今回は実利用できるかもしれない例を2つ紹介しました。この機に研究が進み「Yes, We GAN!!」と言えるようになれればと思っています。
オムロン(株) 技術・知財本部 研究開発センタ AI制御研究室 主査 高橋 智洋
2013年京都大学大学院博士後期課程修了。博士(理学)。2011~2013年 日本学術振興会特別研究員(DC2)。大学院では理論宇宙物理学を専攻する。修了後,NTTデータ数理システムにて数理最適化に関する業務に従事。主に大規模離散最適化問題に関して,ソフトウェアの開発や個別コンサルティングを行う。数理最適化と並行し機械学習を独学。前職のABEJAでは画像解析をターゲットとした深層学習の調査や実装に従事。現職のオムロンではロボティクスに関する研究を行っている。