セミナーレポート
ディープラーニング入門~基本的な仕組みと画像データへの応用例~横浜国立大学 大学院 環境情報研究院 准教授 白川 真一
本記事は、画像センシング展2021にて開催された特別招待講演を記事化したものになります。
画像に関する応用例
ディープラーニングの大まかな流れとしては,最初に作成したいモデルの入力と出力を決めます。そして,データを集め,ニューラルネットワークを設計します。そして,誤差などを定義して,学習させ,学習済みのモデルを新データの予測に使うという手順になります。CNNの応用例としては,画像分類をはじめ,物体検出,領域を抽出するセグメンテーション,異常検知などがあります。ニューラルネットワークの大きな特徴は,自由度が高いことにあります。画像であれば,画像をそのまま入力データに加えることができます。従来の機械学習ではユーザーが設計していた特徴抽出プロセスも学習可能です。また,異なるモダリティを容易に扱うことができます。最近では,End-to-End学習で,画像から直接どこに何がいるかを出してくれるネットワークも提案されています。また,画像からその領域が細胞や有機物であることを特定するように,画像を入れて出力が画像になるようなネットワークも作れます。サイズが大きくなるような逆畳み込み層を導入し,アップサンプリングを行います。その形がUの字であることから,U-Netと呼ばれています。同じ要領で,欠損画像を修復してくれる画像修復や,テキストからの画像生成も可能になっています。
ニューラルネットワークが作り出した画像が本物かどうかを識別する別のニューラルネットワークを導入して学習するのが,GAN(Generative Adversarial Network:敵対的生成ネットワーク)です。2つのニューラルネットワークを同時に訓練し,生成器は識別器が間違えるように学習し,識別器は本物と生成画像を識別できるように学習します。
今は,様々なフレームワークやツールのおかげで,ディープラーニングを使う敷居は低くなっています。ディープラーニングを上手く使うためには,まず何がやりたいのかを明確に設定することです。データを集めるのが難しければ,あえて使わないという選択肢もあります。ディープラーニングを使うための各種設定項目は独立ではなく密接に関連しているので,一連のプロセスを評価して改善していくことが重要です。
横浜国立大学 大学院 環境情報研究院 准教授 白川 真一
2009年 横浜国立大学 大学院環境情報学府 博士課程後期修了 2008 ~2010年 日本学術振興会特別研究員 2010~2012年 株式会社富士通研究所研究員 2012~2015年 青山学院大学 理工学部 情報テクノロジー学科助手および助教 2015~ 2016年 筑波大学システム情報系助教 2016年より横浜国立大学大学院環境情報研究院講師。2021年より同准教授。機械学習,ディープラーニング,進化計算,およびそれらの応用研究に従事。博士(工学)。