セミナーレポート
ディープラーニング入門~基本的な仕組みと画像データへの応用例~横浜国立大学 大学院 環境情報研究院 准教授 白川 真一
本記事は、画像センシング展2021にて開催された特別招待講演を記事化したものになります。
>> OplusE 2021年9・10月号(第481号)記事掲載 <<
ディープラーニングの基本的な仕組み
機械学習は,予測や意思決定を行うためのモデルをデータに基づいて構築する方法です。モデルとは,関数やルール表現などを言います。例えば,予測のモデルがあったときに,画像を入れるとカップというカテゴリーに変換したり,モノクロ画像をカラー画像に変換したりする関数のことです。入力と出力はいろいろなパターンが考えられ,これらを変えることで応用ができます。囲碁なら盤面を入力すると次の一手が出力されますし,翻訳なら日本語を入力すると英語が出力されます。音声認識なら音声信号を入力するとテキストが出力されます。モデルの部分は人が作ってもいいですが,今の主流はデータを使って機械自身で学習するものになってきています。機械学習の中でも,深いモデルを使うのを,ディープラーニング(深層学習)と言います。ニューラルネットワークは,非線形の計算ユニットを組み合わせた計算モデルで,複数の計算ユニットを何層も並べたものです。1つの計算ユニットでは,入力信号が入ってくると,それに重み付けをして足し,最後に非線形変換の処理をします。ポイントは,こうした単純な演算素子をたくさん並べて組み合わせることで,全体として非常に複雑な関数になります。計算ユニット内の重みパラメータを変えるとネットワークの応答が変わります。これらをデータに基づいて調整することを学習と呼びます。
ディープラーニングにおける「学習」と「推論」の方法としては,画像分類モデルでは画像とその正解ラベルを訓練データとして準備し,訓練データを上手く分類できるようにニューラルネットワーク内の重みパラメータを調整します。これが「学習」です。ディープラーニングの学習では,訓練データを入力し,誤差(損失)を計算して,誤差が小さくなるように重みを更新するのを繰り返していきます。そして,学習したニューラルネットワークを新しいデータの予測に使います。これが「推論」です。できあがったモデルを使ってサービスを提供したり,効率化できるようにしたりするためには,「推論」での精度を高める必要があります。
<次ページへ続く>
横浜国立大学 大学院 環境情報研究院 准教授 白川 真一
2009年 横浜国立大学 大学院環境情報学府 博士課程後期修了 2008 ~2010年 日本学術振興会特別研究員 2010~2012年 株式会社富士通研究所研究員 2012~2015年 青山学院大学 理工学部 情報テクノロジー学科助手および助教 2015~ 2016年 筑波大学システム情報系助教 2016年より横浜国立大学大学院環境情報研究院講師。2021年より同准教授。機械学習,ディープラーニング,進化計算,およびそれらの応用研究に従事。博士(工学)。