セミナーレポート
ロボットに使える最新画像処理技術 ~物体認識のための画像局所特微量~中部大学 藤吉 弘亘
本記事は、画像センシング展2010にて開催された特別招待講演を記事化したものになります。
3世代に分かれる特徴量
物体検出に用いられる特徴量を3つの世代に分けてみました。第1世代は1970年から2000年ぐらいまで。当時は単純な線形判別関数やニューラルネットワークを使っていました。この世代では,画像全体から得られる特徴量や,研究者・開発者の「きっとこれはよいはず」という思い込み,あるいは経験に頼って特徴量を決定していたと思います。第2世代の2000年以降になると,特徴量自体をローレベル化することで画像の局所領域に着目するようになりました。ローレベル化によって次元数が増えると,第1世代に使われたニューラルネットワークの識別器では学習ができないとか,計算時間が非常にかかるという問題が出てきました。そこで,アダブーストのような手法を使えば,多くの特徴次元の中から必要な特徴量を自動選択できるようになります。この組み合わせがうまくいったのが「顔検出」のケースです。
第3世代では,第2世代で特徴量をローレベル化したので,これをもう少し進化させようということになりました。特徴量間の関連性を自動的に見つけ,特徴量の最適な組み合わせを探すことによって,ローレベルな特徴量を組み合わせたミドルレベルな特徴量として,「Joint Haar-like」や「Joint HOG」といったアプローチが提案されています。
<次ページへ続く>
中部大学 藤吉 弘亘
1997年,中部大学 大学院博士後期課程修了。1997年~2000年,米カーネギーメロン大学ロボット工学研究所Postdoctoral Fellow。
2000年より中部大学講師。
2004年,同大准教授。2006年,米カーネギーメロン大学ロボット工学研究所客員研究員。