セミナーレポート
運転の自動化のための画像認識技術(株)東芝 研究開発センター 岡田 隆三
本記事は、画像センシング展2017にて開催された誰にでもわかる特別講演を記事化したものになります。
CoHOG特徴量による歩行者検出
運転の自動化技術の基本構成としては,「知覚」「認識」「予測」「判断」「操作」という流れがあります。今回ではその中でも画像による「認識」を取り上げています。自動運転に必要な画像認識技術については,自動運転の進展にともない,必要機能が増大かつ高度化しています。例えば,歩行者に対する自動ブレーキの場合,歩行者の検出が必要になります。パターン認識で画像から人を検出する,または距離を計測し,道路面上にないものということで,歩行者を検出するといったやり方が考えられます。歩行者がどちらの方向に動いているかといった速度の計測も必要になってきます。
東芝の取り組みとして,機械学習による歩行者検出技術を紹介します。まず,事前に大量の人物と非人物の画像を用意します。そこから当社のCoHOGという特徴量を使い特徴抽出をし,SVM(Support Vector Machine)を用いて規則性を学習させます。これが辞書にあたります。実際に車の中ではオンラインリアルタイム処理で,この辞書を用いて,未知の画像から人がいるかどうかを識別します。矩形の画像を切り出し,CoHOGで特徴抽出をし,SVMで識別して認識結果を出します。
HOG(Histograms of Oriented Gradients)は,輝度の勾配方向をヒストグラム化したものです。矩形の中で,縦の線が何画素あるか,斜めの線が何画素あるかをカウントしてヒストグラムを作ります。利点としては,照明変化や微小な形状変化に頑健ということがあります。欠点としては,局所的な形状の情報が欠落するということが挙げられます。こうした欠点を解決するために,当社で開発したのが,画像の輝度勾配方向の共起ヒストグラムCoHOGです。HOGに局所的な形状(曲率)の情報を付加することで記述力が向上します。
CoHOGでは,画像の濃淡の情報しか使っていません。色の情報を使えばさらに性能が向上するということで,複合共起特徴量という考え方があります。モノクロ情報だけでなく,相対色,絶対色の情報を使い,色分布や模様,形状を計測。相補的に機能することで,高い識別性能を達成します。その一つが,CoHOGのカラー版であるColor CoHOGです。このような複合共起特徴量により,視認性の低い夜間の人物検出も可能にしています。
<次ページへ続く>
(株)東芝 研究開発センター 岡田 隆三
1999年 大阪大学大学院工学研究科博士課程修了。博士(工学)。同年,(株)東芝入社。研究開発センターにて,車載画像認識,映像監視を中心にコンピュータビジョン技術,システムの研究開発に従事。2006年~2008年 カリフォルニア大学ロサンゼルス校客員研究員。電子情報通信学会会員。