セミナーレポート
QoL向上のための画像センシング技術慶應義塾大学 青木 義満
本記事は、画像センシング展2017にて開催された誰にでもかる特別講演を記事化したものになります。
QoL向上のコアとなる画像センシング技術
QoL(Quality of Life)に関わる画像センシングの産業ニーズは多様ですが,その中で私自身が関わってきたものとしては,「セキュリティー,見守り」「マーケティング」「スポーツ」「技能計測」「食生活支援」といった分野が挙げられます。これらの分野では,単なる物体検出・シーン認識をするだけではなく,より複雑な事象の抽出・評価・理解までを可能にすることが求められています。「画像・映像の認識・理解」の本質的な難しさは,画素の持つ色情報と物体領域などの画像内容との間のSemantic Gap(意味上の隔たり)を埋めることが必要になるということです。従来は,特徴を抽出し,判別ルールをプログラミングし,ギャップを埋めていました。1997年にいくつかの大学と共同で,顔特徴点を検出し,顔画像認識をするというソフトウェアを作りました。しかし,あらゆるバリエーションが起こりうる実世界を対象とした画像では,認識に有効な「特徴量」と「識別器」の設計が大きな課題でした。
その後,HOG(Histograms of Oriented Gradients)などを用いた,局所的な画像特徴量の抽出や,機械学習による特徴量と学習サンプルに基づいた識別境界の自動決定などにより,画像認識のイノベーションが実現しました。
マーケティングの購買行動の分析として,統計モデリングを活用し,高速・高精度に人物を検出・追跡。人間らしい形状特徴を最大限に利用して,追跡結果から対象の肩位置や大まかな姿勢の検出を可能にしました。これは,頭から肩にかけての輪郭形状を教師データとして作り,主成分分析にかけて次元を圧縮し,低次元のモデルを使って画像特徴とのマッチングを行うというものです。店内のどこに人がいるかという情報だけでなく,今どの棚に注意を向けているかというところまで推定できます。これらの技術を活用することで,サッカーの試合映像でフィールド内の全選手の実時間追跡も可能になっています。
現在は,ディープラーニングの深い階層構造を持つConvolutional Neural Networks(CNN,畳み込みニューラルネットワーク)を活用し,特徴抽出や識別を含め,エンドツーエンドで学習サンプルから識別結果を出すということができるようになっています。
<次ページへ続く>
慶應義塾大学 理工学部電子工学科教授 青木 義満
2001年 早稲田大学大学院理工学研究科博士課程修了,博士(工学)。2002年 芝浦工業大学工学部情報工学科専任講師。2005年 同助教授。2008年 慶應義塾大学理工学部電子工学科准教授。2017年 同教授。主な研究分野は,画像認識,人工知能,パターン認識。[主な学協会活動歴]
電気学会知覚融合センシング技術の実利用化協同研究委員会委員長,計測自動制御学会パターン計測部会主査,日本顔学会理事,画像センシングシンポジウム(SSII2015-2016)実行委員長,画像センシング技術研究会組織委員,ステアリングコミッティ委員長,NEDO技術評価委員等。