セミナーレポート
画像センシングからみたAI 技術への期待オムロン(株) 技術・知財本部 技術専門職 諏訪 正樹
本記事は、国際画像機器展2017にて開催された特別招待講演を記事化したものになります。
物理計測の難しさ
物理世界を切り取ることそのものにも難しさがあります。例えば,先ほど紹介したステレオ画像計測だと,鏡に映ったボールの映像がある場合に,どこに鏡があるのかを計測するのは困難です。もちろん今のAI技術を使えば,鏡の向こうにボールが映っているというシーンの解釈はできます。ところが,物理計測という側面でいくと,光線経路長としての距離を測るため,鏡で反射された光が跳ね返った距離を測ってしまいます。鏡までの距離を測りたければ,鏡までの距離を測る計測原理にスイッチしなくてはいけません。何をセンシングしたいのか,という物理情報取得の原理選択が必要になってくるのです。現在,私は産業用途の光計測の研究開発も行っています。いくつかの種類の球が映っている映像があった場合,これらの球が黒色であったり,透明,あるいは半透明であったり,あるいは球どうしが近接している状況では,そのすべての球の形状を統一的に計測できる実用的な計測原理は今のところありません。いくつもの光学的物理現象が映像の中に発生してくるからです。光源から出た光が,お互いの球で反射したり,光が透過したり,表面上に光が少し潜り込んで別の場所から出てくる表面化散乱,といった現象があるのです。それらの挙動を一元的に捉える画像センシングの原理を構築するのは非常に難しいと言えます。それを行うためには,光線の情報を一つひとつトレースする光伝播(Light Transport)の解析が必要になります。
画像センシング技術では,センサーデバイスを固定した場合,人や車の検出など意味情報への変換ではおそらくニューラルネットワークを使えば一番性能がよく出ます。それはBlack-Box型モデル化です。そこに至るまでには,Gray-Box型モデル化の時代がありました。アンサンブル学習を使い,特徴は人間が設計し,後段を機械に任せるというものです。しかし,カメラで明るさを取る情報に,距離情報を取るセンサーデバイスが生まれると,今度は輝度情報ベースのセンサー出力によるBlack-Box型モデル化を超えるWhite-Box型モデル化を実現することが可能になります。White-Box型モデル化で作ったほうが,明快性が出て,場合によってはコストも安く作れます。さらに性能を上げていくためには,そのセンサーデバイスにニューラルネットワークを使うという選択肢が出てくるでしょう。まさに,センサーデバイスの進化に合わせてWhite-Box型モデル化とBlack-Box型モデル化とが,スパイラルに上昇していくのが,今の画像センシングの構造です。そこでは,AI技術の進展とともに,物理世界を切り取るセンサーの進化がますます重要になってきています。
オムロン(株) 技術・知財本部 技術専門職 諏訪 正樹
1997年 立命館大学理工学研究科博士後期課程修了。同年オムロン(株)入社。入社以来,画像・光センシングの研究開発に従事。博士(工学)。2010年より奈良先端科学技術大学院大学情報科学研究科 客員教授兼任。2013年より九州工業大学 生命工学研究科 客員教授兼任。