昔の価値観にとらわれるな。古い常識の真逆のことに正解が潜んでいることがある。慶應義塾大学 斎藤 英雄
この20年間やってきた研究が今,世界で進化し続けている
聞き手:現在,中心にされていらっしゃるご研究についてお話いただけますでしょうか。斎藤:画像は,例えば640×480個のあくまでも単なる明るさの分布ですが,1990年代にはそれだけのものから画像に映っているものを3次元的にセンシングするという研究テーマが流行っていました。そのような分野で世界のトップを走っていたのが,カーネギーメロン大学の金出武雄先生の研究室でした。論文では知っていましたが,1997年にそのカーネギーメロン大学に留学するチャンスを得ました。当時,研究室ではカメラを部屋中に50台設置して,その中で人が踊っているといった状況をすべて3次元的にキャプチャーするようなことをしていました。
基本的な考え方としては,カメラで撮影した画像から3次元の画像を作るので,様々な視点から同じ画像を撮れば形がわかりますし,たくさんのカメラを並べれば裏側を含めて全体の形が測れます。さらにそれを動画で撮れば,時系列で形が変わっていくのがわかります。考えてみれば当たり前のことなのですが,それをたくさんのカメラを使って同時に撮影し,それらのデータを全部コンピュータに取り込んで計算させ,時々刻々変化する3次元の形を出していくのを力ずくで実現させるということをやったわけです。
世界のトップを行く研究ですから,日本中のこの分野の研究者が金出先生のもとに集まっていました。それは日本に帰ってきてからも続いていて,いろいろな研究者同士のつながりができ,私にとっても大きな収穫でした。当時から金出先生は,コンピュータビジョンをやるにしても,使えなければ意味がないとおっしゃっていました。当時は私を含め若手の研究者は,そうは言っても使えるわけがないと思っていましたし,実際に実用で使えるようにはなりませんでした。しかし,金出先生のグループは,その当時から使えるものとして意識してやっておられたのです。そういうスタンスを貫かれた先生のもとで研究ができたのは良かったですし,今でもその当時に培ったものを使いながら研究を続けています。
昔は,例えば50台のカメラを使うなら,初めにすべてのカメラの位置関係を測り,それから撮影をしなければなりませんでした。その作業にものすごいエネルギーをかけていました。しかし,そうしたことをやらなくても済む方法が,90年代後半から2000年初頭にかけていろいろな人がアイデアを出し,実現できることがわかってきました。最近では,この20年間やってきた研究がいろいろな人の手によってどんどん進化しています。比較的簡単にできるプログラムとしてスマートフォンの中にも実装されるようになってきましたし,機械学習で画像に映っている物体や人の名前を認識できるようになってきました。
社会のニーズを見据え,役立てていくことが重要
聞き手:コンピュータビジョンのこれからの方向性,可能性について,先生はどのようにお考えになっていますか。斎藤:コンピュータビジョンの研究は,歴史的には1970年代くらいからスタートしました。コンピュータというのは人間の脳と同じことができる機械だと信じ,人間の思考回路をコンピュータのプログラムに入れれば,人間と同じことができるようになるだろうとやっていたわけです。そのときに,目からの入力にあたる視覚が重要だとわかってきて,人工知能を作ろうとする人たちの間で,目から入ってくる情報をいかに処理するかがテーマになってきました。そうした技術に特化したコンピュータビジョンという分野が,70年代後半から80年代前半にかけて新しく生まれたのです。
先ほども述べたように,当時の研究者は余計なノイズがないような理想的な環境を,実験室の中に無理やり作って画像を撮影し,その画像から3次元の画像を得ていたわけです。
それが今では進化し,特別な環境を作らなくても,普通に撮った写真からでも3次元形状がわかるようになってきました。そういう意味では,ついに実用化できるようなフェーズに入ってきたわけです。私が最初に取り組んでいた90年代は,コンピュータビジョンについてどのメーカーに話しても,こんな技術は使えない,お金にならないと言われていました。当時はまだまったく使えない技術だったのです。それが今では,すぐに使えて,商品として,サービスとして成り立つようになってきました。
そうなると,コンピュータビジョンのこれからの研究としては,それらをいろいろなところに実装して,世の中を変えていく,社会を変えていくのが大切になります。あまねく一般の方々にコンピュータビジョンの恩恵を受けてもらう。コンピュータビジョンが生活や社会の中で普通に使われていく,そういうフェーズに入っていくと思っています。 その代表的な例が自動運転で,人間の目と同じようにクルマが周りの情報をセンシングして,状況を瞬時に認識し,それに合わせてクルマをコントロールする。それが実用レベルになってきました。自動運転以外にも,空港での顔認証など,今はコンピュータビジョンが世界中至るところで使われるようになってきています。
これらの変化は, 昔からコンピュータビジョンの研究に取り組んできた人間にすると,信じられないというか魔法のような気がして,感慨深いものがあります。もちろん,一般の方々にとっては普通にできて当たり前です。ですから,これからの研究としては,実用をしっかり意識し,実際に現場で困っていること,求めているニーズを見据え,社会に役立てていくことがますます重要になっていくと思っています。
<次ページへ続く>
斎藤 英雄(さいとう・ひでお)
1992年 慶應義塾大学理工学部助手 1995年 同専任講師 を経て 2006年 慶應義塾大学理工学部教授(~現在) 1997~1999年 カーネギーメロン大学ロボット工学研究所の客員研究員兼務 2006~2011年 JST CREST研究代表者●研究分野
コンピュータ・ビジョン,画像センシング・画像認識,仮想現実感・拡張現実感,人の挙動センシング・認識とその応用
●主な活動・受賞歴等
一般社団法人電子情報通信学会(IEICE)フェロー,日本バーチャルリアリティ学会フェロー,映像情報メディア学会会員,日本計測自動制御学会会員,日本情報処理学会シニアメンバー,IEEEシニアメンバー