セミナーレポート
感性・意識の画像センシングは可能か? ~画像センシング技術試論~中京大学大学院 輿水 大和
本記事は、画像センシング展2010にて開催された特別招待講演プレインタビューを記事化したものになります。
「平均顔仮説」
聞き手:ご研究の中で,何か具体的な形にされたものがあるのですか?輿水:私の研究室では1980年代から「ピカソ」という似顔絵ロボットを開発しています。この似顔絵ロボットは,2005年の愛知万博では全国的にも世界的にも宣伝してもらいました。愛知万博ではロボットの名前を「クーパー」と変えて展示しました。展示期間中に私たちのロボットのところに10万人ぐらいがやって来て,似顔絵を子どもたちに体験してもらおうと「さあ,撮られたい人は?」と聞いたら全員がワーッと手を挙げる大騒ぎになりました。11日間の展示期間中に1日500人ぐらいのラッキーな来場者に,名古屋なのでエビフライが有名だからえびせんをレーザーで焦がして似顔絵を描いて,「すぐ食べるなよ」と言って子供たちにあげました(笑)。
この似顔絵ロボットの本質は何だと思いますか? 似顔絵ロボットの作品は似顔絵でしょう。では,この似顔絵の品質評価は何でしょうか。似顔絵ロボットという機械が,アウトプットとしてせんべいに似顔絵を描いてくれる。これをもらった子が似顔絵を見て,「ひどい」とか「似てる」,「そっくりだ」と言うわけです。ロボットは子供たちの顔を撮って画像解析して,似顔絵に変換して描いてあげます。「その子らしい」というのであれば,撮った画像を高解像度のプリンターでそのままプリントしてあげればいい。でも,これでは喜ばない。なぜ喜ばないかというと,そんなものはいつも見慣れているからです。
聞き手:言ってしまえば,写真を撮ればよいだけの話になってしまいますね。
輿水:でも,それでは誰も喜ばない。良いのか悪いのか分からないけれども,線画にして,目の大きな子は目を大きくして,鼻が大きければ鼻を大きくして,髪の毛が少なければもっと少なく,目が離れてればもっと離して描く。そうすると「そっくりだ」といって喜んでくれるわけです。「あ,お姉ちゃんらしい」と言って弟が歓喜します。
つまり,「そっくり」ということをどうやって測るか,これが問題です。「そっくり」ということを評価する上で,その「そっくり感」をセンシングできないと困るでしょう。クルマの性能は「ここからあそこまで何リットルで走ったか」という量で評価すればいい。その結果,「あそこの会社よりはうちのほうが燃費がいいから確かに良い」と評価できます。似顔絵システムの問題は,アウトプットの性能を本質的に言い当てるような尺度がないということです。「似顔絵ロボット」といった瞬間に,そういう課題を背負ったことになる。
聞き手:評価できないと前に進めませんね。
輿水:では,どうするか。私たちはいくつかの手掛かりを見つけました。それをこれから申し上げます。
1つは,その人の顔の特徴を私たちがどう思っているのか,ということです。私たちが,人の顔の特徴を何を手掛かりにそう思っているのか。「平均顔」という顔がもしあるのならば,そこからの逸脱の程度がその人の顔の特徴に違いない。これはあくまで仮説です。でも,どうもそれらしい気がする。
そうであるなら,まず平均顔を作らなければいけません。私たちの手元には数千枚の顔のデータがあります。例えば,先ほどの愛知万博の子どもたちの顔写真2000枚ほどの研究用への使用許諾をもらっています。その顔を重ね合わせていくのです。どうやるかというと,顔の特徴的な点を例えば100点決めて,それぞれの人の点の座標を計測して平均値を出します。これを100点すべてにわたって出して,顔の形に再構成すると,なんとハンサムな顔になるのです。ということは,世の中のリアルな人間にハンサムはいないということになりますが(笑)。
聞き手:実際の人は必ずどこかズレてしまうのですね。
輿水:はい,必ずズレている。でも,たまたま平均顔に近い人もいます。その人はある意味,目鼻立ちが整っているんです。
聞き手:バランスがいいんですね。
輿水:はい。顔は長からず短からず。目も大きからず小さからず。配置も崩れがない。何も毒がない。男か女かもあいまい。どの尺度から見ても平均顔という顔を導入した瞬間に分かったことは,人の顔を見たときの特徴は「あの人は髪が少ない」とか「目が離れている」という部分で見ているに違いないということです。これが顔特徴発見の「平均顔仮説」です。
特徴的な似顔絵を作ろうとすると,研ナオコの目はどんどん離れていく。僕なんかの場合は逆に近づいていく。外国人と日本人の差でいうと,眉毛と目の間が日本人は間延びしています。これは骨格がそうだから。西洋人は横から見れば分かりますが凹凸が激しい。だから前から見ると眉毛と目の間が近く見える。日本人を外国人の平均顔と比較して誇張すると,やたらとこの間隔が間延びします。一方で,日本人の平均顔からチャールズ皇太子の似顔絵を作ると,目と眉毛がむやみに重なって見える。これこそが,日本人が外国の人を見たときの印象なんですね。
聞き手:同じ国の人を見た場合でも,彼を見る人の国籍によって見え方が違うということですか。
輿水:そうです。その国の人の持っている平均顔仮説に基づいて,今見たその人の特徴を誇張するという仕組みは,どうやらそんなに外れていないだろうと思っています。そうであるならば,似顔絵ロボットは平均顔仮説に乗って開発するのが良いと考えました。この平均顔仮説は結構うまくいっていて,いい画像をたくさん撮っておくと,平均顔としては品質のいいものが出来上がる。平均顔の品質がよければ,比較するときも品質の良い比較ができる。
また,平均顔を作る際の統計処理の結果,分散や標準偏差が出て来ますよね。目の形の違いやあごの形の違いなどは分散で見たら分かる。さらに,目とか口元とかのディテールは,分散が小さかったとしても重要度は大きい。なので,単に数値だけですべては理解できませんが,これらが手掛かりになると思っています。
聞き手:とても面白い話ですね。
輿水:今や「感性・意識の画像センシングは可能か」と問われたら「可能である」と答えられることが分かりますよね。そして注意深くなくてはいけません。ここまでの話の中にもあったように,形ある物質計測も感性や意識の計測も直接には,あるいは絶対的には測っていません。例えば,物の重さを量ろうというときに,あるいは物の長さを測ろうというときに,私たちは1kgとか1mという絶対的な基準があることを前提に「絶対的に測れる」と思ってしまうでしょう。しかし実は,「絶対的な物理計測」というものはありません。メートル原器というものは,ある物質の周波数から相対的に決めています。時間の計測もそうです。うるう年を入れなければならない理由は,われわれの時間の基準が絶対的なものではないからです。
そう考えると,感性計測とか感性センシング,意識センシングというものがそれほどあいまいなものとは思えなくなりませんか。長年使ってきた物質計測が絶対的なものではないことを考えると。だから,感性計測や意識計測にそれほどたじろぐことはないと思うのです。徹底的に,詳細に,時間をかけてやれば,今の物質科学と同じ程度,相対計測の連鎖で行けるかもしれないと考えています。
<次ページへ続く>
中京大学大学院 輿水 大和
1975年,名古屋大学大学院博士課程修了(工学博士)。同年,名古屋大学工学部助手に就任し,名古屋市工業研究所に所属。1986年,中京大学教養部教授に就任。1990年,同大学情報科学部教授。1994年,同大学院教授。2004年,情報科学部長。2006年より情報理工学部長, 2010年より大学院情報科学研究科長に就任。画像センシングや画像処理,顔学,デジタル化理論OKQT,ハフ変換などとそれらの産業応用の研究に従事。IEE,IEICE,SICE,JSPE,JFACE,JSAI/QCAV,FCV,MVA,SSII,ViEW,DIAなどで学会活動中。JFACE副会長,SSII会長,IAIP委員長など。仲間とともに,SSII2010優秀学術賞,小田原賞(IAIP/JSPE,2002,2005),IEE優秀論文発表賞(2004,2009,2010,2011など),技術奨励賞・新進賞(SICE2006,NDI2010)などを受賞。