セミナーレポート
画像を見つめて50年カーネギーメロン大学 ワイタカー記念全学教授 金出 武雄
本記事は、国際画像機器展2021にて開催された特別招待講演を記事化したものになります。
数はしばしばモノを言う
そんなシナリオの例として,私が長く携わってきた「多数カメラシステム」があります。1980年代の終わりは,「バーチャル・リアリティ」という単語がもてはやされた時代でした。私は,バーチャル・リアリティはなぜ必要なのかを考えました。実は,その裏にリアル・リアリティというべきものがあり,実験をしたいけれども危険でできない,そもそも実験すらできないことに対して,バーチャル・リアリティによって実験,つまりシミュレーションをするということではないか。すると,リアル・リアリティをバーチャルに入れる仕組みがなければ役に立たないのではないかと考えました。現在の言葉で言えば,まさにデジタルツインです。もちろん,そんな言葉・そこまでの概念は思いつきませんでしたが…。デジタル化の基本は形ですから,1990年の始め,レーザーレンジファインダーを作りました。1秒で1万2000点,太陽光のもとでも測れる,当時としては優れたものができました。しかし,シーン全体をスキャンするのに10秒くらいかかったので,次に,リアルタイム3次元多眼ステレオカメラの開発に取り組みました。1992年,世界で初めて完全リアルタイムで,カラー画像(RGB)だけでなく対象までの距離(D)を取得するセンサーである,今でいうRGB-Dカメラを作りました。さらにシナリオを広げ,1台ではなく部屋中にカメラを置いて,部屋中をデジタル化するため,1995年に51台のカメラをつけたアナログの3D Domeを作りました。その後,2001年のアメリカン・フットボールのスーパーボウルXXXVで,33台のマルチカメラ・リプレイシステム「Eye Vision」として,CBSの全米テレビ中継で採用されました。中継の際にビデオ出演し,「スーパーボウルに出演した唯一の大学教授」となりました。これらの多数カメラシステムは,現在では普通に様々な場面で使われるようになり,2021年の東京オリンピックの放送では至るところで使われていましたね。
ところが,最初に作った5台のカメラを使ったマルチカメラステレオの論文は,IEEEに送ったところ,採択不可になりました。査読者は,「こんな不必要な数のカメラを使う高価な道具は使われないだろう」とのこと。専門家の固定概念は恐ろしいですね。今では,スマホでも2台も3台もカメラがついていますし,車には多くのカメラが搭載されています。ですので,多数のカメラを使うことに対して,何ら抵抗感のない時代になっています。 「数はしばしばものを言う」ことでしょうか。ディープラーニングも同じで,多層化することが大きなキーです。
<次ページへ続く>
カーネギーメロン大学 ワイタカー記念全学教授 金出 武雄
現在,米国カーネギーメロン大学ワイタカー記念全学教授,および京都大学高等研究院招聘特別教授。1974年京都大学で工学博士号取得後,同助手・助教授を経て,1980年に米国カーネギーメロン大学に移る。1992年から2001年にカーネギーメロン大学ロボット研究所の所長を務めた。コンピュータービジョン,ロボット工学,人工知能の分野でさまざまな研究を手がけ,400以上の論文を発表し,引用数15万3千件以上,全世界計算機科学者のTOP10のh-index 161をもつ。2019年 文化功労者,2016年 京都賞先端技術部門,2008年 フランクリン財団メダル・バウアー賞,2011年 アメリカ計算機学会と全米人工知能学会アレン・ニューウェル賞,2017年 米国電気電子学会(IEEE) Founders Medal,2018年 アルメニア国家賞グローバルITアワード,2007年 計算機視覚研究におけるAzriel Rosenfeld生涯業績賞など受賞。日本人最年少でアメリカ工学アカデミー特別会員,アメリカ芸術科学アカデミー会員,日本学士院会員。