セミナーレポート
ビッグデータをPCで自己学習可能な次世代AI“人工脳SOINN”とは何かSOINN/東京工業大学 長谷川 修
本記事は、国際画像機器展2016にて開催された特別招待講演を記事化したものになります。
ノイズを自動的に除去し,自ら学習し確信度を高めていく
SOINNの学習は「PCの中でSOINN細胞に情報をエサとして与え,培養する」といったイメージです。SOINNは完全教師無し学習手法であり,情報という「エサ」を与えれば,人が指示しなくても成長して知識を獲得していきます。例えば売り上げデータとツイッターの情報をSOINNに投入し,売れ筋商品と人の関心の因果関係を常時探索させれば,タイムリーな商品開発や経営判断に活用できるでしょう。これまでにSOINNで処理したベクトルデータで,最も高い次元数は36万次元です。このケースでは,元データは100万点以上の商品の説明文と,その商品を買った人のコメントのテキストデータでした。そこから主要な36万単語を抜き出し,36万次元のベクトルデータにしてそのままSOINNに学習させました。学習に要した時間は,市販のPC(Intel Core-i7, GPUなし)で商品全体の学習に数時間,個人の好みの学習とレコメンデーションは数ミリ秒でした。
日々の業務で上がってくるデータをSOINNに「観察」させ,データ間の因果関係を自己学習させることも可能です。現在SOINN社では,この機能を活用して災害予測を行っています。近年,異常気象により従来の気象モデルでは天気予報が当たらなくなってきています。そこでSOINNにネット上で無償提供されている気象の実績データを数時間おきに収集して学習させ,現状に即した気象の変動モデルを自己学習させています。この処理はネットにつながった市販のPC上で実現できるため,手間やコストを極めて低く抑えられます。
SOINNの学習パラメータを制御することで,SOINNに「性格付け」をすることも可能です。“頑固者”“新しいもの好き”のように,一度覚えたものはほとんど変えない性格や,新しいものをどんどん覚える性格など,ユーザーの好みや用途によってSOINNの性格を変えることができます。
SOINNは学習に必要な演算量が極めて少なく,C++やJavaといった多様なコンピューター言語で記述できるため,幅広いハードウエアで稼働します。既存の機器や装置,センサーなどに組み込まれたハードウエアでも動きます。
一般に,人工知能から何らかの処理結果を得た場合,その結果が信頼に足るものか否かは非常に重要です。SOINNでは,処理結果の信頼性を示す「確信度」や,その結果を得るまでの過程を表示させることも可能です。これらの情報を活用すれば,SOINNが何をどこまで学習したかを把握しつつ,誰でも簡単にSOINNに教示することができます。具体的には,例題を解かせつつSOINNの学習状況を把握し,学習が進んでいない事例や学習誤りを訂正する学習データを優先的に与えることで,効率的かつ確実にSOINNの学習を進めることができます。
実際,目視検査の熟練者(ITの非専門家)に,新人をトレーニングするように,直接SOINNに教示していただいた事例があります。通常このような場合,システムエンジニアが熟練者にヒアリングしてシステムを構築しますが,システムの性能がシステムエンジニアが理解できたレベルに留まってしまうリスクがあります。熟練者が人工知能を直接教示できれば,そのリスクをかなり回避できます。
<次ページへ続く>
SOINN㈱ 代表取締役/ CEO 東京工業大学 未来産業技術研究所 准教授(兼職) 長谷川 修
1993年東京大学大学院電子工学専攻博士課程修了。博士(工学)。通商産業省工業技術院 電子技術総合研究所研究員。1999年米国カーネギーメロン大学ロボティクス研究所客員研究員。2000年経済産業省産業技術総合研究所主任研究員。2002年から東京工業大学未来産業技術研究 准教授(兼職)。2014年からSOINN株式会社代表取締役/ CEO。