深層学習と記号推論の本質的な融合
2年くらいからホットな話ですが、その後、どのくらい進展しているのでしょうか?
「深層学習と記号推論の本質的な融合」
口で言うのは簡単ですが、「記号推論」の計算量は、どれくらいでしょうか。また、記号の定義(学習)がどれくらいできるものなのでしょうか。
ここのところ、Googleのアレフゼロの凄さについて考えていたのですが、実は意外と囲碁将棋の探索空間は狭いのではないか、という考えに、おらはなりつつあります。
もちろん人間にとっては十分広いですが…
「着手可能」な選択肢の広さと、「形勢判断に概ね十分な先読みの手数」の深さで、探索空間の大きさが決まります。
よく言われるのは天文学的な数字ですが、それがほんとなら、いくらアレフゼロが大規模並列処理をやっているとはいえ、一日で学習できて、せいぜい数分で推論できるとは思えません。
また、囲碁将棋は、特徴量の表現が、きわめて限られています。記号の集合がきわめて狭いのです。しかもセンシングは不要で(リコーは将棋の自動採譜を画像認識で作りましたがきわめてセンシングが簡単です(笑))、記号の意味は現実世界への写像が不要で、意味解釈(形勢判断)がそれなりに近似できます。だから、アレフゼロは一日で特徴量が抽出できる、すなわち深層学習できるのです。
囲碁将棋は解決してしまった問題です。
未解決で、記号推論が必要で、まさにAIチャレンジしがいのある課題はなんでしょうか。
医療画像診断は研究が盛んで、実用可能な疾病も増えてきていると思いますが、これは深層学習による画像認識であり、記号推論は現状では無いと思います。
疾病により画像の特徴量が変わるので、学習が必要です。プラットフォームがひとつあって、それを動かせば色々な診断システムが出来上がるのなら良いのですが、学習のためのデータをどうするか。医学生のアルバイトを使って画像にラベル付けを行うようなことも考えられますが、実現はなかなか大変です。記号推論の融合という話とは別の難しい課題です。
記号推論が必要なのは、画像処理なら先日書いたようなコンテキストの問題とか、自然言語理解とか、判断の必要な高度な車輌自動運転などがあると思います。
車輌の自動運転には、きわめて興味があります。画像処理は必須ですが、画像処理結果に対してどう行動するかの部分では、記号推論が必要なのではないかと思います。
例えば、横断歩道のところで子供が手を上げて立っています。あるいは犬が歩いています。あるいは主婦が立ち話をしています。横断歩道に信号はあるのか。車輌の速度はどれくらい出ているか。斜め後方から自転車が追い抜いてこないか。法令では、渡ろうとしている人がいたら、横断歩道前で停止しなければなりません。
画像に対して特徴量を抽出して子供や犬のラベルを記号として自動付与することは、現状でかなりできるようになりました。横断歩道の認識はもっと容易でしょう。しかし記号の組み合わせに対してどう推論したら良いのでしょうか。
しかも、子供も犬も動くのです。ならば動作に対する記号も必要です。記号の世界が、囲碁将棋と比べものにならないほど、広くて複雑です。そして瞬間瞬間で先読み、すなわち記号推論をして、行動を決定しなければなりません。
囲碁将棋とは探索空間の形がだいぶ違うと思いますが、推論という意味では同じです。探索空間が定義出来れば、理屈的には囲碁将棋のように学習して推論できるでしょう。しかし、探索空間の定義をどうやったら良いのでしょうか?アレフゼロのように勝ち負け、つまり、「良い運転と悪い運転。絶対にあってはならない状態(事故)」のような評価結果だけ教えてやれば、あとは深層学習可能なものでしょうか?
しかも、「犬とラクダの違いが認識難しい」というセンシングと認識の脆弱性もあります。
上に書いたように、囲碁将棋にセンシングの問題はありません。ただし、形勢判断と探索の融合の問題が似ています。日本の将棋AIでは、最近深層学習が導入されたばかりであり、まだ完全に解決されていません。深層学習系のソフトは終盤の読みが苦手とされているのです。(Googleは解決済だと思います)
複雑な現実の問題解決においては、認識の失敗を記号推論で訂正してやることがきわめて重要です。まさにこれこそが深層学習認識と記号推論の融合として課題になっているものの一つです。
「ラクダが横断歩道にいるわけが無いから、あれは子供の着ぐるみだ。止まらねば!」というように、ラベルの張替えを行なって推論結果を変える必要があるのです。
Googleのブローブカーは、日夜、世界中を走り回って、膨大な量のデータを学習しています。彼らはGoogleマップのビジネスがあるので、広告料を稼ぎながら、AI自動運転の研究ができるのです。
私はAIへの過度な期待は全く持っておらず、AIでできることには依然として懐疑的ですが、アレフゼロを知って以来、自動運転に関しては、ある程度できるようになるのではないか、という考えになってきました。高速道路での手放し運転は既に実用化されていますし、一般道での限定的実験もそれなりにやられています。
日本のAI研究開発は大丈夫でしょうか?
トヨタは、全車種に通信機能を標準装備し始めました。2019年発売のRAV4あたりがその先陣です。そして、毎週、おらの運転に対して「安全運転100点、エコ運転70点」の採点をしたデータがサーバに記録されてスマホで何時でも見られるのです。ひとつの狙いは、自動運転のための学習データ収集にあるはずです。今は無料ですがやがて有料契約に移行します。おらは広告載せても良いから無料にしてほしいなあと思います。
でも車には強いトヨタですが、Googleのサーバとは比べ物にならないです。AUと協業しているはずですが、自動運転の能力が学習と記号推論能力で決まるとすると、日本メーカーはトヨタですら、Googleには全く敵わないでしょう。
AIについていろいろ考えると、夢が膨らんで楽しいのですが、トヨタですら大変だろうな、と思って、日本の将来がますます不安になります。