記号創発ロボティクス：ボトムアップな知能を作る

1.はじめに

記号創発ロボティクスという学問分野がある。2010年代に生まれて日本の研究コミュニティを中心に成長してきた分野だ。

2010年代は人工知能ブームが巻き起こりディープラーニングが人工知能の代名詞として跋扈した時代ではあった。「ディープラーニングのみが人工知能にあらず」との主張はもっともであるが、一方でディープラーニングが無視できないだけの発展を生み出したのもまた事実である。

記号創発ロボティクスは認知発達ロボティクスをはじめとして、その前提となる分野の思想を継承しながら、ディープラーニングや確率的生成モデルといった機械学習の手法やモデルをその技術的（表現的）基盤として取り込みつつ、この十年間成長してきた。本稿では記号創発ロボティクスと、それが目指す知能理解および創造について「ボトムアップな知能理解」という視点からエッセイ的に導入を行いたい。

2.人間のような知能をつくる

人工知能やロボティクスの研究は「人間のような存在を作りたい」という原始的欲求に支えられていることが多いように思う。

だからSFアニメの中でのロボットの多くはヒューマノイド型だし、その研究も盛んなのだ。人型ロボットとしてのヒューマノイドを作ることについては記事『ヒューマノイド：人型ロボットの現在とこれから』に譲りここでは人間のような知能を作ることへと話を進めたい。

「人間のような知能を作りたい」という動機もさらにそれを二つの意味に分解することができる。端的に言えば工学と科学だ。その一つは人間のような知能を作りそれを意のままに操りたいという現実世界における支配的であり制御的である欲求だ。

これは経済的思考の皮を被せれば工学的とも言えるだろう。産業革命以降、人間は多くの労働を機械に代替させることで社会を作ってきた。産業革命のきっかけとなった蒸気機関に連なる機械は化石燃料をエネルギーに替えて、肉体的労働を代替するようになった。社会史的にはこれが奴隷解放に繋がることになるのだが、人類が行う労働全体から肉体労働の比率を小さくした。

肉体労働は自動化されたが、頭脳労働は自動化されなかった。思考や計算といったものの自動化は産業革命ではなされなかった。

第二次世界大戦に前後した時期に電子計算機が生まれて、計算機科学が勃興した。その後1956年にダートマス会議がアメリカで開かれて、「人工知能」という言葉が生まれる。人類は思考や計算といった頭脳労働を人工物に代替させる術を見出した。2010年代中盤から生じた人工知能ブームにおいて性能が向上し活用の進んだ画像認識、音声認識、ゲームAI、機械翻訳などといった様々な人工知能技術もこの延長線上に捉えられる。

そうやって私たちは「人間のような知能」を作ることで労働の代替を果たしていく。また、人間ではできなかった大規模な演算や思考を果たしていく。身近な例で言えば、時刻表に基づくリアルタイムの路線検索や、Uberのようなサービスにおける自動配車などは、大規模な情報を扱った計算を要し、人間では出来ないことだ。

便利な自動機械を作る。工学的な人工知能研究動機は結局のところその言葉に集約されるだろう。

これに対して「人間のような知能を作りたい」という動機は人間を理解したいという欲求によっても支えられる。世界を理解したいという欲求は私たちにとって根源的なものであり、その問いは「私たちは何処から来たのか？」「私たちは何故生きることができるのか？」「私たちの心とは何なのか？」などという哲学的ともいえる根源的な問いから派生する。

ここから物理学や生物学、心理学や歴史学などといった様々な研究への志向が生まれてくる。

この中でも「私たちの心とは何なのか？」という問いは計算機科学の勃興と共に認知科学という分野を生み出した。認知科学は歴史的にも学問的にも人工知能という分野の双子のような存在である。人の認知を一連の情報処理として捉えて理解するのが認知科学であり、そこには明確に計算機と人間の知能との間のアナロジーが存在している。人間のような知能を作るということは、人間の知能を表現するモデルを作るということを意味している。

本稿では主にこの後者の動機に焦点を当てる。

人間を理解したい。自分が何者なのかを理解したい。自分の知能とはどこからやってきたのかを理解したい。人工知能――そしてロボティクスはそのための学問でもあるのだ。そのすべてを語るには紙幅は足りず、最新の拙著「心を知るための人工知能　〜認知科学としての記号創発ロボティクス〜」や入門書である「記号創発ロボティクス　〜知能のメカニズム入門〜」をお読みいただきたいが、本稿では二つの論点でもって、人間の知能を理解しようという人工知能研究およびロボティクス研究における重要な視座を端的に紹介したい。

それは「環境適応」と「言葉の意味」だ。そしてそれはともにボトムアップな知能理解というアプローチへと繋がる。

3.環境適応

環境適応――それは進化と言ってもいいし、認知発達と呼んでもよい。

ダーウィンが言うように進化とは環境適応である。系統進化とは進化というメカニズムを通した環境適応と呼べるだろう。系統発生における環境適応だ。これは主には生物学の領分だろう。この単位は種[しゅ]だ。個体レベルで環境適応した結果は次の代には継承されない。獲得形質は基本的に遺伝しない。たとえば、わたしたちが学んだ語彙そのものは子どもたちは生まれながらに持っているわけではない。

人間は言語を発達の中で個体ごとに獲得しなければならない。これは個体発生における環境適応だ。概念形成や言語獲得、さまざまな運動スキルの獲得、思考の発達などは認知発達の一部として捉えられる。認知発達は通常、人生を通した変化に焦点があてられる。この多くは心理学や脳科学の領分だろう。より家庭や学校で行われる短期的なものは学習と呼ばれるだろう。学校教育において座学する時間を学習と呼んだりするせいで、学習には意識的なイメージがつきまとうが、その多くは無意識的なものである。

新しい職場や友人関係に移ると、そのコミュニティならではの言い回しや語彙が伝染することがあるが、これも言語学習の一部だ。放課後にサッカーをして遊んでいるうちに身体スキルを身に着けていくことも学習の一部だ。

このように人間は系統発生と個体発生の二段階で環境に適応し、現在の存在に至っている。知能に至っている。

その意味において、われわれの知能の「出どころ」は環境にあり、環境との相互作用なしに知能を語ることは、その果てに得られたガラス細工のような彫像としての「知能」を愛でるに過ぎない。環境が変われば、それに追従する適応性こそが知能であるはずなのに、多くの人工知能研究は系統進化と認知発達の至った「知的な振る舞い」の再現にしか興味を向けない。

知能の本質は現在の「知能」に至る環境適応のダイナミクスにある。その説明を神経系のモデルに求めるならばニューロダイナミクスであり、認知系のダイナミクスに求めるならばコグニティブダイナミクスであり、社会及び集団としてのダイナミクスに求めるならばソーシャルダイナミクスである。実際にはこれらの結合系としてのわたしたちが環境適応している。（なおこの結合系を記号創発ロボティクスでは記号創発システムと呼ぶ。）

ロボティクスの分野においても1990年代から2000年代に掛けて進化ロボティクスや認知発達ロボティクスという学問分野が興った。記号創発ロボティクスもこれらの分野の思想を継承している。これらすべては身体を持ったロボットが環境適応により知能を形成するというシナリオを想定している。

言葉どおりであるが、進化ロボティクスは系統進化に注目し、人工生命や複雑系といった分野の影響を受けて発展した。認知発達ロボティクスは個体の認知発達に注目し発達心理学との相互作用を志した。記号創発ロボティクスは認知発達ロボティクスと同じく個体の認知発達をベースとしながら、言語獲得や運動学習や思考、人間とのコミュニケーションに至る知能の構成を目指している。そのためには言語（もしくは記号）における本当の「言葉の意味」を捕まえることが重要だという洞察の下で。

「人間の知能を理解する」という欲求に純粋に従うならば、わたしたちの知能が「どこから来たのか？」にきちんと向き合う必要がある。

それは進化と発達の末端として今わたしたちが持つ「知的な振る舞い」から始まったのではない。それは結果だ。そこに至る道筋《パスウェイ》を特定することこそ知能の理解なのである。その意味で、環境適応の仕組みを特定し、現在の人間のように実世界で活動しながら、言語的コミュニケーションに至るボトムアップな知能を理解しなければならない。構成しなければならない。これが進化／認知発達／記号創発ロボティクスと、多くの人工知能研究を分かつ態度の最も根源的な違いとなるだろう。

「知能はソフトウェアだ」「知能に身体は不要だ」という思想を堂々と表明する人がいる。ロボティクスはハードウェアで、人工知能はソフトウェアであると。

その態度は工学的な意味においては暫定的な近似として構わないのかもしれない。その最終的な知的振る舞いにしか興味がなく、産業応用上それで十分であるのであれば。しかし「人間の知能を理解する」という目標を掲げた場合、特に認知発達する知能のダイナミクスに焦点を当てた場合にそのような表明を行うことは端的に言って間違っている――語弊を含んでいる。

知能は環境適応の結果として生じてきた。環境との相互作用は身体をもってしかなし得ない。この身体をどう扱うかが環境適応であるし、この身体を通して得た感覚をどう表現し、どう他者とコミュニケーションして、集団を成しながら捕食活動を行うか、文化を形成するかがホモサピエンスが解いてきた問いなのだ。それを抜きに知能を語りきれるとするのは暴論以外の何物でもない。

ゆえに身体性は重要なキーワードとなる。20世紀末から知能に関する言論の重要な位置を身体性というキーワードは占めてきた。残念ながら身体性は2010年代の人工知能ブームの主たる関心事からは外側にあった。しかし必ず揺り戻しは起きる。起きている。わたしたちの知能は身体性の上にしかないからだ。

ロボティクスは身体を前提とする。だからこそ記号創発ロボティクスは記号創発人工知能ではなくて記号創発ロボティクスなのだ。

4.言葉の意味

ディープラーニングが大量のデータから言葉の意味を理解できるようになったというニュースが駆け巡った。言葉の意味とは何か？　それ自体が未だに哲学的問題として鎮座しているというのに。過剰表現を含んだニュースは軽々にネット上で拡散される。2019年は人工知能においてBERTとGPT-2の年だったとまでいわれる。人間のように文を生成し、人間のように機械翻訳を行うことができるディープニューラルネットワークだ。

「言語」はいつの時代も哲学や知能研究において特別な存在として取り扱われてきた。

それにはいくつかの理由があると思うが、わたしたちの学術的思考や伝達の多くが言語を用いて行われることや、人間以外の動物が言語を持たないことがあげられる。なお言語の満たすべき要件に関して本稿では深くは触れないが、少なくとも文法を持ち複雑な文を構成出来ること、言葉が意味を持つこと、社会的な関係性に依存することなどは必要要件である。

人間の認知発達においても音素の獲得から語彙の獲得、文法の獲得、そして事物の客観的な表現や論理的思考など成人に至る長い道のりを通して言語使用の能力は発達していく。

言語は他の「知的な振る舞い」と同じく完成形がいきなり現れるわけではない。

人工知能や言語学の教科書には美しく文法にしたがって、きちんと事物が表現された文が載っているが、自分の家庭やオフィスにおける会話のうち一体どれほどにそんな完成形を見いだせるだろうか。特に子供同士の会話に耳を傾けるとその言葉の並びがいかにそれだけで意味の分かる表現になっていないかがわかる。

むしろ日常の言語表現はそこから意味を汲み取ろうとする他者に向けた付加的なヒントに過ぎない。私たちのコミュニケーションにおいては、言葉の意味の多くは文脈や事前知識、周辺の状況の認知から推定され解釈されるのだ。これを記号論では記号過程と呼ぶ。この記号過程は受け手の能動的な解釈行為によって支えられる。この解釈の能力自体が認知発達や学習の結果として生じてくるのである。

人工知能の一分野である自然言語処理は、その労力のほぼすべてを「書かれた文」＝テキストの処理に費やしてきた。

実世界の中の言語はほとんど扱われてきていない。例えば「キッチンからペットボトルを取ってきて」という表現を理解するということは、実際にこの行動を実現出来るということであろう。これを理解するためには「キッチン」が家の中のどこであり、「ペットボトル」がどのような物体であり、「取ってくる」というのが実際にはどのような行動系列で実現され、「〜きて」というのが行動を要求する発話行為であるということを少なくとも理解できなければならない。

この全てにテキスト処理以外の認知の要素が関わる。場所や物体の概念であり、実環境における行動の計画であり、社会的な会話における各表現の役割の理解である。

実世界における言葉の意味を理解するためには、テキストデータをテキストデータの範囲において理解するという段階を超えて、感覚運動情報や社会的相互作用との関係を含んだ議論が必要になる。今の人工知能は大量のデータから「ロンドンはイギリスの首都である」というようなことは推論できるようになる。それはテキストデータとテキストデータの関係性における意味にとどまる。そうではないのだ。私たちの言語発達も言語進化もそのようなところから始まっていないのだ。

記号創発ロボティクスは身体を通した感覚運動情報、及び人間や他のロボットの実世界でのコミュニケーションから言語の議論を始める。たとえば「ペットボトル」の概念を考える上で、その視覚、触覚、そして機能（もしくはアフォーダンス）の情報統合を問題にする。実世界の経験に立脚した、私たちがボトムアップに得ていく言葉の意味を理解するためにも、私たちは言葉の意味を「環境適応」を通して理解する必要がある。

その意味の身体であり、ロボットなのだ。身体を持つ計算機としてのロボットを前提とし、記号創発ロボティクスを展開する理由の一つがそこにある。

「知能はソフトウェアだ」という素朴な考え方に従い、その範囲において考え続けてしまう限り、本当の意味での「言葉の意味」にたどり着けず、その周辺をくるくると回り続けることになるのだろう。だからこそ、ボトムアップな知能を作ることで、私たちは核心に迫る必要がある。そのための記号創発ロボティクスなのだ。

5.まとめ

本稿ではエッセイのような形で、記号創発ロボティクスの目指すボトムアップな知能創造と、それを通した人間知能の理解に関して導入した。特に「環境適応」と「言葉の意味」に関して思考のプロットをしたためた。遠目にみれば、人工知能のロボティクスの研究もすべてまるっと工学的研究としてみられて、それらが内包する科学的探求への志向性はぼやけがちである。知能において身体の存在は大前提と言ってよいほど本質的である。その意味でロボティクスが心の理解に関わる分野で広範な科学的貢献をなしていくことは間違いない。

先に述べたように人工知能の双子として計算機科学の勃興とともに分野創成がなされたのが認知科学である。

歴史的経緯から認知科学は実験心理学と結びつき、国内においても圧倒的に心理学的色彩が強まったが、人工知能やロボティクスのようなモデルを通して人間の知能を理解する学術活動は、認知科学の分野に在るのが適切に思われる。

その意味も込めて、2020年6月に「心を知るための人工知能―認知科学としての記号創発ロボティクス― 」を上梓した。

そこではより詳細にロボットが何故心を理解するための研究に必要なのか、記号創発ロボティクスはどのような貢献を行ってきたか、2010年代のディープラーニングの発展は心の理解にどう寄与するのか、これまでの認知科学における概念モデルはどのように発展もしくは再解釈されるか、というような議論を広範に渡って行っている。ご一読いただければ幸いである。