シンギュラリティ教徒への論駁の書

“Anyone who believes that exponential growth can go on forever in a finite world is either a madman or an economist.” - Kenneth Boulding

人間に似た人工知能は、人間と似た制限を持つ(のでは?)

既に繰り返して述べている通り、私は「人間と同等の知能を持つ人工物」を実現することが不可能だと示されているわけではないことは肯定します。ただし、その「人工物」が実現されるまでには、現在喧伝されているよりも、ずっと長い期間を要するだろうと考えています。

 

改めて、カーツワイル氏は『ポスト・ヒューマン誕生』において、汎用人工知能の設計と実装について、何ら具体的な指針や方針を示していないということは指摘しておきたいと思います。以前確認した通り、カーツワイル氏は、拡張ムーアの法則に基いた計算力のコスト効率の指数関数的な向上と、脳の機能の一部をシミュレーションするために必要な計算力から、汎用人工知能が作成可能となる時期を2029年と見積っていました。それ以外には、出版当時研究されていた機械学習の手法をいくつか挙げ、これらの方法を使うことで人工知能が作れるかもしれない、と推測を述べているのみです。

けれども、狭義のムーアの法則は既に破綻していること、脳の非侵襲スキャンとリバースエンジニアリングは、必ずしもカーツワイル氏の予想する通りの指数関数的成長を示しているわけではないこと、更には計算力向上と知能の間に直接的な因果関係が存在しないことは、既にここまで私が指摘してきた通りです。それゆえ、汎用人工知能が実現されるまでには、おそらくカーツワイル氏の予想よりも長い時間を要するでしょう。

私は、現在のノイマン型コンピュータでヒトと同等の人工知能を実現することは、コスト効率と規模の面から現実的には困難だろうと信じています。


それでは、非ノイマン型コンピュータ、つまり、現在のコンピュータとは根本的に異なる原理で計算を行なうコンピュータであれば、ヒトと同等の知能を持つ機械ができるのではないか、という指摘があるかもしれません。実際に、2014年には、IBM社が「TrueNorth」という半導体チップを開発したことを発表しています。これは、人間のニューロンの働きをハードウェア的に (緩く) 模倣した「ニューロモーフィックチップ」と呼ばれる半導体です。

この種のアプローチを更に進めて、人間に類似したウェットなハードウェアを作ることができれば、人間と同等の知能を持つ機械が作れるだろうという主張があります。このようなハードウェア技術は、未だサイエンス・フィクションかせいぜいが概念実証の範疇を出ないものですが、一種の思考実験としてここで取り上げてみます。

確かに、機械論の立場を取る限り、人間の脳とまったく同等のコピーを (ハードウェア的にであれソフトウェア的にであれ) 作ることができれば、原理的には人間と同じ知的能力を持つ人工知能が作成できることは否定しません。そして、ヒトの脳の完全な再現ができなくとも、いくらかそれに類似した機械が人間と似た知的能力を発揮できる可能性は十分にあると考えられます。けれども、この種の未来技術の想像が持ち出される場合には、意図的に無視されている論点があります。人間に似た人工知能は、人間と似た制限を持つかもしれないという可能性です。

人間の天然知能は、ごくわずかな食料でも動作することができ、エネルギー効率の点で優れています。けれども、人間の知能には特有の欠点と制約が存在することも事実です。

  • 連想記憶や事象の間の関連性を発見することには優れるものの、ものごとを正確に記録し再現することには不向きである
  • 言語を用いた情報伝達ができるものの、情報処理と記憶にはハードウェア的な処理とソフトウェア的な処理が混合されており、外部から容易に記録を読み出したり書き込んだりすることができない
  • 直感的な状況把握や計画には優れるものの、論理的な思考や大量のデータの統計的処理は不得手である
  • 有用な活動に従事できるようになるまでに、10〜20年の育成、教育と訓練を必要とする

未来の技術にどれだけの可能性があるのか、現時点で明確に予測することは困難です。同様に、未来技術にどのような制約があるのかについても、現時点で実証的に明確に述べることは困難でしょう。人間に似せたハードウェアは、上で挙げたような人間に似た制限を持つ可能性は否定できません。更に言うならば、あえて人間と同等の能力と制約を持つ機械をわざわざ作り出すメリットは薄いように感じられます。人間を人工的に再現するのではなく、生物的に人間そのものを生み出すための方法は、既に太古の昔から存在しているからです。

結局のところ、人間が持つ知能と機械が持つ知能は種類が異なるものです。この種類の違いは、制限ではなくむしろ特長として捉えるべきです。また、人間と機械の知能は異なるものであるため、単純な優劣の比較には意味がないと言えるでしょう。

脳を模倣するアプローチ

直前の2節で、私は「脳の再現」と「機械学習」の手法による人工知能の実現の可能性について検討してきました。もちろん、汎用人工知能 (ヒトと同等の人工知能) を作成するためのアプローチは、この2つのみではありません。近年では、ある程度大まかに脳の核部位の機能を機械学習器によって模倣したモジュールを作成し、個々のモジュールを結合することによって人工知能を実現するアプローチが提案されており、世界中で盛んに研究が進んでいます。


本論では私は、この種のアプローチの有用性と限界と将来性について詳細に述べるつもりはありません。私自身がこの分野の専門ではなく知識が無いということもありますし、未だ存在しない未来技術の特性と限界について考察することは難しいという理由もあります。更には、既に何度も述べている通り、私は原理的な汎用人工知能の実現可能性自体は否定していないからです。そして、未知の事象や技術について研究する真摯な科学的営み自体を否定したり批判したりすることは、本論の目的でもないからです。

人工知能研究者の主張と予測はやや楽観的すぎる傾向がありますが、現代の研究資金配分に対する競争的な制度のもとでは、研究者が自身の研究の有用性と将来性を (嘘ではない範囲で) 過大に宣伝することは、褒められた行為ではないにせよ、強く非難するべきことでもないと考えています。

私がここで批判しているのは、本当のテクノロジーについて知る努力もせず技術進歩と未来に対して希望的観測を投影する無知蒙昧な愚か者どもと、自分ですら信じていない嘘を口にすることで研究資金、投資や注目を得ようとする詐欺師と扇動者だけであるということは、明確に述べておきたいと思います。


さて、公平のために述べておくならば、人間と同等の汎用人工知能が実現されるまでの時間予想について、カーツワイル氏を擁護する人は決して少数ではありません。2010年に人工知能の専門家に対して行なわれたインタビューでは、ここ10〜20年の間に汎用人工知能が実現できると考えている人も多く存在していることが示されています*1
ただし、別の調査では、過去の専門家による外れた予測においても、予測時点から相対的に20年後程度の未来の人工知能実現を予測していたことが述べられています*2

ウーバー社傘下のAIベンチャー、ジオメトリック・インテリジェンス社の共同創業社である認知心理学脳科学研究者、ゲイリー・マーカス(Gary Marcus)氏はこう述べています。
「この世紀の終わりまでには、機械はおそらく我々人間よりも賢くなるだろう——チェスや雑学クイズだけでなく、数学や工学から科学や薬学までのあらゆることについて*3


概して言えば、短期的な人工知能の実現可能性について、コンピュータ科学者は楽観的である傾向があり、認知心理学者、生物学者、脳科学者や哲学者はやや懐疑的である傾向が多いようです。いくつかの有用そうなアプローチはあるものの、研究者コミュニティで合意された人工知能の作り方に関する理論はなく、何が一番大きな問題であるのかについても研究者間で意見の相違が存在しています。

 

私自身の率直な感想を述べるなら、人工知能の将来予測は壮大な水掛け論でしかないという印象を受けます。

人工知能の楽観論者は、脳のシミュレーションは細部まで生物学的に忠実に模倣する必要は無い、と主張しています。飛行機は鳥のように翼を羽ばたかせはしないではないか、と言うのです。すると、懐疑論者は、「翼とプロペラ」を作れるほど、知能に対する「航空力学」はまったく理解できていないではないか、と指摘します。いやいや、ライト兄弟は高校を中退した無学な自転車屋で、高度な数学と航空力学など頼らなくとも、実験に基いてともかく作ってみるというアプローチで飛行機を作ったではないか。脳に似せた機械から知能が創発する可能性は、作ってみなければ否定できないだろう、と楽観論者は更に反論するでしょう。実際のところ、議論は延々と平行線を辿っています。

結局のところ、人工知能の実現可能性を判断するためには、クラークの第二法則が述べる通り、研究を続けていく以外にないのだろうと私は考えています。

 

ロボットの脅威??人の仕事がなくなる日

ロボットの脅威??人の仕事がなくなる日

 

 

クラークの三法則に関する断章 (3) 「十分に発達して"いない"科学技術は、魔法と見分けがつかない」

今回は、クラークの三法則の最後の法則であり、おそらく最も広く知られているであろうこの法則を扱います。

『十分に発達した科学技術は、魔法と見分けがつかない。』
" Any sufficiently advanced technology is indistinguishable from magic."

この法則は、ロドニー・ブルックス氏が述べている通り、次のように言うべきでしょう。

『十分に発達して"いない"科学技術は、魔法と見分けがつかない。』

 ブルックス氏は「アイザック・ニュートンが、仮に17世紀から現代にタイムマシンで連れられてきたとして、iPhoneを見てその動作原理を理解できるだろうか」というたとえ話を挙げています。ニュートン電磁気学が確立する以前の時代の科学者であるため、彼ほどの天才であろうとも、充電の必要性などのiPhoneの制約については理解できなかっただろう、と言うのです。このたとえ話で述べられているのは、「未来に発明されるかもしれないテクノロジーを予想するとき、現時点でその限界を明確に示すことは非常に困難であるため、しばしばテクノロジーが『魔法』のように限界が無いものとして扱われてしまう」という問題です。『もしそれが魔法と見分けがつかないとすれば、誰が何と言おうと、もはや反証は不可能だ。』というわけです。

 

私自身も、ブルックス氏と同様に、未来技術とシンギュラリティに関する議論において、この問題に悩まされてきました。未来技術に関する議論の際には、シンギュラリティ”信者”は、常にこの種の魔術的な未来技術の可能性を持ち出すからです。

前回述べた通り、何かが不可能であると示すことには、多くの場合困難を伴います。まして、今存在しない技術、実用化できるかどうかすら定かではない未来技術について、その限界を示すことは原理的に不可能です。未来において発明されるかもしれないテクノロジーの限界は、現時点で存在しているテクノロジーからは理解できません。

そして、懐疑論者が未来技術の限界を説明できないこと、不可能性を示せないことをもって、シンギュラリティが発生する可能性があると主張する人間が存在します。私も「あなたは汎用人工知能の能力を理解していない」、「あなたは分子コンピュータやDNAコンピュータや○○コンピュータの可能性について検討していない」と言う「指摘」を受けることが頻繁にあります。けれども、たとえばこれらの技術が実現されるまでの見通しはどれくらいか、どんな特性と限界があるのか、これらの技術を用いてどう汎用人工知能を実現するのか関して、妥当な根拠が挙げられていることはありません。

 

結局のところ、これは「魔法に限界はない」という主張と大差はなく、反証不可能な信念の表明です。

もちろん、科学技術は魔法ではなく、現実に存在する技術には、必ず限界が存在します。現時点で限界が示せないことは、限界が存在しないことの証拠にはなりえません。更には、懐疑論者に対して未来技術の限界を示すように求めることは、挙証責任の完全な放棄であり、全く科学的な議論では無いと断じることができるでしょう。

 

関連項目

参考サイト

[FoR&AI] The Seven Deadly Sins of Predicting the Future of AI – Rodney Brooks

シンギュラリティは来ない、AIの未来予想でよくある7つの勘違い

クラークの三法則に関する断章 (2) 「不可能性の自己欺瞞」

今回も、前回に引き続いてクラークの三法則の第二法則を扱います。

『可能性の限界を測る唯一の方法は、不可能であるとされるところまで進んでみることである。』
"The only way of discovering the limits of the possible is to venture a little way past them into the impossible."

 

以前にも私は類似のテーマについて記事を書いていますが、何かが「不可能である」と示すことは、多くの場合において「不可能」であると言えます。なぜならば、「不可能である」ことを示すためには、未だ誰も思いついていない方法も含めてあらゆる可能性を潰さねばならない一方で、解決策(あるいは可能性)が一つでも示されれば、「不可能である」という主張は誤りになるからです。ここには一種の労力の非対称性が存在しています。「これまであらゆる人が失敗してきた」ということは言えても、そこから「未来永劫、それは不可能である」という結論を導くことはできません。

 

ゆえに、何かが不可能であるかを確かめるためには、この"法則" が述べる通り、可能であることを積み上げ示していく以外にありません。けれども、クラークの第二法則を「悪用」すれば、間違った主張、間違った理論を際限なく擁護することができてしまいます。科学哲学者のラカトシュポパー反証主義に対して反論している通り、何らかの理論の反証となりうる事例も「それは核心的な誤りではなく、単なる実験の不備やデータの不足だ」と主張できてしまうからです。

数学者・ソフトウェア工学者であり、情報技術と社会との関わりに関する人文学的な学際研究もある林晋氏は、自身の過去の研究テーマに関する失敗についてこう述べています。

学問的な事実が実験・調査などにより示されても、それを完全に正しいと言い切ることは難しい。ある主張の不可能性を示すことは特に難しい。
すべての研究者が暗黙の了解としているために見落とされている条件があり、それが見つかって、出来るわけがないと思われていたことが、簡単に実現されてしまうことは良くある。

これを「悪用」すると、「誤差です」「ちょっと間違えていましたが修正可能です」「データが十分でないだけです」とか言って、間違えた結論を擁護し続けることができる。
だから、最後は、社会がそれを認めるか認めないか、そういう社会的レベルでの決着になることさえある。これはSTAP細胞を巡って、我々が目撃しつつあることだ。*1

 
ここでも取り上げられているSTAP細胞の研究者が良い例でしょう。彼女が実験データを適切に扱っていなかったこと、論文に他人の文章からの盗用が存在するということは示すことができます。けれども、それらの証拠はなお「STAP細胞が存在しないこと」を証明するものではありません。仮にSTAP細胞を作成する手法を本当に発見していたのであれば、実験手順やデータの不備は、誰からも注目されることもなく、後から修正すれば許されていたでしょう。

つまり、どれほど「証拠が無いこと」を示したとしても、なおそれは「無いことの証拠」ではなく、「存在しない」「不可能である」ということを示すためにはしばしば大変な困難を伴います。


シンギュラリティ論と「収穫加速の法則」の実証的な根拠を議論する際、私が常に直面してきたのもこれと同様の「不可能性の証明」に関する問題です。

本論で私は、「近い将来においてシンギュラリティが発生するという予測は妥当であるのか」を検討してきました。けれども、私が言えることは、せいぜいが「近い将来においてシンギュラリティが発生するという根拠は無い」という主張のみであり、ここから「シンギュラリティは未来永劫に渡って発生しない」と結論付けることはできません。

けれども、同様に、「シンギュラリティが発生しない」ことを私が示せないという事実は、「シンギュラリティが到来する」ことの証明ではありません。(無知論証) シンギュラリティの発生に対する妥当な未来予測の根拠を示せない限り、「原理的には不可能ではない」という主張は単なる信念の表明に過ぎず、何ら意味のある議論ではありません。

 

今回も、クラークの法則を言い換えて記事を終えたいと思います。

『可能性の限界を消し去る唯一の方法は、不可能であるということを認めないことである』

 

不可能、不確定、不完全: 「できない」を証明する数学の力 (ハヤカワ・ノンフィクション文庫―数理を愉しむシリーズ)

不可能、不確定、不完全: 「できない」を証明する数学の力 (ハヤカワ・ノンフィクション文庫―数理を愉しむシリーズ)

クラークの三法則に関する断章 (1) 「可能でもできないコト」

テクノロジーの進歩に関する語りにおいて、頻繁に引用されるフレーズがあります。映画「2001年宇宙の旅」の原作者としても知られる、アーサー・C・クラークが述べた「クラークの三法則」です。

  1. 高名だが年配の科学者が可能であると言った場合、その主張はほぼ間違いない。また不可能であると言った場合には、その主張はおそらく間違っている。
  2. 可能性の限界を測る唯一の方法は、不可能であるとされるところまで進んでみることである。
  3. 十分に発達した科学技術は、魔法と見分けがつかない。

 

この「法則」は、厳密な意味での科学法則や経験則と呼べるものではなく、ちょっとした気のきいたアフォリズムのようなものです。おそらく、クラーク自身も厳密な「法則」を定義したとは考えていなかったでしょう。それゆえ、これから私が述べるつもりの分析は、非常に野暮なツッコミでしかないかもしれません。

けれども、この「法則」は、人工知能や未来技術について語る際にはよく引用されており、また、未来予測に関する誤りについて説明するために好都合な題材ですので、一種の余談として考察してみたいと思います。

 

第一法則 可能でもできないコト

『高名だが年配の科学者が可能であると言った場合、その主張はほぼ間違いない。また不可能であると言った場合には、その主張はおそらく間違っている。』
When a distinguished but elderly scientist states that something is possible, he is almost certainly right. When he states that something is impossible, he is very probably wrong.

まずは第一法則について検討します。実際のところ、この「法則」の前半部にはちょっとした注意が必要です。高名な科学者が「可能である」と言ったことであっても、実現していない技術は数多く存在しているからです。

 

核融合発電は、この好例でしょう。原理的には可能であり、長期間研究が続けられているのに、全く実現できていない技術であるからです。

1920~30年代の原子核物理学の発展、1950年代の水素核融合爆弾の実現により、人工的な原子核融合は理論上のみならず現実的にも可能であることが示され、いずれは核融合から有用なエネルギーを取り出せるはずだという確信が広まりました。

実際、核融合の研究は核分裂炉の実用化とほぼ同時に開始されており、多数の物理学者とエンジニアが、10~20年以内に核融合発電が実現できると信じていました。1960年代〜70年代に書かれた未来予測を読んでみると、1980年代ごろには核融合による発電所が実用化されると予想されており、人類は無尽蔵のエネルギーを自由に利用できると信じられていたようです。

けれども、1980年代には、実用化の時期は21世紀初頭に伸び、21世紀初頭である現在では、今世紀後半から22世紀初頭とまで言われています。つまり、研究が進めば進むほど、逆に実用化までの目処は遠ざかり続けています。

1930年代には、原子核物理学の進歩により核分裂の理論が確立され、ウラン核分裂は1938年に実証されています。1942年にはシカゴ大学で世界最初の原子炉が構築され、1945年には核分裂反応を利用した原子爆弾も作られました。そして、最初の商業原子炉は1956年に稼動しています。一方、水素核融合の発見は1920年代であり、水素核融合爆弾は1952年に成功しています。けれども、現在に至るまで、核融合からエネルギーを取り出すどころか、連続運転できる核融合炉すら存在していません。

投資の規模と費用も巨大化し続けています。現在建造されている国際的な核融合研究装置「ITER」は、もはや一国の予算ではまかないきれず、国際的な協力がなければ建設すらできません。

実際のところ、核融合から有意義な (=爆発以外の) エネルギーを取り出す技術が開発できるのかは分かりません。けれども、これまで優に半世紀以上に渡って核融合研究は人々の期待を裏切り続けてきました。現在の核融合研究もそれと同じである可能性は非常に高いでしょう。


あるいは、現在私が検討している人工知能研究自体も第一法則の1文目の反例です。最初期の、かつてダートマスに結集した「高名な」研究者たちも、繰り返し繰り返し人工知能に関する楽観的すぎる予測を述べています。

おそらく人類で最初に思考機械に関する詳細な思考実験を行い、「チューリングテスト」にもその名を残している数学者、計算機科学者であるアラン・チューリングは、「21世紀までには計算機で模倣ゲームをうまくやれるようになるだろう
*1」と述べていました。

1958年には、ハーバート・サイモンとアレン・ニューウェルは「10年以内にデジタルコンピュータはチェスの世界チャンピオンに勝つ」そして「10年以内にデジタルコンピュータは新しい重要な数学の定理を発見し証明する」と述べています。

その後もハーバート・サイモンは「20年以内に人間ができることは何でも機械でできるようになるだろう」(1965年)、マービン・ミンスキー「一世代のうちに人工知能を生み出す問題のほとんどは解決されるだろう」(1967年)、マービン・ミンスキー「3年から8年の間に、平均的な人間の一般的知能を備えた機械が登場するだろう」(1970年)

 

そして、現在進行中の第三次人工知能ブームも、確実に期待が過剰な状態であり、いずれバブルが弾けることは確実だろうと考えています。過去のブームにおいて問題となった、フレーム問題、自然言語の意味理解、常識的推論などの問題について、大きな進展があるようには見えないからです。

私が思うに、「人工知能はまだ言語の意味を理解できず、意味のある対話ができない」ということが理解されたとき、現在のブームは終了するだろうと予測しています。(そして、最悪の状況は、過剰な期待の裏返しにより日本の人工知能研究が萎縮・停滞し、逆に米国や中国では実用的な”機械学習”の研究と実用化が進み続け、更に日本と他国との差が広がることです。)

フェイスブック社で人工知能研究所の所長を務めるヤン・ルカン氏は、2013年のブログ投稿で、過剰な期待の危険性について厳しく警告しています。

人工知能は過去50年間に期待過剰のため4度"死んだ"。人々は大言壮語し (しばしば将来の投資家やファンドの注目を引くために)、けれども実現せず、その後に反動が続いた。ニューラルネットにおいても既に2度同じことが起こっている。1回目は60年代後半、2回目は90年代半ばである。*2


確かに、科学の発展によって、以前には不可能と思われていたことが可能となること自体は事実です。けれども、人間は原理的に可能であると言われたこと全てを実現してきたわけではありません。

認知科学者のスティーブン・ピンカーは、シンギュラリティに関するインタビューの中で次のように述べています。

人間の想像力の中で未来を想像できるということは、それが実現する見込が高い、あるいはそもそも実現可能であるということの証拠にはならない。*3


つまり、私はクラークの法則の最初の文は、以下の通り書き換えるべきであると考えています。

『高名だが年配の科学者が可能であると言った場合でも、その主張は正しいとは限らない。』 

人工知能と天然知能の違い

これまで何度か述べてきた通り、私は必ずしも「人間と同様の知能を持つ人工物」が不可能であるとは考えていません。けれども、人間と同様の知能を持つ「人工物」は、おそらく現在の「コンピュータ」ではなく、また、それが実現されるまでには現在想像されているよりも長い期間を要するでしょう。

これまでの人工知能研究が、なぜヒトと同等の知能を作り出せていないのかという問題は、回答が非常に難しい問題です。けれども、人間と同等の人工知能を作成するために必要であると考えられ、また、現在の人工知能研究ではあまり着目されていないと思われる点を三点挙げたいと思います。

 

まず、人間は後天的に得られる情報だけをもとにして学習しているわけではないということです。

精神転送に関する連載の中で、生後数日の新生児にすら人の顔を認識し識別する能力が備わっていることを示した研究を紹介しました。あるいは、母語獲得の過程において、子供が耳にする言葉は比較的少数の事例であり、また必ずしも周囲の大人から正解と誤りの事例を明示的に示されるわけではありません。それでも、子供は (何らかの障害が無ければ) ほぼ必ず正しい言語を習得することができます。五歳の子供ですら文法的な正しさと誤りを区別し、外国人の言語学習者が犯す間違いを指摘することが可能です。一方で、機械翻訳システムは人間が一生のうちに聞いたり読んだりする言語をはるかに越えた大量の事例をインプットされていますが、それでも不可解な間違いを犯すことがあります。

イマヌエル・カントは、「人間の心は時間や空間の枠組みを(少なくともいくらかは)アプリオリに持つ」ということを指摘しています。人間の知能は、進化の過程で獲得された本能的な能力に根差しています。この本能的な能力の原理が部分的にでも解明されない限りは、あらゆる面で人間を越える人工知能の実現は難しいのではないかと思います。


次に、人間の知能は自身の状況や思考、あるいは知能そのものに関するメタな認識を持つことができるということです。

私たちは普段、歩き方を意識せずとも無意識のうちに歩行しています。けれども、滑りやすい氷の上や不安定な山道を歩く際には、「歩く」というプロセス自体に注意を向け、次にどこに足を置くか、足に対する体重のかけ方をどのように移動させるかを検討して、意識的に歩行することができます。

人間がメタな認識を持つことができる対象は、身体的な運動に限りません。人間は自身の精神的活動、思考そのものに対しても再帰的に思考することができます。自分の記憶や能力といった単純なものから複雑な問題解決の推論の過程に至るまで意識的に注目することができ、それを言葉で説明することもできます。

この種のメタ認識には、おそらく「意識」と呼ばれる人間の精神活動が密接にかかわっています。人工知能が知識や記憶を統合的に処理し、一度学習した結果を別の領域で使用できるようになるためには、人間の持つ意識の機能が部分的にでも解明され、知識や知能そのものに対する認識がどのように生じているかを理解することが必要となると考えています。


最後に、人間の知能は他の知能を持つ主体との関わりの中でも発揮されるということです。

近年の「人工知能」研究では、ボードゲーム、画像認識、音声認識や自動運転など、抽象的な思考能力や外界の物に対する認識や相互作用が研究の対象となることが多いようです。けれども、私たちが日常で「知能」や思考能力を使用する場面は、抽象的な思考や外界の物体との関わりだけではありません。職場や家庭において、他人の意図や感情や知性や知識を推測しながら他人と会話し、お願いごとをしたり協力したりしているのではないでしょうか。つまり、人間は他人も自分と同じような心と知能を持っていることを認識し、自身の立場だけではなく他人の立場に立って考える能力を持つということです。

この種の他人の心や知能を推し量る能力も、進化の過程において、他者と協力し、あるいは支配し、時には騙したり裏切ったりすることを通して培われてきたと考えられます。「他者の意図を推測する能力」は、特に真の意味で言語を理解するためには必要不可欠な能力です。

 

以上の三点、すなわち、人間の本能に根差した知能、知能に対するメタ認識と他者の知能との相互作用が、真に人間らしい人工知能を作るためには必要になると考えています。もちろん、私は上記のことが人工物には原理的に永遠に不可能だと主張しているわけではありません。けれども、従来の機械学習手法の延長で上記の問題が解決できるとは考えにくいでしょう。

少なくとも、人間がこれらの問題に対してどう対応し、解決しているのかが解明されない限りは、人間を全般的に越える人工知能の実現は難しいだろうと考えています。

ことばの意味と画像:ディープラーニングは言語の意味を理解したのか

最近では、ディープラーニングの進歩によって、パターン認識の分野で大きな発展が起きています。特に、画像認識が急速に発達し認識率が高まったことによって、この手法を使い画像と言語を対応させることによって、言語の意味の理解も可能になるはずだ、という主張が聞かれます。

 

この種の言語に対する考え方の根底にあるのは、「言葉の意味とは、言葉が表す事物や情景 (イメージ) との対応関係である」という素朴な直観でしょう。


もちろん、言語を理解するためには、言語と外の世界との結び付きを理解することが必要になります。けれども、単語と外界の事物の画像を対応させることができるだけでは、言語を理解するためには全く不十分です。実際のところ、「意味を表わす画像」を表現できるような単語や文は、可能な言語表現の中のごく一部でしかないからです。

 

すぐに挙げられる反例としては、「哺乳類」「植物」「色」「家具」「道具」など、具体的な物やことがらをまとめるカテゴリを表す単語があります。確かに、個別具体的な哺乳類や植物や色の一事例を、画像として提示することはできます。けれども、個別の人間やパンダやカモノハシ、個別のバラ、「赤」や「青」といった個別の色、机やベッドそれ自体は、「哺乳類」、「植物」、「色」や「家具」というカテゴリの意味そのものを表現できません。

また、抽象的な概念を表す単語も、画像では表せません。「権利」、「義務」や「真理」、「善」、「美」、あるいは「存在」や「無」、「正しい」「誤り」といった単語は画像で表現できないでしょう。あるいは、もう少し具体的 (?) な概念であっても「社会」、「経済」、「制度」、「慣習」、「礼儀」なども画像では表現できません。これらの語を無理に表現しようとすれば、余計な要素が入り込むか、あるいは単語の意味の理解に必要な要素が抜け落ちてしまいます。

このようなカテゴリを表す語や抽象的な単語は、現実世界に対応するものが存在しないのだから、そもそも画像との対応を考える必要はない、という反論はありうるでしょう。けれども、完全に抽象的なものでなくても、画像や動画では表現が不可能な単語は大量に存在します。

たとえば、「会社」や「市役所」という語があります。会社が所在する建築物や市役所の庁舎、そこで働く人々、あるいはその組織を代表する社長や市長といった人を写した画像を挙げられるかもしれませんが、これらの画像は「会社」や「市役所」の意味を表したものではありません。所在地や構成員や代表者が変わっても、なお会社や市役所の本質は変化しないからです。これらの組織の本質は、それが果たす経済的・行政的な機能に存在しており、機能は画像では表現できません。

機能と同様に、役割や関係性を表す語も画像では表現できません。たとえば、私 (渡辺遼遠) は、会社での職種は「エンジニア」であり、職位は「主任」あるいは「平社員」であり、プロジェクト内では「サブチームリーダー」です。家庭の中では、私の両親にとっては「息子」であり、妻にとっての「夫」であり、息子から見れば「父親」です。渡辺の顔を写した写真は、私が社会的に持つ役割や家族との関係性によって定められる語を表すことはできません。同様に、「内閣総理大臣」という語を考えてみると、伊藤博文東条英機、近年で言えば小泉純一郎氏や安倍晋三氏など、首相を務めた個別の人物の具体例を挙げることはできます。けれども、これらの人物の写真によっては「内閣総理大臣」という言葉の意味を捉えることはできません。「内閣総理大臣」の本質的な意味は、日本国憲法で定められた行政機構における一種の役割、権能・職能に存在しており、それは眼には見えないものだからです。

 

ここまでに挙げた事例は全て「名詞」でした。物事や動作の様子を表す形容詞の中にも、画像で表現することが難しい語が存在します。

たとえば、「暑い」、「暖かい」、「寒い」、「涼しい」といった温度を表す形容詞は、暑そうな夏の風景や雪が降った冬の光景で表すことができるかもしれません。けれども、本質的にはこれらの形容詞が表しているのは温度に対する知覚・感覚であり、視覚的な映像ではありません。同様に、「甘い」、「辛い」、「すっぱい」といった味覚に関する語、「うるさい」、「静かだ」などの聴覚に関する語、「重い」、「軽い」、「固い」、「やわらかい」といった触覚に関する形容詞も、あまり画像ではうまく示すことはできなさそうです。そもそも、多くの形容詞は暗黙のうちに何らかの基準との比較を示しています。(「あの人は背が高い」と言った場合には、平均と比べて身長が高いという比較を意味しているように) このような、ものやことがらの間の量的・質的な比較も、画像で表すことは困難でしょう。

そして、何らかの動作や状態を表す動詞の中にも、画像や動画では表現しにくいものがあります。人間の内的・精神的な意思や意図を含んだ語です。たとえば、「愛する」、「信じる」、「崇拝する」という動詞で言えば、具体的な愛の行為や信仰行為や崇拝行為 (平伏礼など?) を画像として表現できるかもしれません。けれども、これらの動詞の本質は、人間の内的な意図、精神状態にあり、必ずしも外的に眼に見える行為そのものが動詞の意味ではありません。このような意図と動作が混ざった動詞の例には、「嫌う」、「避ける」、「逃げる」、「追いかける」、「探す」、「誇る」、「いばる」などなど、どれだけでも挙げることができるでしょう。

また、眼に見えない文脈によって、同じ状況であっても異なる表現をしなければならないことがあります。「机の上に置かれたカバンを手に取る」という状況であっても、そのカバンが当人のものであれば「手にする」、「取り返す」、他人のものであれば「盗む」、「拝借する」と表現しなければなりません。法的に言えば、所有権という概念自体は眼には見えず、その物を実際に占有している状態とは異なるものです。所有権と占有状態という文脈によって、同じ状況を表す画像であっても意味は異なります。これらの事例には、「一緒に出かける」に対する「デートする」、「殴る」に対する「罰する」などが挙げられます。

時間や数を表す語も、画像では表現できません。たとえば、「明日」、「昨日」、「一時間後」、「未来」、「過去」といった言葉はどのように画像や動画で表現できるのでしょうか。また、「5」という数を具体的な視覚的イメージに結び付けようとすれば、5つのりんご「🍎🍎🍎🍎🍎」や5つの点「・・・・・」などを使わざるをえないですが、具体的な物体やその配置自体は「5」という数の概念とは関係が無いものだからです。あるいは、数の5の意味を「5」という文字そのものに結び付けることは、記号と意味を直結させてしまう乱暴な議論です。

 

単語のレベルだけを取ってみても、視覚的な画像のみでは表現不可能な語は枚挙に暇がありません。さらに画像で表すことが困難なのは、文のレベルの意味です。画像や動画と直接対応付けられるような文章 (「りんごがお皿の上に乗っている」) は、私たちが話したり書いたりすることができる文章のうちのごく一部です。

意思、意図を表す文「そこへ行きたいです」、推量を表す文「あの人は私の知り合いかもしれない」「あの人は怒っているに違いない」、時間や条件を含む文「もし明日晴れたら外出します」、再帰的な文「『彼は「医者に余命宣告された」と信じている』ことを私は知っている」、量や程度を含む文「ほとんどの哺乳類は胎生だが、一部は卵生の哺乳類もいる」、命令・禁止文「ここに来なさい」「そこに入ってはいけません」、否定文東京スカイツリーは赤色ではない」、可能性を表す文「現在のスカイツリーは青色だが、赤色に塗られていたかもしれない」などは、一体どうやって画像や動画で表されるのかは分かりません。

 

具体例はまだいくらでも挙げることができるでしょうが、もうやめておきます。言葉の意味は、画像や動画のみではとても表現しきれません。そして、言葉は他の五感のみにも依存しているわけではありません。眼に見えず、聞こえず、触れることもできず、世界の中で「これ」と明示的に指し示すことも姿形を思い浮かべることができないような事物についても、私たちは語ることができます。

機械翻訳などの自然言語処理に関わる人々は、ヒトと同等の人工知能が作られるまでは言語の領域において人間が完全に代替されることはないだろう、と考える傾向にあるようです。私自身も言語に関して学べば学ぶほど、同様に人工物に言語を理解させることの困難さを感じます。

もちろん、言語に関する人間の認知タスクの一部を代替し、または強化するような「人工知能」の実現は、十分に可能でしょう。けれども、言語の意味を理解し、完全な機械翻訳を実現し、あるいはチューリングテストウォズニアックのコーヒーテストをパスできるような人工知能、そして、知能爆発的なシンギュラリティの種となる人工知能の実現は、人間と似たように感じ、考えることができる機械ができるまでは、非常に困難なのではないかと考えています。

 

参考文献

働きたくないイタチと言葉がわかるロボット  人工知能から考える「人と言葉」

働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」

言語哲学大全1 論理と言語

言語哲学大全1 論理と言語