シンギュラリティ教徒への論駁の書

"Unending exponential growth? What drugs are those people on?" - Linus Torvalds

目次

第一部 「シンギュラリティ」

  1. 序文
  2. シンギュラリティとは何か?
  3. ほとんどのテクノロジー成長は指数関数的ではない
  4. 収穫加速の幻影
  5. ムーアの法則と人工知能
    5.1. ムーアの法則
    5.2. 精神転送
    5.3. 人工知能研究と機械学習
    5.4. 全脳アーキテクチャ
  6. 知能の拡大と思考主義批判
  7. 宇宙の覚醒
  8. 予言は外れた
  9. なぜシンギュラリティは問題か
  10. 後書き

第二部 「進歩と崩壊と没落の未来史」

  1. 序文
  2. ハバートの法則と没落加速の法則
  3. 進歩教と崩壊教
  4. 没落の路

(以下構想中…)

 

本ブログは、カーツワイル氏のシンギュラリティ説と「収穫加速の法則」を批判的に検証するものです。もともと書籍の企画として執筆し始めたものであるため、序文から順番に議論を展開していますが、各エントリは独立して読めるように構成しています。

ことばの意味と画像:ディープラーニングは言語の意味を理解したのか

最近では、ディープラーニングの進歩によって、パターン認識の分野で大きな発展が起きています。特に、画像認識が急速に発達し認識率が高まったことによって、この手法を使い画像と言語を対応させることによって、言語の意味の理解も可能になるはずだ、という主張が聞かれます。

 

この種の言語に対する考え方の根底にあるのは、「言葉の意味とは、言葉が表す事物や情景 (イメージ) との対応関係である」という素朴な直観でしょう。


もちろん、言語を理解するためには、言語と外の世界との結び付きを理解することが必要になります。けれども、単語と外界の事物の画像を対応させることができるだけでは、言語を理解するためには全く不十分です。実際のところ、「意味を表わす画像」を表現できるような単語や文は、可能な言語表現の中のごく一部でしかないからです。

 

すぐに挙げられる反例としては、「哺乳類」「植物」「色」「家具」「道具」など、具体的な物やことがらをまとめるカテゴリを表す単語があります。確かに、個別具体的な哺乳類や植物や色の一事例を、画像として提示することはできます。けれども、個別の人間、個別のバラ、「赤」や「青」といった個別の色、机やベッドそれ自体は、「哺乳類」、「植物」、「色」や「家具」というカテゴリの意味そのものを表現できません。

また、抽象的な概念を表す単語も、画像では表せません。「権利」、「義務」や「真理」、「善」、「美」、あるいは「存在」や「無」、「正しい」「誤り」といった単語は画像で表現できないでしょう。あるいは、もう少し具体的(?)な概念であっても「社会」、「経済」、「制度」なども画像では表現できません。これらの語を無理に表現しようとすれば、余計な要素が入り込むか、あるいは単語の意味の理解に必要な要素が抜け落ちてしまいます。

このようなカテゴリを表す語や抽象的な単語は、現実世界に対応するものが存在しないのだから、そもそも画像との対応を考える必要はない、という反論はありうるでしょう。けれども、完全に抽象的なものでなくても、画像や動画では表現が不可能な単語は大量に存在します。

たとえば、「会社」や「市役所」という語があります。会社が所在する建築物や市役所の庁舎、そこで働く人々、あるいはその組織を代表する社長や市長といった人を写した画像を挙げられるかもしれませんが、これらの画像は「会社」や「市役所」の意味を表したものではありません。所在地や構成員や代表者が変わっても、なお会社や市役所の本質は変化しないからです。これらの組織の本質は、それが果たす経済的・行政的な機能に存在しており、機能は画像では表現できません。

機能と同様に、役割や関係性を表す語も画像では表現できません。たとえば、私 (渡辺遼遠) は、会社での職種は「エンジニア」であり、職位は「主任」あるいは「平社員」であり、プロジェクト内では「サブチームリーダー」です。家庭の中では、私の両親にとっては「息子」であり、妻にとっての「夫」であり、息子から見れば「父親」です。渡辺の顔を写した写真は、私が社会的に持つ役割や家族との関係性によって定められる語を表すことはできません。同様に、「内閣総理大臣」という語を考えてみると、伊藤博文東条英機、近年で言えば小泉純一郎氏や安倍晋三氏など、首相を務めた個別の人物の具体例を挙げることはできます。けれども、これらの人物の写真によっては「内閣総理大臣」という言葉の意味を捉えることはできません。「内閣総理大臣」の本質的な意味は、日本国憲法で定められた行政機構における一種の役割、権能・職能に存在しており、それは眼には見えないものだからです。

 

ここまでに挙げた事例は全て「名詞」でした。物事や動作の様子を表す形容詞の中にも、画像で表現することが難しい語が存在します。

たとえば、「暑い」、「暖かい」、「寒い」、「涼しい」といった温度を表す形容詞は、暑そうな夏の風景や雪が降った冬の光景で表すことができるかもしれません。けれども、本質的にはこれらの形容詞が表しているのは温度に対する知覚・感覚であり、視覚的な映像ではありません。同様に、「甘い」、「辛い」、「すっぱい」といった味覚に関する語、「うるさい」、「静かだ」などの聴覚に関する語、「重い」、「軽い」、「固い」、「やわらかい」といった触覚に関する形容詞も、あまり画像ではうまく示すことはできなさそうです。そもそも、多くの形容詞は暗黙のうちに何らかの基準との比較を示しています。(「あの人は背が高い」と言った場合には、平均と比べて身長が高いという比較を意味しているように) このような、ものやことがらの間の量的・質的な比較も、画像で表すことは困難でしょう。

そして、何らかの動作や状態を表す動詞の中にも、画像や動画では表現しにくいものがあります。人間の内的・精神的な意思や意図を含んだ語です。たとえば、「愛する」、「信じる」、「崇拝する」という動詞で言えば、具体的な愛の行為や信仰行為や崇拝行為 (平伏礼など?) を画像として表現できるかもしれません。けれども、これらの動詞の本質は、人間の内的な意図、精神状態にあり、必ずしも外的に眼に見える行為そのものが動詞の意味ではありません。このような意図と動作が混ざった動詞の例には、「嫌う」、「避ける」、「逃げる」、「追いかける」、「探す」、「誇る」、「いばる」などなど、どれだけでも挙げることができるでしょう。

また、眼に見えない文脈によって、同じ状況であっても異なる表現をしなければならないことがあります。「机の上に置かれたカバンを手に取る」という状況であっても、そのカバンが当人のものであれば「手にする」、「取り返す」、他人のものであれば「盗む」、「拝借する」と表現しなければなりません。法的に言えば、所有権という概念自体は眼には見えず、その物を実際に占有している状態とは異なるものです。所有権と占有状態という文脈によって、同じ状況を表す画像であっても意味は異なります。これらの事例には、「一緒に出かける」に対する「デートする」、「殴る」に対する「罰する」などが挙げられます。

時間や数を表す語も、画像では表現できません。たとえば、「明日」、「昨日」、「一時間後」、「未来」、「過去」といった言葉はどのように画像や動画で表現できるのでしょうか。また、「5」という数を具体的な視覚的イメージに結び付けようとすれば、5つのりんご「🍎🍎🍎🍎🍎」や5つの点「・・・・・」などを使わざるをえないですが、具体的な物体やその配置自体は「5」という数の概念とは関係が無いものだからです。あるいは、数の5の意味を「5」という文字そのものに結び付けることは、記号と意味を直結させてしまう乱暴な議論です。

 

単語のレベルだけを取ってみても、視覚的な画像のみでは表現不可能な語は枚挙に暇がありません。さらに画像で表すことが困難なのは、文のレベルの意味です。画像や動画と直接対応付けられるような文章 (「りんごがお皿の上に乗っている」) は、私たちが話したり書いたりすることができる文章のうちのごく一部です。

意思、意図を表す文「そこへ行きたいです」、推量を表す文「あの人は私の知り合いかもしれない」「あの人は怒っているに違いない」、時間や条件を含む文「もし明日晴れたら外出します」、再帰的な文「『彼は「医者に余命宣告された」と信じている』ことを私は知っている」、量や程度を含む文「ほとんどの哺乳類は胎生だが、一部は卵生の哺乳類もいる」、命令・禁止文「ここに来なさい」「そこに入ってはいけません」、否定文東京スカイツリーは赤色ではない」、可能性を表す文「現在のスカイツリーは青色だが、赤色に塗られていたかもしれない」などは、一体どうやって画像や動画で表されるのかは分かりません。

 

具体例はまだいくらでも挙げることができるでしょうが、もうやめておきます。言葉の意味は、画像や動画のみではとても表現しきれません。そして、言葉は他の五感のみにも依存しているわけではありません。眼に見えず、聞こえず、触れることもできず、世界の中で「これ」と明示的に指し示すことも姿形を思い浮かべることができないような事物についても、私たちは語ることができます。

機械翻訳などの自然言語処理に関わる人々は、ヒトと同等の人工知能が作られるまでは言語の領域において人間が完全に代替されることはないだろう、と考える傾向にあるようです。私自身も言語に関して学べば学ぶほど、同様に人工物に言語を理解させることの困難さを感じます。

もちろん、言語に関する人間の認知タスクの一部を代替し、または強化するような「人工知能」の実現は、十分に可能でしょう。けれども、言語の意味を理解し、完全な機械翻訳を実現し、あるいはチューリングテストウォズニアックのコーヒーテストをパスできるような人工知能、そして、知能爆発的なシンギュラリティの種となる人工知能の実現は、人間と似たように感じ、考えることができる機械ができるまでは、非常に困難なのではないかと考えています。

 

参考文献

働きたくないイタチと言葉がわかるロボット  人工知能から考える「人と言葉」

働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」

言語哲学大全1 論理と言語

言語哲学大全1 論理と言語

機能と手段:潜水艦は泳げるのか

「コンピュータは考えることができるか?という問いは、潜水艦は泳げるか、という問いと同じようなものだ」 - エドガー・ダイクストラ

人工知能について語るとき、よく次のようなことが言われます。

「自動車は馬のように走るわけではなく、飛行機は鳥のようにはばたくわけではなく、船や潜水艦は魚を模倣しているわけではない。また、眼や脳の視覚野の機能について完全に解明されているわけではないが、コンピュータビジョンや画像認識は実現できているではないか。同様に、コンピュータで知能を実現するにあたって、生物を模倣する必要はない。」

この指摘はある意味では妥当ではありますが、けれども「知能」の実現を考える上ではやや不正確な比喩だと言えます。これは、実現するべき「機能」と、機能を実現する「手段」の間の関係を考えると、違いが明確になります。

例を挙げます。飛行機の機能は「空中を飛行して移動すること」であり、船舶の機能は「水上または水中を移動すること」です。また、コンピュータビジョンの機能は、「可視光線の入力あるいは画像のピクセルを受け取り、物体を『認識』あるいは分類すること」です。ここでは、実現するべき機能の目的や仕様は明確に定めることができ、これらの機能を実現する上で生物学的な構造を模倣する必要はありません。

それでは、同様のアプローチで、構造を模倣せずに知能や意識という機能を再現できるのでしょうか。これは、知能や思考のもつ機能を形式的に、つまり工学的にコンピュータで扱える形に書き下せるかと言い替えられます。けれども、現在のところ、そもそも脳全体の知能としての機能をどのように具体的に記述すればいいのかは分かりません。それ以前に、知能や意識という機能が何なのか、新しいアイデアを考案するために必要な素材としての知識の量、あるいは私たちが持っている「常識」の量をどう測定するかなどを、人間はまだ定義できていない状態です。これが、脳の情報処理機能の解明にまつわる困難さです。

明確に定義されていない機能を、器質的、ハードウェア的な模倣なしに実現しようとしてもあまりうまくできるとは思えません。特に、「言語の意味理解」については相当に困難だろうと考えています。言語の意味とは一体何なのか、何ができれば言語の意味が理解できたことになるのか、という問題については、古き良き人工知能研究以前から哲学的な研究の歴史が存在していますが、結局のところ、あまり良く分かっていないというのが現状です。

性能vs.能力

f:id:liaoyuan:20171016212457p:plain

図:機械学習によって画像から生成されたキャプション「若者のグループがフリスビーの競技で遊んでいる」*1

もちろん、機能が明確に定義できる認知的タスクについては、人工的な再現が可能であるものも存在しています。実際に、店舗案内や電話応答など、限られた状況においては言語的なコミュニケーションができるシステムも存在します。そして、画像認識や音声認識システムなど、一部の機能においては人間を超える性能を示すシステムも存在しています。

この通り、眼や脳の視覚野の機能が完全に解明されていなくてもコンピュータビジョンは実現できるのだから、同様に、脳や知能の機能が解明されていなくても人間の能力を全般的に超える人工知能は可能であるはずだ、という主張がされています。

 

けれども、単一の機能、単一のタスクに対する「性能」と普遍的・汎用的な「能力」を混同することは、極めて重大な誤りです。MIT人工知能研究所の元所長であり、ロボット掃除機ルンバを製造するiRobot社の創業者でもあるロドニー・ブルックス氏は、次のように「性能 (performance)」と「能力 (competence)」を混同することの誤りについて指摘しています。

ここで、ある人が我々に「この写真には『公園でフリスビーで遊んでいる人々』が写っています」と伝えたと考えてみよう。我々は当然、この人が次のような質問にも回答する能力があると想定できるだろう。「フリスビーはどんな形をしていますか?」「人間はだいたいどのくらい遠くまでフリスビーを投げられますか?」「人間はフリスビーを食べられますか?」「一度にだいたい何人くらいの人がフリスビーで遊べますか?」「生後三ヶ月の人間はフリスビーで遊べますか?」「今日の天気はフリスビーで遊ぶのに適していますか?」… 今日の画像ラベリングシステムは、オンラインの写真に対して「公園でフリスビーで遊んでいる人々」のように、大抵正しい答えのラベルを返すことができる。しかし、上記の質問には答えることができない。

 

このシステムができることは画像へのラベル付けだけであり、上記の質問には全く回答できないことに加えて、このシステムは「人間とは何か」「公園は普通屋外にある」「人間には年齢があること」「天気こそが写真の写りを決めるということ」などなど、については何も分かっていない。

 

…つまり、間違いはこうだ。ロボットやAIシステムが何らかのタスクを実行する性能を示した、と普通の人々が耳にしたとしよう。そこで彼らは、その性能を汎用的な能力へと一般化し、それと同じのタスクを実行可能な人間であれば持っていると期待できる能力を考える。そして、人々はこの種の一般化をロボットやAIシステムにも適用してしまうのである。

今日のロボットやAIシステムが可能なことは、信じがたいまでに限られている。人間風の一般化は全く適用できない。このような一般化をする人々は非常に、非常に誤っている。*2

結局のところ、現在の「人工知能」システムは人間によって作られた道具です。道具は普通、人間の「能力」より優れた「性能」を発揮するように作られています。たとえば、電卓は計算において人間より優れており、自動車は移動や輸送において人間に勝っています。石でできた斧は硬さと攻撃力において人間を上回っており、紙とペンという単純なテクノロジーですら記録の保持において人間を越えています。「記憶」に関係する脳の物理的活動は非常に複雑ですが、一部の機能において人間越えを果たしているテクノロジー (紙とペン) は、既に紀元前から存在しています

けれども、紙が人間より記憶力に優れていると主張したり、石斧が意思を持って人間を襲い出すと考えたり、あるいは紙や石斧が自律的に自身を強化し始めたりすると想像することは、あまりに馬鹿げた呪術的思考であることは明らかです。本当に警戒するべきは、たとえば邪悪な人間が石斧を持って暴れたり、他人へと危害を与えることでしょう。

今日の「人工知能」においてもそれは同様です。ジャン・ガブリエル・ガナシア氏が著書の中でいみじくも指摘している通り、私たちが警戒しなければならないことは、人工知能が自律的に成長を始めたり、あるいは人類を支配し抹殺したりするような未来ではありません。人工知能を開発しビジネスに用いている企業が、シンギュラリティ論という壮大な与太話を使って、人工知能を使用する人間が引き起こす本当のリスクから人々の眼を逸らしている現状こそ、最も警戒する必要があります。

スーツケース語の誤謬

「思考」や「学習」という言葉は、”人工知能の父” マーヴィン・ミンスキー氏が言うところの「スーツケース語」であることも、この混乱に拍車をかけています。つまり、「思考」や「学習」という単語には、いろいろな動作や状態の意味が (スーツケースのように) 詰めこまれており、各々が意図するものと理解するものがバラバラであるような多義語であるということです。

「走る」、「(空を) 飛ぶ」や「泳ぐ」という言葉を取り上げてみると、何かが「飛んでいる」「泳いでいる」とはどういうものであるかは、日本語の母語話者であればおそらく確実に意見が一致するでしょう。「走る機械」、「飛ぶ機械」や「泳ぐ機械」も、おそらくどのようなものであるかは想像ができるでしょう。

その一方で、「思考する」「学習する」という語を考えてみます。すると、日常言語においてさえ、これらの言葉が非常に多くの動作や状態を表していることが理解できます。たとえば、「思考する」と言う心的な動作を取ってみても、過去の情景を思い出すこと、将来の計画を立てること、複雑なシステムやプログラムの構造を設計すること、感情を適切な文章で表現することなど、さまざまな動作が「思考する」という語で表現されています。「学習する」と言っても、おそらく新たな外国語を学習することと、一輪車の乗り方を学習することでは、必要なスキルも脳の部位も異なるはずです。これらの個々のスキルに対応できる機械学習システムを作ることは可能かもしれませんが、その数や組み合わせは膨大になるでしょう。

そして、機械学習分野においても、一種の専門用語としてスーツケース語が使用されています。ロドニー・ブルックス氏が挙げている通り、用語の例には予測、推定、学習、識別、認識、説明、意図、学習、推論、理解、などがあります。これらの用語が機械学習における専門用語として使用される際には、厳密な定義と意味を持って使用されています。けれども、専門外の人間が「機械学習システムが画像『認識』率において人間を上回った」と耳にしたとき、人々は自分自身のメンタルモデルを適用し、人間が「認識」するように機械も「認識」しているのだろうと想像してしまっているように見えます。

けれども、そのような想定は完全な誤りです。画像ラベリングシステムの例で言えば、システムはフリスビーや人間に関する事典的な知識を持っていません。また、システムに対して使われている「認識」という単語は、実際には一種の多次元ベクトルへの写像を意味しています。人間が「認識」するように、機械が画像を「認識」しているわけではありません。

スーツケース語の日常言語と専門用語における意味の差異が、今日の機械学習人工知能に対する巨大な誤解と過大評価を生み出している一因なのではないかと考えています。

 

(10/10追記)

もちろん、私は昨今の画像認識の進展自体を否認するつもりも、その有用性を否定するつもりもありません。一般物体認識は半世紀以上前から研究が続けられているテーマであり、ディープラーニングによる近年の進歩は本物で、それが経済的に大きな意味を持っていることは理解しています。けれども、単一の機能において人間を上回る性能を示したことをもって、シンギュラリティを引き起こすような「人工知能」の実現が可能であると主張することは難しい、と考えています。

「原理的には」人工知能は不可能ではない

近年の「シンギュラリティ」に関する議論では、この言葉が「人間の能力を超えた (汎用) 人工知能が作られるタイミング」を指すという誤解があるようです。けれども、これまで述べてきた通り、「シンギュラリティ」の元々の使用法から言えば、この言葉が意味するところは「人類史において断絶的な進歩が発生する点」を指していますので、私もその意味で使用しています。

さて、人工知能の可能性と限界に関して検討していると、「人間という実例が存在する以上、人工知能が不可能であるという根拠は無い」という反論を受けることがあります。
私自身の立場としては、人間と同等の知的能力を持つ人工物が「原理的には」可能であることを否定しません。人間の脳は有限の大きさの物体であり、物理法則に従って動作しています。機械論の立場から、人間と同等の機能を持つ人工物の構成は「原理的には」不可能であるとは断言できません。個人的には、人工知能の実現は相当に「困難」だろうという感覚を持っていますが、けれども、たとえば熱力学の法則から永久機関が不可能である、というような意味で人工知能の不可能性が示されているわけではありません。

けれども、ここで私が検討しているのは、原理的な可能性ではなく、実際に実現されるまでの時間の見通しが妥当であるかどうかです。

カーツワイル氏は、2029年までに1人の人間と同レベルの人工知能が実現されると予測しています。この予測の根拠は、人間の脳の「機能」に関する大雑把な推算と、拡張ムーアの法則に基いた1000ドル当たりの計算速度の向上の傾向を外挿したものです。ムーアの法則が既に2000年代に破綻していることは以前述べた通りですが、この議論には更に巨大な問題が含まれています。実際のところ、知能は計算力ではなく、また計算力は知能ではないため、計算力向上と汎用人工知能の実現の間に直接的な因果関係は存在しないからです。

汎用人工知能の研究分野においては、研究者の間で合意された「知能」の理論は存在せず、一切の概念実証もなく、どのようにすれば人工知能が実現できるかが明確には分かっていません。人工知能の実現は、「方法は分かっているが実現するための計算力が足りない」という状況ではありません。そもそも、汎用的な人工知能の実現方法自体があまり分かっていない、という状況にあります。

現実に、汎用的な人工知能が実際に構築できるようになるまでにどれだけの時間が必要であるのかは全く不明です。MIT人工知能研究所の元所長であるロドニー・ブルックス氏のように、今後100年以上は汎用人工知能の実現は不可能であると考えている人工知能の専門家も存在しています*1。けれども、確実に言えることは、人間の脳の機能あるいは人間の脳のニューロンシナプスの数と拡張ムーアの法則から汎用人工知能の実現時期を見積もるカーツワイル氏の推定は、全く根拠も妥当性も無いということです*2

 

さて、汎用人工知能の実現時期については確実な予測は不可能ですが、仮に汎用人工知能が実現されたとして、それが「シンギュラリティ」と呼べる断絶的な高速の進歩をもたらすかどうかは更に検討する必要があります。すなわち、人工知能が更に「知能」の高い超人工知能を拡大再生産できるのか、そして、高い知能を持った人工知能が科学技術を高速で進歩させられるかどうか、という2点です。

この2つの論点に関しては、次の章で扱います。

*1:[FoR&AI] The Seven Deadly Sins of Predicting the Future of AI – Rodney Brooks

*2:非常に細かいですが、私は「2030年までにヒトレベル人工知能の実現は不可能である」と主張しているわけではなく、「2030年までにヒトレベル人工知能の実現が可能であるという見通しには根拠が無い」と述べていることに注意してください

人工知能研究小史

(9/26追記 この記事は多数誤りを指摘されていますので、後で全面的に改稿する予定です。)

 

ここでは、簡単に人工知能機械学習の研究に関する歴史を振りかえっておきます。

第一次人工知能ブーム 〜「演繹」の時代〜

近代的な人工知能研究は、広く普及している見方によれば、1956年に開催された「ダートマス会議」で始まったと言われることが多いようです。確かに、「人工知能 (Artificial Intelligence)」という用語が考案されたのはこの会議ですが、実際は計算機はそもそもの目的からして「人工の知能を実現する機械」を目指して作られたと言えます。ここには、計算機科学と人工知能研究の前史として、人間の思考と科学的な営為、その全てを「論理」へと還元することを目指した、科学と哲学にまたがる思想的運動が存在しています。

 

現代の汎用的なコンピュータの理論的基礎を築いたのは、イギリスの数学者であるアラン・チューリングです。そして、チューリングが考案した理論を具体的に実現するEDVACというコンピュータを設計したのは、ハンガリー出身のユダヤ系アメリカ人であるジョン・フォン・ノイマンです。

彼ら2人は、数学の中でも数学基礎論と呼ばれる分野の研究者でした。数学基礎論とは、端的に言えば、厳密な論理学の基礎の上に数学の全てを構築するための試みであると表現できます。数学基礎論においては、人間の直感を排除し、厳密に定義された記号と論理的 (形式的) な操作によって、あらゆる数学的な公理を基礎づけることが目標とされました。

数学基礎論の中心となったのは、現代数学の父とも呼ばれるドイツの天才的な数学者、ダーフィト・ヒルベルトです。彼は、人間の精神活動から独立した、矛盾の無い公理系から厳格に定められた論理的規則を元にあらゆる命題を導くことで、数学それ自体の完全性と無矛盾性を示そうとしたのです。すなわち、完全性とは「真である定理は必ず証明できる」、無矛盾性とは「公理に対してどれだけ形式的な推論規則を適用しても、矛盾する命題が示されることがない」ということです。

実際のところ、「数学の完全性と無矛盾性を示す」というヒルベルトの野心的な試みは、オーストリア生まれの数学者クルト・ゲーデルが証明した「不完全性定理」によって潰え、当初の目標は果たされなかったと言えます。けれども、限定された前提条件を元に、形式的な規則から数学的命題を導くという研究活動は、計算機科学やアルゴリズム研究へと発展し、コンピュータの開発へと継がっていきました。

更にその背景には、19世紀後半から20世紀初頭には、ゴットロープ・フレーゲバートランド・ラッセル、ルートヴィヒ・ウィトゲンシュタインなど、記号論理学を用いて人間のあらゆる思考を記号と論理へと還元し、その2つを用いて世界を分析することで真理へと至ろうとした哲学的な思想の潮流が控えています。

このような論理主義の時代背景を元にしてコンピュータは作成されました。実際のところ、コンピュータは単なる「計算機」ではなく、記号を規則 (プログラム) に基いて操作する論理機械であるとみなされていたのです。当時、記号操作は人間の高度な思考と同等であり、正しい規則に基いた論理的な記号操作は「思考」そのものであると信じられていました。つまり、人間の思考をコンピュータで再現することを目指す「人工知能」という研究分野が生まれたことは、ある種時代の必然であったと言えます。


最初期の人工知能研究は、一部では目覚ましい成果を挙げました。最初にも取り上げた、1956年のダートマス会議では、アレン・ニューウェルとハーバート・サイモンによって、バートランド・ラッセルの著書『数学原理』の定理を証明するプログラムのデモが行なわれています。数学的な定理の証明など、高度に知的な精神活動とみなされていたタスクをコンピュータがうまく実行するなど、驚異的な成果を目の当たりにして、多くの研究者はすぐにでも人工知能が人間の思考を超えるだろうと予想し、1960年代の第一次人工知能ブームが始まりました。
第一次人工知能ブームの時代には、探索木という方法を用いて迷路やボードゲームを解くプログラムや、限定された環境の中で人間の言語を理解し、シミュレーション中の世界で積み木を操作することができるプログラムなどが開発されています。

かなり乱暴に言えば、第一次人工知能ブームの時代とは、「論理」あるいは「演繹」によって人間の思考を再現することが目標であったと言えます。確かに、当時いくつかの画期的な成果も上がり、現在まで利用されている要素技術も開発されましたが、当初目的とされていた「人間の思考を再現する」という目標は、完全に失敗したと言えます。ごく限定された環境内であったり、ルールが明確なボードゲームに対しては有用であっても、現実の世界で私たちが遭遇する問題、たとえば病気を診断して治療法を検討したり、外国語を別の言語へ翻訳するなどの実用的で複雑なタスクに対しては、全く太刀打ちできなかったのです。

もちろんここには、当時のコンピュータの性能が限られたものであったという理由もあります。けれども、第一次人工知能ブームが失敗した最大の問題は、人間の思考はあまり「論理的」、「演繹的」ではないからという理由が大きいのではないかと考えています。

進化論の観点からは、人間の論理的思考能力はかなり最近になって獲得されたものです。また、認知科学における実験から、人間の日常的な推論は、抽象的で一般的な形式論理に沿って行なわれるのではなく、領域固有性を持っていることが示されています。つまり、それぞれの問題領域ごとの固有の知識を使って、前提を解釈したり推論を補ったりしているのです。そのため、領域が違うと形式的には完全に異なる推論をすることがしばしばあります。

考えることの科学―推論の認知心理学への招待 (中公新書)

考えることの科学―推論の認知心理学への招待 (中公新書)

 

 

また、人間が問題解決や推論をする際には、大量の事例記憶やアナロジーが重要な役割を果たしていることが分かっています。一つ例を挙げるなら、私たちが外国語を学ぶとき、文法自体は集中すれば半年から1年程度で学べるでしょうが、実際に外国語を読んだり話したりする上では、例外的な語法・用法や慣用句であったり、ものごとを表現する単語を知らないことが問題になることが多いものです。実際に、人間の言語知識は、「文法」と呼ばれる規則の体系で特徴付けられる度合いよりも、むしろ膨大な事例記憶に依存している度合いのほうが、かつて考えられていたよりも大きいということが示されています。

限られた前提と論理によって解決できる問題は、実際のところごくわずかです。最初期の人工知能研究に対しては当初の期待が大きかったために幻滅も深く、そうしてブームは下火になりました。


第二次人工知能ブーム 〜「知識」の時代〜

第一次人工知能ブームが「演繹」をもとにして人間の知能を再現するための試みであったとすれば、その後に続いた第二次人工知能ブームでは、「知識」をもとにしてコンピュータに人間らしい推論を行なわせようとしたと言えます。

1960年代に過熱した人工知能ブームが一旦去った後、1970年代後半から1980年代にかけて、「知識工学」あるいは「知識表現」という分野が盛んに研究されました。上述した通り、知的な行動や判断には、特定の領域における詳細かつ膨大な知識が関わっています。そこで、人間の専門家が持つ知識を書き出し、その知識間の関連性を何らかの形で表現することで、「論理+知識」をもとに知的な推論をするコンピュータを実現できるだろう、と考えられたのです。1980年代には、半導体素子の性能が向上し、処理速度や記憶容量の面で実用的なコンピュータ (メインフレーム) が利用できるようになったことによって、この種のアプローチが可能となりました。

第二次人工知能ブームにおいて盛んに研究されたアプリケーションの実例には、エキスパートシステムがあります。エキスパートシステムは、特定領域における問題について、専門家 (エキスパート) の代わりに質問に応えたり問題を解くことができるプログラムです。エキスパートシステムでは、人間の専門家が入力したルールを利用していました。
初期のエキスパートシステムの事例としては、伝染性血液疾患を診断するMycin(マイシン) が挙げられます。このシステムには、患者の症状など500程度のルールが記憶されており、システムから提示される質問に対して順番に答えていくことで病気の原因となる細菌を特定し、処方するべき抗生物質を提案するものです。Mycinは、感染症の専門医よりは劣るものの、一般の医師よりも優れた診断を下すことができたと言われています。(ただし、実際は誤診断発生時の責任問題から、実用はされなかったようです)

エキスパートシステムは一定の成功を収め、特定領域においては実用化も進みました。けれども、二度目の人工知能ブームにおいても、やはり「人間の知能を再現する」という目的は果たすことができず、人工知能研究は袋小路へと入ってしまったと評価できるでしょう。


人間の知識を書き下すというアプローチには、2つの問題が存在していました。1つは、前述の通り、人間の推論は厳密な形式的パターンに従っておらず、また、あいまいさや相互に矛盾する知識も含まれているため、コンピュータで扱える形式的な論理の表現とは相性が良くないからです。

もう1つの問題は、知識獲得のボトルネック (Knowledge Acquisition Bottleneck) と呼ばれる、膨大な知識を入手し表現することの困難さにまつわるものです。医療や法律など、特定の分野に限ったとしても、人間の持つ知識を書き下すことは膨大な手間とコストが必要とされます。前述の通り、知識には確率的にあいまいなものや相互に矛盾するものも含まれています。そのため、知識データベース維持には、かなりの手間と費用が必要となります。
そして、分野を限定せず、一般的な人間が現実の世界で直面する問題に対応させようとした場合には、膨大な一般常識が必要となってしまいます。それら全てを書き出すことは、もはや現実的には非常に困難です。『ポスト・ヒューマン誕生』の中でも取り挙げられているCycプロジェクトのように、人間の持つ常識的な知識を全て書き出すことを目標とした計画もありますが、このプロジェクトは開始から30年以上経過して現在でも継続されています。

人間であれば簡単に理解できる「常識的な推論」と「言語の意味理解」は非常に困難であるということが示されたことが、二回に渡る人工知能ブームの最大の成果と呼べるでしょう。


第三次人工知能ブーム 〜「帰納」「統計」の時代〜

さて、第一次と第二次の人工知能ブームの特徴を、それぞれ「論理 (演繹)」と「知識」で表すとするならば、現在まで続いている第三次人工知能ブームを表す言葉は帰納あるいは「統計」であると言えます。第一次、第二次の人工知能ブームにおいては、人間の「知能」あるいは「思考プロセス」そのものを直接再現ないしシミュレーションすることが目標に掲げられていました。けれども、二度に渡るブームの頓挫と、その反動である冬の時代の後、人間の「思考プロセス」を再現するという目標はほとんど放棄されてしまったように見えます。

その代わりに、機械学習という形で、人間の思考プロセスとは直接関係なく実用的な問題を解決する手法が注目を集めるようになりました。

機械学習

機械学習とは、「明示的にプログラミングすることなしに、コンピュータに学ぶ能力を与えようとする研究分野*1」です。コンピュータに学習能力を与えるという研究は、1950年代から60年代にかけての『古き良き』人工知能研究とほぼ同時に開始されており、当初機械学習の研究は人工知能研究の下位分野に位置付けられていました。けれども、既に述べた通り「人間と同等の思考ができるコンピュータを作る」という目標が破綻した後では、記号操作による論理や知識の実現とは離れて、むしろ統計学や確率論との結び付きを強めていきました。この背景には、1990年代から現在にかけて、インターネットの普及により大量の文章・画像・音声データ (ビッグデータ) が入手できるようになったことも挙げられます。

近年注目されているディープラーニングのように、特定タスクに対して優れた結果を出すことのできる手法も存在しています。けれども、現代の「人工知能」研究は、初期の人工知能研究のように、人間の知能そのものを実現することはもはや目的としていません。結局のところ、現在の「人工知能」、というよりも「機械学習」や「パターン認識」の手法は、何らかの制約付き最適化問題を解き、事前に定義された目的関数に従って所与のデータを分類するという、言ってしまえばそれだけの数学的技法です。

日本人工知能学会は「人工知能」に関する研究の2つの立場を区別しています。一方は、人間の知能そのものをもつ機械を作ろうとする立場であり、もう一方は、「人間が知能を使ってすること――とりわけ「推論」と「学習」――を機械にさせようとする」立場です。実際の研究のほとんどは後者の立場に立っており、直接的に知能を解明・構築しようという研究とは、研究の目的もアプローチも異なります。

現在「人工知能」として盛んに喧伝されている機械学習の技術は、ごく限定された範囲での人間の認知タスクに対応する「特化型」人工知能です。過去の人工知能研究が直面した「常識的な推論」や「言語の意味理解」という難問を迂回することで新たな成果を生んだと言えます。端的に言えば、第三次人工知能ブームは、人工的な「知能」を実現することを諦めたからこそ、有用な技法が実現したと言えます。


けれども、私は現在の機械学習技術が役に立たないものであるとか将来性がないと主張しているわけではない、ということは明記しておきたいと思います。現在広く報道されている通り、さまざまな分野で機械学習の手法は導入されています。今後もこの傾向は続くでしょう。

そして、ディープラーニングによって、画像や音声など、過去の「人工知能」がうまく扱えなかった外界の刺激をコンピュータで処理できるようになり、新たな応用分野が生まれています。また、多くの人が懸念している通り、特化型人工知能が人間の労働と雇用に莫大な影響を与えることも確実でしょう*2

けれども、最近盛んに語られているような「ディープラーニングとかいう凄い機械学習アルゴリズムビッグデータを与えて学習させると、人間レベルの知能や意識や自律性が創発して自身の知性を再帰的に向上させ、人間には理解できない科学技術を高速で発達させ人間を支配するようになる」というものではありません。

「一方、冷静にみたときに、人工知能にできることは現状ではまだ限られている。基本的には、決められた処理を決められたように行うことしかできず、『学習』と呼ばれる技術も、決められた範囲内で適切な値をみつけ出すだけだ。例外に弱く、汎用性や柔軟性がない。人工知能が人間を支配するなどという話は笑い話にすぎない。*3

事象の地平線派ないし知能爆発派のシンギュラリティが発生するためには、機械が知能を持つのみならず、自身の意思と自律性を持って目標を定めることができ、また自身と同等以上の存在を自己再生産ができる必要があります。幸か不幸か、現在の「人工知能」研究においては「自律性」や「自己再生産能力」どころか、日常的な「言語の意味理解」すら実現の目処が立っていない状態であり、機械に自律性や自己再生産能力を持たせる研究は現在の「人工知能」研究においては全く主流のテーマではありません。

将来において、自律性や自己再生産能力を持つ人工物ができることは、私は必ずしも否定しませんが、その技術は現在の機械学習技術の延長線上には全く存在しません。

 

 参考文献

人工知能の研究史については、下記の書籍を参照しました。

人工知能が変える仕事の未来

人工知能が変える仕事の未来

 

 

*1:A.L.Samuel 1959

*2:私は、シンギュラリティ論には極めて懐疑的ですが、一方で技術的失業は既に現実に発生している問題であると考えており、同時に語られることの多いこの2つの問題を切り離したいと考えています。

*3:松尾豊 『人工知能は人間を超えるか』p.8

人工知能研究と機械学習

前節では、精神転送 (マインドアップローディング) の実現可能性を検討することを通して、人間の脳の再現によって人工的な知能を構成する方法について検討しました。条件を緩和して、「ある個人の人格そのものの複製」という方法ではなく「一般的なヒトの脳のモデリングによる人工的な知能の実現」を考えたとしても、必要となる脳と知能の機能が解明されるまでには相当の時間を要します。少なくとも、カーツワイル氏が主張するように、ここ10年程度の単位で可能だとはあまり考えられません。

 

けれども、「人工的な知能」を作成するため方法は、脳の再現のみではありません。というよりも、過去半世紀ほど実践されてきた「人工知能」の研究では、必ずしも人間の脳を再現するというアプローチを取っていたわけではありません。人間の「思考」プロセスそのものを再現することを目指していたり、あるいは人間の思考とは全く関係のない形で、実用的な機械学習の技術が実現されてきました。

そこで、本節では過去の「人工知能」研究の歴史を簡単に振り返り、また「機械学習」の手法を通した人工的な知能の実現可能性について検討します。

序文から何度か書いてきている通り、私は人間と同程度の知能を持つ「人工物」ができうることは否定しません。けれども、その「人工的な知能」は、現在の技術の延長線上にはない可能性が高いこと、その実現時期に関するカーツワイル氏の見積りは過少である可能性が高いことを説明したいと考えています。

nanoMRIに関する覚書

 私の記事を読んだ方から、「IBMスタンフォード大の共同研究で、既にMRIナノメートル単位の解像度が実現されている」という指摘がありました。

結論から言えば、nanoMRIと呼ばれるこの手法は、微小組織片に対するスキャンの手法であり、私が議論の対象としている生体脳に対する非侵襲的スキャンの手法ではありませんでした。

 

続きを読む