翻訳：人工知能 — 革命いまだ成らず - シンギュラリティ教徒への論駁の書

以下は、カリフォルニア大学バークレー校のコンピュータ科学、統計学教授マイケル・I・ジョーダン氏の記事 "Artificial Intelligence — The Revolution Hasn’t Happened Yet" の翻訳です。

人工知能 — 革命いまだ成らず

人工知能 (AI) は現代の真言(マントラ)である。この言葉は、技術者、研究者、ジャーナリストやベンチャーキャピタリストによっても唱えられている。他の数多くの言葉と同様にテクニカルな学問分野から一般的な流通へと至るにつれて、言葉の用法に著しい誤解が伴っている。けれども、一般大衆が科学者を理解できないのは今に始まったことではない。—ここでは科学者もたいてい一般人と同様に混乱している。現代は、人類自身の知能と競合するシリコン製知能の出現を目撃しつつあるという考えは、我々みんなを楽しませるものだ。—我々を魅了し、また同じ程度に恐怖させる。そして、不幸なことに、我々の気を逸らすものである。

現代について語りうる別の物語もある。次のような話を考えてみてほしい。そこでは人間、コンピュータ、データと生死の決断が関わっているが、しかし、話の焦点はシリコン上の知能というファンタジー以外のところにある。私の配偶者が14年前に妊娠したとき、私たち夫婦は超音波検査を受診した。検査室には遺伝学者がいて、胎児の心臓のまわりに白い斑点が見えると指摘した。「これはダウン症候群の兆候です。」と彼女は言った。「現在、リスクは20分の1に上昇しています。」更に彼女が私たちに教えてくれたところによると、ダウン症の原因となる遺伝的変化が本当に胎児に発生しているかどうか、羊水穿刺検査 [amniocentesis] によって確認できるという。けれども、羊水穿刺には危険があった。 —処置中に胎児が死に至るリスクは、だいたい300分の1であった。私は統計学者なので、これらの数字がどこから来たのか確認しようと決めた。長い話を端折って言えば、その約10年前に英国で統計分析が実施されていたと分かった。白い斑点は、カルシウムの蓄積を反映しており、確かにダウン症の予測因子として認められていたのである。しかし、同時に気付いたこととして、私たちの検査に使われた撮影装置の解像度は、英国の研究で使われたものよりも1平方インチあたり数百ピクセル高いのであった。私は戻って、遺伝学者に白い斑点は偽陽性 [false positive] ではないかと伝えた。 —それらは文字通りの「ホワイトノイズ」かもしれない、と。「あぁ、それが数年前からダウン症診断の件数が増えた理由ですね。そのころ新しい機械が導入されたのです。」と彼女は言った。

私たちは羊水穿刺検査を受けず、数ヶ月後には元気な女の子が誕生した。けれども、このエピソードから、私は不安を覚えた。とりわけ、簡単な概算をして、同じ日に全世界で何千人もの人々が超音波検査を受け、そのうちの多数の人が羊水穿刺検査を受けようと思い、多くの赤子が不必要に亡くなったのだと分かった後では。そして、この問題は何らかの形で修正されるまで毎日毎日起こっていたのだ。このエピソードが暴いた問題は、単に私個人の医療ケアに留まらない。さまざまな場所と時間において変数と結果を測定し、統計分析を実施し、その結果を別の場所と時間で利用するという、医療システムに関するものである。問題は、単にデータ分析それ自体にあるのでもなく、データベース研究者が呼ぶところの「素性 [provenance]」に関連している。 —広く言えば、どこからデータが来たのか、データから引き出せる推論は何か、それらの推論は現在の状況とどれほど関連があるのか？など。確かに、訓練を受けた人間であれば、これら事例のすべてを一件一件検証できるかもしれない。問題は、それほどの詳細な人間の関与なしに同様のことができるような、惑星規模の医療システムを設計することにある。

私はまたコンピュータ科学者でもある。私が思うに、コンピュータ科学と統計を統合し、なおかつ人にとっての利便性を考慮に入れた、この種の惑星規模の推論-意思決定システム構築に必要とされる原則は、私自身の教育課程の中にはどこにも発見できない。また、このような原則 —医療分野のみならず、ビジネス、運輸や教育分野でも必要とされる原則— の開発は、少なくとも、ゲームプレイや感覚運動のスキルによって注目を集めるAIシステムの構築と同じ程度には重要であると思う。

近い将来「知能」が理解できるかどうかとは関係なく、我々は大きな課題を抱えている。つまり、人々の生活を向上させられるような方法でコンピュータと人間[の判断]を組み合せることである。この課題は、「人工知能」の創造に付随していると見なされる場合があるものの、より率直に —しかしあまり仰々しくない言い方をすれば— 新しいエンジニアリング分野の設立と見なすこともできるだろう。数十年前の土木工学や化学工学と同様に、この新しい研究分野(ディシプリン)の目標は、複数の鍵となるアイデアの力を集め、人々に新たなリソースと能力を与え、そしてこれらを安全に実行することにある。土木工学や化学工学は物理学と化学の上に建てられているが、この新しい工学のディシプリンは、過去1世紀の間に実現したアイデアを土台として建てられるだろう。 —「情報」、「アルゴリズム」、「データ」、「不確実性」、「コンピューティング」、「推論」や「最適化」などである。更には、新しいディシプリンが注目する点の多くは、人間からのまたは人間についてのデータにあるため、その開発には社会科学と人文学の視点が必要とされるだろう。

建築用ブロックは出現し始めているにもかかわらず、これらのブロックをまとめ上げる原則は未だ出現していないため、現在のところ、ブロックは場当たり的な方法で積み上げられている。

ゆえに、土木工学の存在前からビルや橋梁が建築されていたのと同じく、機械、人間と環境が絡む、社会規模の推論-意思決定システムの構築は進行中である。初期のビルや橋が予測不可能な形で崩壊し、悲劇的な結果をもたらしたのと同じく、初期の社会規模の推論-意思決定システムの多くは、深刻なコンセプト上の欠陥を既に露呈し始めている。

また、不幸なことに、次に発生する深刻な欠陥が何であるかという予測を我々はそれほど得意としていない。我々に欠けているのは、分析と設計の原則を含むエンジニアリングのディシプリンである。

現在、これらの問題に関する公的な対話では、「AI」が知的なワイルドカードとしてあまりに乱用されすぎているため、新興テクノロジーの影響範囲とそれがもたらす結果についての議論が困難になっている。直近の過去と歴史的な文脈の両方において、「AI」とは一体何を指していたのかを注意深く検討することから始めよう。

今日、とりわけ公的領域で「AI」と呼ばれている技術のほとんどが、過去数十年間「機械学習 [Machine Learning]」(ML) と呼ばれてきたものである。MLはアルゴリズム的な分野であり、統計、コンピュータ科学、その他のディシプリン (下記参照) を統合して、データを処理し、予測あるいは意思決定の補助をするアルゴリズムを設計するものだ。実世界への影響という点では、MLは本物であり、またつい最近始まったのものでもない。実際、MLが産業界と関わりを持つ巨大分野になりうるということは1990年代初めに既に明らかであった。そして、今世紀初頭までには、既にAmazonのような先見性のある企業は事業全体でMLの利用を始めており、不正検出や物流予測などのミッションクリティカルなバックエンドの問題解決を行い、またレコメンドシステムのような革新的な消費者向けサービスを構築していた。その後20年以上にわたってデータセットと計算リソースが高速で成長するにつれて、Amazonのみならず、意思決定に巨大な規模のデータを使用しうる実質的にあらゆる企業に対して、MLは力を与えるものであると広く知られるようになった。新しいビジネスモデルも登場するだろう。この現象を示すために「データサイエンス」というフレーズも使われ始めた。これはスケーラブルでロバストなMLシステムを構築するためには、MLアルゴリズムの専門家がデータベースと分散システムの専門家と協力する必要性が生じたことを反映している。また、結果として作られるシステムの社会・環境的なスコープの拡大も反映している。

このアイデアとテクノロジーのトレンドの合流は、過去数年の間に「AI」として再度ブランド化された。この再ブランド化について、少しばかり精査する意義があるだろう。

歴史的には、「AI」というフレーズは1950年代に作られたものであり、ソフトウェアおよびハードウェア的に人間レベルの知能を有する実体(エンティティ)の実現を目指す野心的な願望を指していた。この記事では、上記の願望を指して「人間に似たAI [human-imitative AI]」という語を使用する。人工的な知能を持つエンティティは、身体的にはともかく少なくとも精神的には (その意味が何であれ)、人間と類似のものであるべきという考え方を強調するためだ。これは大部分が学問的な事業であった。オペレーションズ・リサーチ、統計、パターン認識、情報理論や制御理論といった関連する学問分野は既に存在しており、これらの分野では人間の知能 (と動物の知能) から着想を得ている場合もあった。しかし、これらの分野では、おそらく「低次の」信号と決定にフォーカスが当てられていたようである。たとえば、リスの能力、自分が住む森林の三次元構造を知覚し、枝から枝へ飛び回るといった能力が、これらの分野の発想元であった。「AI」では、それとは別の何かにフォーカスが当てられていた。—「推論」や「思考」をする人間の「高次の」あるいは「認知」能力である。けれども、60年経った後でさえ、人間の高次の推論と思考は依然解明されていない。現在「AI」と呼ばれている技術開発は、主に低次のパターン認識と動作制御、および統計学 —データ中のパターンを発見し、明確な予測を提示し、仮説と意思決定を検証するディシプリン— に関連した分野から生じている。

実際のところ、1980年代初頭にデヴィド・ルーメルハートによって再発見された有名な「逆伝播 [backpropagation]」アルゴリズムも、今ではいわゆる「AI革命」の核心にあると見なされているものの、もともとは1950年代から1960年代にかけて制御理論分野で発見されたものである。そのアルゴリズムの初期の応用事例は、アポロ宇宙船の推進力を月へと向けて最適化することにあった。

1960年代以来多くの進歩があったものの、おそらくそれは「人間に似たAI」を追求した結果ではあるまい。むしろ、アポロ宇宙船の事例と同様これらのアイデアはたいてい背景に隠されており、ある特定のエンジニアリング上の問題解決にフォーカスした研究者による手作業の成果であったのだ。一般大衆からは隠れていたものの、文書検索、テキスト分類、不正検出、レコメンデーション・システム、パーソナライズ検索、ソーシャルネットワーク分析、計画、診断、A/Bテストなどの分野における研究やシステム構築は、目ざましい成果を挙げた。—このような進展が、Google、Netflix、FacebookやAmazonといった企業に力をもたらしたのだ。

このすべてが「AI」と呼べると単純に考える人もいるだろう。そしてそれが実際に発生している状況のようだ。そのようなラベリングは、最適化研究者や統計学者には驚きであったかもしれない。気付いたら突然「AI研究者」と呼ばれるようになってしまったのだから。しかし、研究に対するラベリングは脇に置くとしよう。より大きな問題は、ただ一つの、定義の不明確なこの略語の使用によって、知的・ビジネス的な範囲に及ぶ目前の問題に対する正確な理解が妨げられていることである。

過去20年の間に、産業界と学術界の両方で、「人間に似たAI」の夢を補完するところで大きな進歩が見られた。しばしばこの分野は「知能増強 [Intelligence Argumentation]」と呼ばれる。ここでは計算とデータが、人間の知能と創造性を増強するサービスの創造に向けて使われている。検索エンジン(人間の記憶と事実の知識を増強する)、自然言語翻訳 (人間のコミュニケーション能力を増強する)などは、IAの実例と見なせるだろう。コンピュータを用いた音や画像の生成は、アーティストにとってのパレットと創造性の強化装置として働く。こういったサービスは、いずれは高次の推論と思考を含むことになるかもしれないが、現状ではそうではない。—ほとんどの場合、さまざまな文字列マッチングと数値計算を行い、人間が利用しうるパターンを検出するのみである。

もう1つ最後の略語を使うことをお許しいただきたいが、「知能インフラ [Intelligent Infrastructure]」 (II) という分野を広く考えてみよう。これは計算、データと物理的エンティティのウェブであり、人間の環境をもっとサポートし、面白く安全なものにするために存在する。このようなインフラは、たとえば運輸、医療、商業と金融などの分野で姿を現し始めており、個人と社会に対して大きな影響を与えることになるだろう。知能インフラの出現は、時として「モノのインターネット[Internet of Things]」に関する会話の中で取り上げられることもある。けれども、そのような試みは、概して「モノ」をインターネットに接続する問題のみを指している場合が多い。実世界に関する事実を発見するためのデータストリームの分析能力をこれらの「モノ」に付与すること、単なるビット列ではなくより高次の抽象的なレベルで人間や他の「モノ」と相互作用することなどに関わる、もっと壮大な課題の集まりを意味してはいない。

たとえば、私の個人的な体験談に戻って、「社会規模の医療システム」の中で我々が生活を営むことを想像してみてほしい。そのシステムは、医師と人間の体内と周囲にあるデバイスとの間でデータフローとデータ分析フローを設定し、それによって診断と治療の提供のために人間の知能を補助できるのだ。システムは、体内の細胞、DNA、血液検査、環境、人々の遺伝子、および薬品と治療法についての膨大な科学文献からの情報と協調するであろう。単に1人の患者と医者のみではなく、あらゆる人々の関係に焦点を当てたものになるだろう。 —ちょうど、現在の医療治験で、1つの人間(または動物) 集団に対して実施された実験の結果を、他の人たちの治療に役立てられるのと同じである。関連性、素性や信頼性といった概念を保証するためにも役立つだろう。現在の銀行システムが、融資と支払の領域における同種の課題にフォーカスしているのと似た方法である。また、このようなシステムによって多くの問題が発生すると予想できるだろうが —プライバシー、責任、セキュリティに関わる問題など— これらの問題は課題として適切に捉えられるべきであり、致命的な欠陥と見なすべきではない。

今や我々は核心的な問題に辿りついた。古典的な人間に似たAIのアプローチは、これらの大きな課題に注力するためのベストなまたは唯一の方法なのだろうか？盛んに喧伝された、直近のMLのサクセスストーリーの中には、確かに人間に似たAIに関連する領域から生まれたものもある。—たとえば、コンピュータビジョン、音声認識、ゲームプレイやロボティクスといった分野である。そのため、もしかしたら単にこれらの分野の更なる発展を待っているだけで良いのかもしれない。ここで指摘しておきたいことが2点ある。1点目は、報道を読んでいるだけでは理解できないかもしれないが、人間に似たAIでの成功は、実際のところ限定されているということだ。—人間に似たAIという夢想の実現から、我々は遥か遠い位置にいる。残念なことに、人間に似たAIの分野での非常にわずかな進歩でさえ興奮 (または恐怖) を引き起こし、他のエンジニアリング分野では見られないような熱狂とメディアの注目を集める。

2点目に、更に重要なこととして、これらの分野での成功は、IAとIIの問題を解決するために十分でも必要でもないということだ。十分性の側面については、自動運転車を考えてみてほしい。その種のテクノロジーを実現するためには、広範なエンジニアリングの問題を解決する必要があるが、その問題は人間の能力 (または人間の能力の欠如) とあまり関係がない。運輸システム全体 (IIシステム) は、現状の疎結合で、前向きの、不注意な人間の運転手の集まりよりは、現在の航空管制システムと似通ったものとなる可能性が高いだろう。自動運転システム全体は、現在の航空管制システムよりも大いに複雑なものとなり、特に、膨大な量のデータと適応的な統計モデリングを使用して、細粒度の決定を通知する。最先端に位置づけられるべきは上記のような課題であるため、このような試みの中で「人間に似たAI」へ注目することは、本質から逸れることになりかねない。

必要性の議論としては、ときどき次のように主張されることがある。人間に似たAIの願望は、IAとIIの願望も包含している。なぜならば、人間に似たAIは古典的なAIの問題 (たとえば、チューリングテストなど) を解決できるだけではなく、IAとIIの問題を解決するための最良の賭けであるだろうから。このような議論は、歴史的にほとんど前例がない。土木工学の発展は、人工大工や人工レンガ職人の創造を想定していたのだろうか？化学工学は、人工化学者の創造という観点から枠組みを定めるべきだろうか？論争的に言うなら、もしも目標が化学工場の建設であるならば、化学工場の建設方法を考案するような人工化学者を最初に作るべきなのだろうか？

関連した主張としては、人間の知能は我々が知るなかで唯一の知能であるため、最初のステップとしてその再現を目指すべきだという主張がある。けれども、実際のところ、人間はある種の推論に優れているとは言いがたい。—我々は間違いも犯すし、バイアスも限界もある。更には、より重大な問題としては、現代的なIIシステムが取り組む必要がある大規模な意思決定を遂行したり、あるいはIIの文脈で生じる種類の不確実性へ対処したりするように、人間は進化してきていないということが挙げられる。AIシステムは、人間の知能を模倣するのみならず「修正」もでき、いくらでも巨大な問題にスケールできるのだという主張があるかもしれない。けれども、ここはサイエンス・フィクションの領分に入る。—このような空想的な議論は、フィクションの設定としては楽しいものであるが、現在発生しつつあるIAとIIのクリティカルな問題に対処するための主要戦略とするべきではない。IAとIIの問題は、それ自体の観点において解決する必要があり、人間に似たAIというアジェンダのオマケなどではない。

IIシステムのアルゴリズム的・インフラ的な課題は、人間に似たAIの中心的なテーマではないと指摘することは難しくない。IIシステムには、急速に変化する、全体がインコヒーレントであるかもしれない分散型知識レポジトリを管理する能力が要求される。そのようなシステムは、タイムリーで分散的な意思決定をするため、クラウド-エッジ間の双方向通信を扱う必要がある。また、ロングテール的な現象、つまり、ある人にはたくさんデータがあるが大多数の人にはほとんどデータがないような現象にも対応できなければならない。行政と競争の境界を越えてデータを共有する困難さにも立ち向かう必要がある。最後に、特に重要な点としては、IIシステムは、インセンティブや価格付けといった経済的なアイデアを、人間個々人と価値ある財とを相互に結び付けるように、統計と計算インフラの世界へと取り入れる必要がある。このようなIIシステムは、単にサービスを提供するものではなく、マーケットを創造するものと見なすことができよう。音楽、文学やジャーナリズムのように、このようなマーケットの登場を切望している分野もある。そこでは、データ分析が生産者と消費者を結び付ける。またこれは進化していく社会、倫理および法的規範の範疇で行なわれなければならない。

当然、古典的な人間に似たAIの問題に対しても、大きな関心が払われ続けるだろう。けれども、データ収集を通したAI研究に対する現状の関心、「ディープラーニング」インフラのデプロイ、あるいは狭い範囲で定義された人間のスキルを模倣するシステムのデモンストレーション —新規の説明的原則 [explanatory principles] がほとんどない方法によるもの— などが、古典的なAIの主要な未解決問題への注目を削いでしまう傾向にある。これらの未解決問題には、意味と推論を取り込んで自然言語処理を実行するシステム、因果関係の推論と表現、計算的に扱いやすい形式でのあいまいさの表現、および長期目標の定式化と追求をするシステム開発などの必要性が挙げられる。これらは人間に似たAI分野の古くからのゴールであるが、現状の「AI革命」に対するバカ騒ぎの中では、これらが未解決の問題であることはたやすく忘れられてしまう。

IAもまた重要であり続けるだろう。なぜならば、予見できる未来には、実世界の状況に関する抽象的推論について、コンピュータと人間の能力は一致しないからである。最も差し迫った問題を解決するため、人間とコンピュータの相互作用に関しての緻密な考察が必要である。そして、我々はコンピュータによって新たな段階の人間の創造性が引き出されることを望んでいるのであり、人間の創造性(それがどのような意味であれ) が代替されることを望んではいないだろう。

「AI」という用語を生み出したのは、ジョン・マッカーシー (当時ダートマス大学の教授で、後にMITで職を得た) であった。おそらくマッカーシーは、自身の新たな研究アジェンダを、ノーバート・ウィーナー (その以前からのMITの教授) のアジェンダと区別しようとしたのではないかと思う。ウィーナーは、自身の知能システムに対するビジョンを指して「サイバネティクス」という語を造語した。—彼のビジョンは、オペレーションズ・リサーチ、統計、パターン認識、情報理論と制御理論に密接に結びついていた。一方で、マッカーシーは論理との関係を強調した。今の時代ではウィーナーの知的アジェンダが支配的だが、その旗印はマッカーシーの用語の下にあることは興味深い逆転である。(けれども、確実に現在の状態は一時的なものだろう。AIという振り子は他の分野よりも大きく振れるものだから。)

けれども、我々はマッカーシーとウィーナーによる特殊な歴史的パースペクティブを乗り越えて前進する必要がある。

今のパブリックなAIの議論 —産業界の狭い一部分と学術界の狭い一部分のみに焦点を当てた議論—によって、AI、IA、IIの全スコープで示される課題とチャンスを見失うリスクがあると認識しなければならない。

このスコープは、超人的マシーンのサイエンスフィクション的な夢想または悪夢の現実化よりも狭いものであり、「日常生活においてテクノロジーがますます普及し影響を強めるにつれて、人間はテクノロジーを理解し形作る必要がある」といった議論よりは広いスコープである。更には、この理解と形成においては、単にテクノロジーに順応した人との対話のみならず、あらゆる種類の生き方をする人たちからの多様な声が必要とされる。人間に似たAIに焦点を当てた狭い議論は、適切に広い範囲からの声に耳を傾けることを妨げるだろう。

産業界は引き続き多くの技術開発を進めるだろうが、アカデミアもまた不可欠な役割を担い続けるだろう。アカデミアは、最もイノベーティブな技術的アイデアを提供するのみならず、コンピュータと統計分野からの研究者と、その貢献と視座が強く求められる他の分野からの研究者を結び付ける。—特に、社会科学、認知科学と人文学である。

その一方で、我々が前に進むにあたって人文学と科学は不可欠であり、その規模と範囲は前例のないものではあるとはいえ、エンジニアリング上の試みを越えた何かについて語っているというフリもしてはならない。—社会は、新しい種類の人工物を構築することを目指している。これら人工物は、主張された通りの機能を果たすよう構築されるべきだ。医療、交通手段やビジネス的な機会を補助するというシステムを構築した後で、これらのシステムが実際には機能しないと知らされるようなことを望まないだろう。—これらのシステムが、人々の生命や幸福を犠牲にするような誤ちを犯した後で。この点において、既に私が強調した通り、データにフォーカスした領域と、学習にフォーカスした領域には、未だ登場していないエンジニアリングの分野が存在する。後者の領域がどれほどエキサイティングに映るとしても、これらは未だ1つのエンジニアリング分野を構成するものとして見ることはできない。

更には、我々が目にしているのは新しいエンジニアリング分野の創立であるという事実を受け入れるべきだ。「エンジニアリング」という語は、—アカデミアでもそれ以外でも— しばしば狭い感覚を呼び起こすことがある。寒々しく、感情の無い機械的な、人間によるコントロールの喪失という意味合いを帯びている。しかし、エンジニアリングのディシプリンは、私たちが望むものとすることができる。

現代には、歴史的に新しい何かを創設する真のチャンスがある。—人間中心的なエンジニアリングのディシプリンである。

私はこの新たな分野に命名することに抵抗するが、しかし「AI」という略語が引き続きプレースホルダー的な用語として使われ続けるならば、このプレースホルダーの真の限界を心に留めてほしい。スコープを広げ、ハイプを抑え、先にある深刻な課題を認識しよう。