その23:IT、ディジタル情報の限界(その2)

IT、ディジタル情報の限界(その2)

 今回のテーマは前回に引き続き「IT」、「ディジタル情報」の限界についてです。
 前回は、「IT」、「ディジタル情報」の限界の中から、「ラスト・ワンマイルの問題」、「電気エネルギーの問題」、「寿命の問題」の3つについて説明しました。今回はこれに引き続き、「ロボット・人工知能(AI)の限界」、「シンギュラリティは到来するか」の2つについて解説したいと思います。

(1)ロボット・人工知能(AI)の限界:
 まず、人工知能(AI)が抱える課題として古くから有名な二つの問題を紹介しましょう。それは「フレーム問題」というものと「シンボルグラウンディング問題」と呼ばれているものです。
 「フレーム問題(frame problem)」とは、米国の計算機科学者であり、初期の人工知能研究の第一人者であるジョン・マッカーシーらの論文の中で1969年に述べられたのが最初であり、昔から知られているAIの古典的な問題です。「フレーム(frame)」とは、「人間が判断する時に、何を考えに入れ、何を考えに入れないかの範囲を決める枠組み(フレーム:frame)のこと」です。人間は無意識のうちに常にそのフレームを想定しながら行動しています。例えば、天気の良い日に犬と近所に散歩しに出かけたとしましょう。いつもの通り慣れた散歩ルートなので、どこの交差点が車の通行量が多くて危険だとか、狭い路地で自転車とすれ違う時に気をつけなければならないとか、いろいろなことを想定をして行動しています。しかし、いきなり空から今飛んでいる飛行機が落ちてくるかもしれないとか、誰かが遊びで落とし穴を掘っていてそこに落ちてしまうかもしれない、などということは恐らく想定していないでしょう。これらはフレームの外側、つまり「想定外」にしているのです。さらに、人間は、そのフレームを、いろいろな状況により、ダイナミックに変化させています。先ほどの例で、いつもの通りが今日は道路工事中だとか、風が急に強くなってきたなどの状況の変化があれば、工事で掘っている穴に落ちないようにしようとか、強風で木が倒れてぶつかったり、看板などの物が飛んでくるかもしれないといった想定を増やし、フレームの内側に入れて慎重に行動するでしょう。これらのフレームをどうするかの基準は、多くは経験や知識からその人の主観も含みながら決められます。地震が発生して大きな揺れを感じた時に、ある人はすぐに机の下に頭を隠して防備するでしょうし、別の人はまだ平気だと行動を起こさないかもしれません。このようにフレームには個人差もあります。フレーム問題とは、このように人間が無意識のうちに行っている、その時の状況にあったフレームをダイナミックに想定することを、人工知能(AI)ではできないという問題のことです。
 このフレーム問題を表すこんな逸話があります。ある時、ロボット科学者と彼に作られた人工知能(AI)を搭載したロボットがトンネルの前にいました。ロボットは電気エネルギーで動作するため、動くためにはバッテリーが必要です。ところが、そのバッテリーが不足してきたので、入手することにしました。やっと見つけたバッテリーは、あるトンネルの中にあり、さらにその上には時限爆弾が付けられていました。ロボット科学者はロボットに対し、「トンネルの中からバッテリーを持って来なさい」と指示をしました。その命令に従い、ロボットは、トンネルの中に入ってバッテリーを持ってきました。しかし、バッテリーに付けられた時限爆弾もいっしょに持ってきてしまったのです。結局、バッテリーを持ってきたものの、それに付いた時限爆弾が破裂し、そのバッテリーは使えなくなってしまいました。そこで、ロボット科学者はロボットに対し、今度は失敗をしないようにと考え、「バッテリーに付けられた時限爆弾の影響もよく考えて持って来なさい」と指示をしました。するとロボットは、時限爆弾の影響を考えましたが、適切なフレームを持たなかったため、時限爆弾の中に入っている火薬は何かとか、爆弾の破壊力はどれぐらいかなど、いろいろ考えているうちに時間がかかりタイムアップとなってしまい、トンネル内で爆弾が爆発して、バッテリーはやはり使えなかった、というお話です。
 置かれた状況によって影響をどこまで想定しなければならないか、その適切な判断をロボットができないために失敗を招いてしまった、ということを示唆しています。「フレーム」を広くすればより正確に判断できるかもしれませんが時間がかかり過ぎると何の役にも立ちません。また、「フレーム」をあまりに狭くしてしまうと、短時間で判断できますが、判断の妥当性は低くなってしまいます。「フレーム」を適切に想定することを完全に対策することは現在ではまだ難しく、現状では「限定的で固定的なフレームを決めて行動させる」などの方法でロボットを作っています。例えば、自動掃除機ロボット【図1】は、家庭室内をフレームの内側(想定の範囲)として設計されています。室内において使う分には動作は保証されていますが、いきなり室外である庭の掃除に使ったら誤動作してどこかへ居なくなってしまうかもしれません。


図1:自動掃除機ロボット
iRobot社 ホームページより
https://www.irobot-jp.com/product/e5/

 もう一つの「シンボルグランディング問題」を紹介しましょう。「シンボル(記号)」とは、「概念(concept)」に結びつけられた、「ことば」のことであり、「シンボルグランディング問題」とは、人工知能(AI)がその「概念」と「シンボル(ことば)」とを人間のように多面的に結びつける(グランディング)ことが困難なことです。例えば、「コップ」の概念を人工知能(AI)に教えようとした場合、形状や大きさなどのいくつかの特徴を教えることはできても、人間が常識として持っている「感触」、「強度」、「用途」などの幅広い知識まですべてを教えることはなかなか難しいのです。しかし、実際に生活する場合には、これらの幅広い知識を駆使して人間は生きています。前にも例を挙げたように、人間はガラスのコップを運ぶ時には壊したり、落とさないように気を付けてそっと、すべらないように包むように持ち、問題なく運ぶことができますが、ロボットはこれらの概念を完全に理解していないため、強く力を入れて握って割ってしまったり、すべって持てなかったり失敗をしてしまいます。人間であれば、生まれたばかりの赤ちゃんをそっと首を支えるようにして抱いてあげたり、けがをしている人に患部を保護するように抱いたりしますが、ロボットはまだそこまでに至っていません。人間と同等になるためには、人間の骨格の構造であるとか、どこをどのようにされたら痛いかなどを理解しなければなりません。人間はこれらの常識、知識の多くを五感を通した経験からも得ています。この「シンボルグランディング問題」を解決するのに最後の壁になるのが人間の五感をどうやってシミュレートし、ロボットや人工知能(AI)にインプットするか、ということになるのではないかと思います。この五感のシミュレートについては、視覚と聴覚についてはかなりの「情報」を入れられるようになってきています。しかも目と耳は二つしかないのでセンサーの数もそれほど多くは必要ありません。嗅覚も鼻は一つなので比較的やり易いかもしれません。しかし触覚と味覚はセンサーを沢山準備しなければそのすべての「情報」を正確には取り込めないのではないかと思われます。特に触覚は物質の温度・湿度や感触(質感)、強度などいろいろな種類のデータを指先、手、足、など全身で計測する必要があり、難しい技術だと考えられます。ここで得られた「情報」を他の器官で計測した「情報」と組み合わせて「経験」として記憶することが必要となるのです。味覚も難しい問題です。目をつぶって、しかも鼻をつまんで食べた時と、食材を目にし、香りを楽しみながら食べた時の味は別だと思われるため、これらの「情報」をすべて結びつけないといけないことになります。これはとても難しいと考えられます【図2】。


図2:細胞・分子センシングメカニズム(味覚、臭覚のセンシング)
情報通信研究機構(NICT)ホームページより
https://www.nict.go.jp/frontier/seitai/research_theme01.html

 この二つの問題以外にも、コンピューターの演算能力の問題もあります。人工知能(AI)の一つの実現方法として、人間の脳の動きを真似するアプローチがあります。人間の脳は、ニューロンと呼ばれるおよそ1,000億個の脳細胞でできています。ニューロンとニューロンは互いにつながっており、シナプスという組織を通して情報を伝達し、大きなネットワーク構造を持つ神経回路を作っています。この神経回路で情報が処理されているのです。この仕掛けをモデル化し、コンピューターで処理する方法が「ニューラルネットワーク」という方式であり、現在の人工知能(AI)の主流である「ディープディープラーニング」もこれを応用したものです。人間の脳細胞の一つ一つの演算能力はそれほど高くありませんが、それをネットワークでつなぎ、同時並列で処理を行うことにより、現在のスーパーコンピューターの能力に匹敵するほどの演算能力を発揮しているのです。また、人間の脳の記憶容量は、約1TB(テラバイト:テラは10の12乗))と現在のパーソナル・コンピューターに内蔵されているハードディスクドライブ(HDD:hard disc drive)程度と少ないですが、脳の仕組みがネットワーク構造のため、多くのデータから、必要なデータのみを瞬時に検索することができます。これに対し、現在主流のコンピューターの「アーキテクチャ」は前述のフォン・ノイマン型(本ブロク その9:コンピューターの構成(アーキテクチャ)についてをご参照ください)であり、基本的に逐次的であり、並列処理には向いていません。それでもCPU一つを一つの脳細胞に割り当て、CPUをネットワークで接続すれば並列に処理することができるようになるかもしれませんが、そうなると一人分の脳を作るためには1,000億台のCPUが必要になり、前述の電力の問題なども出てきて現実的ではありません。これを解決するために、一つ一つの演算能力を落とし、低電力で並列処理をできるCPUや、並列処理が得意な「量子コンピューター」といったものが研究・開発されています。何年後かはわかりませんが、、将来これらの技術によりコンピューターの演算能力の問題は解決されるかもしれません。

 以上、ご説明したように、現段階でロボット・人工知能(AI)にはいくつかの課題はありますが、人工知能(AI)を含むITは日進月歩で進化しており、そのうち解決されるだろうという意見は多くあります。「人工知能は人間を超えるか」の著者であり、日本を代表する人工知能研究者の松尾豊氏はその著書の中で2025年頃には人工知能は言語との紐づけ、すなわちシンボルグラウンディングをできるようになり、人間の言語の意味を理解するだろうと予測しています【図3】。また、2030年ごろにはいろいろな問題を人間のように自身が賢くなりながら解くことができる「汎用AI」が実用化されるという意見もあります。現在の人工知能(AI)は囲碁をするAIや画像を識別するAIなど、特定の目的別に問題を解決できるものが多いのですが、「汎用AI」の登場により、人間と同じように自分でいろいろな問題を解決していく、人間の脳のレベルに達すると予測されています。


図3:人工知能の技術の発展と社会への影響
松尾豊 『人工知能は人間を超えるか』 P.217より

(2)「シンギュラリティ(技術的特異点)」は到来するか:
 アメリカ合衆国の未来学者レイ・カーツワイル(Ray Kurzweil)【図4】は、人工知能(AI)が全人類の知性を超える転換点(シンギュラリティ)が、2045年にも訪れると予測しています。カーツワイルは具体的な根拠を示しながら、その到来を説明しています。現在のペースでコンピューターの演算能力が向上していくと、2030年には人間の脳と同等の演算能力を持つパーソナル・コンピューターが1,000ドル程度で購入できるようになるため、人類の脳の演算能力が1,000ドル程度のパーソナル・コンピューターと同等になり、2045年には人類は高度化された人工知能(AI)にかなわなくなる、というものです。また、その著書で「「シンギュラリティ」とは、私たち人類の生物としての思考と存在が、自ら作り出したテクノロジーと融合する臨界点である。」とも言っています。つまり、私たちが創り出したテクノロジーである「IT・AI」と生物としての人間との境界がなくなり、一体化するということです。サイバー空間とフィジカル空間が一体化するとも言えます。人間の脳とサイバー空間の間を取り持つインタフェースが開発され、脳の中の記憶や経験がサイバー空間の「ディジタル情報」となんの支障もなく行き来するようになると主張しています。人間の脳の記憶や経験をコンピューターにアップロードしたり、逆にハードディスクドライブ(HDD:hard disc drive)から人間の脳へダウンロードできるようになるということです。この段階で、人間の脳と体は「ソフトウェア(脳の中の情報)」と「ハードウェア(生物としての体)」として分離されることになります。「ソフトウェア」の脳は、自分が好きなハードウェアを選ぶことができるようになります。身長が高く体力的に強い体であるとか、走力に優れた体であるとか好み通りに選択することができるようになります。また、体が古くなったら新しい体に変えることもできるので、人間は不老不死という永遠の願望も手に入れることになるのです。しかも、自分が他人より優れていると感じた人は、優れた人間を地球上に増やしたいと考え、自分の脳をコピーし、自分と同じ考え方、知識をもったコピー人間を大量生産するかもしれません。かなり話が飛躍してしまいましたが、その出発点は「人間の脳の中身(脳の神経回路)」をディジタル化してコンピューターにアップロードしたり、逆にダウンロードしたりできてしまうか否かにかかっています。人間の脳の記憶や知識、経験の中には、体と一体となっていることにより生まれているものがあります。自分の身体的特徴であるとか、感触などの感覚であるとかそれらの情報と結びつけながら記憶されています。それを体と分離し、脳の情報だけを取り出して使うなどということができるのでしょうか。できたとして、それは正常に動作するのでしょうか。私にはにわかには信じがたいことです。


図4:レイ・カーツワイル(Ray Kurzweil)
Yahoo!ニュースより
https://news.yahoo.co.jp/feature/571/

 しかし、コンピューターと人間の脳をつなごうとする試みはすでに始まっています。そのひとつが「BMI(Brain-machine Interface)【図5】」と呼ばれる脳とコンピューターをつなぐ技術です。米フェイスブックは脳で「言葉」を思い浮かべるだけで、その「言葉」をコンピューターに入力できる技術を開発中であり、日本経済新聞によると、「数年以内に脳から1分間に100単語の入力を可能にする」ことを目標としているそうです。1単語を6文字とすると、1分間に600文字、1秒間に10文字の入力が可能になるということです。コンピューターに文字情報を入力する一般的な方法は「キーボ-ド」ですが、かなり慣れた人の入力速度がちょうど1秒間に10文字程度と言われていますので、一般的な人がキーボードで入力する速度と同等の速さで入力することができることになります。利用目的としては、手に障害があり、キーボードやタッチパネルなどを使えない方のための医療目的とのことであり、この技術が実現されるよう期待したいと思います。この技術があれば、人間の脳からコンピューターへの「情報」移動が可能になります。人間の脳で考えた「言葉」が、ディジタル情報に変換され、コンピューターに入力されるのです。しかし、まだ伝えることができるのは「言葉」だけです。膨大な記憶や知識、経験からなる人間の脳の神経回路をそのままアップロードできるわけではありません。
 私は「シンギュラリティ」が到来するには、まだ時間がかかりそうだと考えています。仮に「シンギュラリティ」が到来してしまったら、その時が今の「ホモ・サピエンス」の終焉となるでしょう。そして、人類は次の世代の「新ホモ・サピエンス」の時代へと進化することになり、今の「ホモ・サピエンス」は人類進化上の過去に存在した4番目の世代(種類)として歴史にのみ残る存在になってしまうでしょう。


図5:BMI(Brain-machine Interface)の例
シーネットネットワークスジャパン ホームページより
https://japan.cnet.com/article/35170662/


 以上、今回はIT、ディジタル情報の限界として「ロボット・人工知能(AI)の限界」、「シンギュラリティは到来するか」について解説しました。ここでご説明した課題、問題点はあくまでも現時点(2021年)のものです。本ブログ内でもご説明しましたが、人工知能(AI)を含むITは日進月歩で進化しており、そのうち解決されるだろうという意見は多くあります。ある課題は驚くほどすぐに解決されてしまうかもしれません。また、ある課題はやはり難しく、20年~30年経っても解決できていないかもしれません。しかし、いろいろな研究がされることは間違いありません。その多くの研究中からブイレイスルーとなる技術が現れ、驚異的な進歩を遂げる可能性があります。私たちは、これらの多くの研究の中のどれが問題を解決する重要な技術なのか、残念ながらそうはならない技術なのかを、できるだけ早く見極め、その波に乗っていくことが大切です。

 

 

2021年09月03日