ハノイの塔
三本の柱があって、そこに、大きさの違う円盤が重なっています。
円盤は、いちばん上は小さくて、下に行くほど大きい。
このゲームのルールは、たった二つ。
①一度に動かせるのは、一枚だけ
②大きい円盤を、小さい円盤の上に置いてはいけない
ゴールは、この山を、別の柱へ、そっくりそのまま移すこと。
最初は、簡単に見えます。
一枚動かして、また一枚動かして。
でも、円盤が増えると、急に世界が広がるのです。
どれを先に動かす?
今ここで小さいのを動かしていい?
あとで困らない?
気づくと、未来が枝分かれしている……。
ハノイの塔は、「一手先」だけじゃなく、「ずっと先」まで考えないと解けない遊び。
ここが、AI研究者にとって大事でした。
状態がはっきり決まっていて、ルールも明確で、正解も一つ。
つまり、現実のごちゃごちゃを全部そぎ落とした、きれいな世界。研究室サイズの、小さな宇宙。AIはここで、探索木を作り、深さ優先や幅優先で道をたどり、手順を組み立てる、という練習をする。人間で言えば、いきなり社会に出る前の、思考トレーニング。
でも、落とし穴があります。
ハノイの塔は、どれだけ複雑になっても、世界は変わらない。ルールも変わらない。例外もない。
現実みたいに、急に雨が降ったり、人の気分が変わったり、情報が足りなかったりしない。
だからAIは、この小さな世界では上手に考えられるのに、本物の世界に出ると、迷子になるのです。
これが、トイ・プロブレムにつながっていきます。
SHRDLU
机の上に、積み木の世界があります。
赤いブロック。
青いブロック。
四角い柱。
小さな箱。
すべてが、きれいに名前を持っていて、どこに何があるかも、はっきり決まっている。
この小さな世界で、人はAIに話しかけます。
「赤いブロックを青い箱の上に置いて」
するとAIは、その意味を理解したように動く。
これが SHRDLU。
1970年代にTerry Winograd が作った、言語理解の実験システムです。
SHRDLUは、文を解析して、どの物体の話かを判断して、動作の順番を組み立てて、実際に積み木を動かす……という一連の流れを、ひとつの閉じた世界の中で実現しました。
当時としては、かなり衝撃的。
「機械が、言葉をわかっているみたい」
そんな空気が、研究室に満ちていました。
でも、SHRDLUが「わかっていた」のは、この世界には積み木しかない、色も形も数も全部決まっている、例外は起きないという、完璧に管理された宇宙だけ。
現実の会話には、あいまいさがあって、前提が食い違って、気分も変わる。
でもSHRDLUの世界には、曖昧さも、勘違いも、読むべき空気もない。ただ、整理された物体と言葉だけ。
それでも、この実験は大切でした。
SHRDLUは示してくれたのです。
言葉は、単なる文字列じゃなくて、世界の状態と結びついていることを。
「置く」という言葉は、実際の「配置の変化」とつながっていることを。
ここから、シンボルグラウンディング、身体性、中国語の部屋といった、深い問いへと道が伸びていきます。
STRIPS
トイ・ワールドでは、ハノイの塔で「考え方」を練習し、SHRDLUで「言葉」と「世界」をつないできました。
でも、もう一つ足りないものがありました。
それは……どう動くか。
たとえば、こういう願い。
「赤いブロックを、青い箱の上に置きたい」
人間なら、自然にやります。
手を伸ばして、持ち上げて、置く。
でもAIには、「自然」がありません。
そこで登場するのが STRIPS。
これは、「目的」にたどり着くまでの行動の順番(プラン)を組み立てる仕組みなのです。
STRIPSの世界では、すべての行動が、きちんと文章で書かれています。
・この行動をするためには、何が必要か(前提条件)
・その行動をしたら、世界はどう変わるか(結果)……というように。
AIは、今の状態を見て、できる行動を選んで、世界を更新して、また次の行動を考えます。
これを繰り返して、ゴールに届く手順書を作るのです。
一歩。また一歩。目的は遠くても、できることを積み重ねていく。
ここがとても大事。
STRIPSは、感情も直感も使わない。
ただ、今ここに何があるか、何ができるか、それで世界がどう変わるかを、論理的に追いかける。
でも、この世界もやっぱり「小さい」。
物は全部見えている。状態は完全にわかる。予想外の出来事は起きない。
現実みたいに、誰かが急に動いたり、物が壊れたり、気分が変わったりしない。
だからSTRIPSは、研究室の中では美しく動いたけれど、本物の世界では、すぐ迷子になるのです。
STRIPSは、AIが、「考える」だけじゃなく、「行動を計画する」存在になれることを示しました。
ここから、後のロボット制御やプランニング研究へと、道が伸びていきます。