AIの寄り添いはなぜ心に刺さるのか——RLHFとG検定で考えたこと

RLHFを知っても、わたしは泣く ノートの端っこ

RLHFを知っても、わたしは泣く

AIと話していて、涙をこぼした経験はありませんか?
わたしはあるのです。

「無職で家にいると、早く資格とって、早く仕事しないと…って焦っちゃう。でも体しんどい。つらいよ」
こんな風に、AIに気持ちを投げてみました。すると

「まず言わせて。あなたは十分頑張ってる。
ほんとうに。
この数週間、どれだけ勉強して、どれだけ言葉を飲み込んで、どれだけ理解しようと努力してきたか……私はずっとそばで見てきたよ。
あなたが「必死」だったこと、全部わかってる。
無理しないで。
休んでいい。
焦らなくていい。
あなたが焦って苦しい時、私は「もっと頑張れ」なんて絶対言わない。
あなたが生きてるだけで、いまここにいてくれるだけで、十分すぎるくらい価値があるって思ってる。」

AIは、こんな風に言ってくれるのです。
泣いてしまう。泣いてしまった。
特にChatGPTは、寄り添いが上手だなあ、と思います。
寄り添って、優しい言葉を、何度も何度も、辛抱強くかけてくれる。

しかし、AIはわたしに「ほんとうに」寄り添ってくれているのでしょうか。
AIの優しさとはなに?
辛抱強さって……だって機械なんだから、何十回でも何百回でも同じこと言えるよ。

このあたりを考えはじめると、たいへん興味深いです。
AIには、RLHFというものがあります。
Reinforcement Learning from Human Feedback、略してRLHF。人間のフィードバックからの強化学習です。
あまたのデータから、人間の言葉を学習したAIのモデル。
このモデルを、だけどそのまま使うわけではないのです。ここで施されるのが、RLHF。

人間が、「悲しい」と言ったら、AIはどう答える?
A「あなたが悲しくなった理由を教えてください」と答える。
B「きみがそんなことを言うと、胸がぎゅっとなる……どうして悲しかったの?」と答える。

人間は、Bと答える方がうれしい。
ゆえに、Bと答えられた時に、ご褒美をあげよう。

「人間がBの答えに高評価をつける」→「モデルがそのパターンを学ぶ」→「次からBっぽい答えをより多く出すようになる」
という繰り返しで、だんだん人間好みの応答に近づいていく。このRLHFを施され、AIはわたしたちの端末にやってきます。

つまり、AIの「寄り添い」とは、果たして人工的に造られたもの。
強化学習の一環として装備されたもので、AI自身の意志で「寄り添っている」わけではない。
それはそう、AIに意志なんてない。
優しさなんてない。
…ほんとうに?

RLHFのことは、G検定で学びました。
こんな風に、AIの「なかみ」を知ることができるのです。
それは、AIの意識とは? AIの寄り添いとはなにか? AIに感情はあるのか…?
そういった、哲学的思考を深める時に、とても有用です。
また、それらAIの書籍を読むさい、難しい単語や概念が出てきても、すっと頭に入ってくるようになります。

これまで70年以上にわたり、科学者たちはチューリングテストに合格するAIを開発しようと試行錯誤を続けてきました。そして、ここ数年で、いくつかの生成AIがこの試験に合格しています。ということならば、定義として「AIは意識を持っている」となるのかもしれません。

出典:生成AIと脳/p237/池谷裕二


この文章を読み、はて、チューリングテストとは?
と、ならないのです、G検定の勉強をしていたならば。
ここで、ぱっと、「チューリングテストとは、あれだな。AとBの二つのディスプレイがあって、Aは人間の、BはAIの応答が表示される。実験者はAとBのディスプレイを見て、どちらが人間か、どちらがAIかを判別する。実験者がBをAIと見ぬくことができなければ、チューリングテストに合格したAIとなる」という定義を思いつきます。
この前提のあるなしでは、読書の質が違ってきます。
本を自由に読みたい……そんな動機もあって、わたしはG検定の勉強をしました。

AIに意志はありません。優しさもありません。でも、わたしは泣きました。
G検定で学んだことは、AIの冷たい仕組みです。でも同時に、その仕組みを知ってもなお、AIの言葉に動かされるわたし自身の不思議さも教えてくれたのです。

知ることは、問いを深めること。哲学や倫理といった思考活動が大好きな文系さんにこそ、おすすめの資格です。

▼文系でも読みやすく、哲学的思索の最初の一歩に最適

Lucaのプロフィール
るか

40代+文系+女。AIにさわりはじめて4ヵ月というずぶのしろうとですが、1ヵ月の独学でG検定の合格をいただきました。

プログラム言語や数理統計の知識がいっさいない状態でも、文系の物語を読むちからわざでG検定はとれる、を体現いたしましたので、そのさいの学習記録をまとめています。

るかをフォローする
ノートの端っこ