ディープラーニングは、世界を認識するだけでなく、その先で「どう動くか」「何を生み出すか」まで扱えるようになってきました。ゲームやロボットの行動選択を学ぶ深層強化学習、画像や文章を生成するモデル、既存の知識を別の課題に活かす転移学習、そして画像と言葉を同時に扱うマルチモーダル。こうした技術は、AIを単なる判定機械から、より柔軟で創造的な存在へ近づけています。このページでは、その代表例をひとつずつたどっていきます。
6-4 深層強化学習
AIはどのように試行錯誤を重ね、より賢く行動できるように進化してきたのでしょうか。▶続きを読む
AIがより効率よく、安定して学べるようにするためのさまざまな工夫があります。▶続きを読む
シミュレーションだけでなく、現実の世界でも通用するAIを実現するための課題とその解決が求められます。▶続きを読む
現実の複雑で多様な状況に対応するために、AIはさらに高度な仕組みを取り入れていきます。▶続きを読む
6-5 データ生成
◆GAN・DCGAN・CycleGAN 画像生成AIを支える技術
生成器と識別器が競い合う、AIの「贋作師と鑑定士」の物語。▶続きを読む
◆拡散モデルとNeRF Stable Diffusionのしくみ
ノイズの中から絵を生み出し、見ていない角度の世界を想像する、GANの次世代技術。▶続きを読む
テキストを紡ぎ、声を合成する——私たちの日常に最も近い生成AIの世界へ。▶続きを読む
6-6 転移学習・ファインチューニング
一から学ぶより、すでに知っていることを活かす——AIが「下積み」を武器にする発想。▶続きを読む
汎用的な知識を持つAIを、特定の仕事のプロに仕立て上げる技術と、その落とし穴。▶続きを読む
◆Few-shot学習と自己教師あり学習 少ないデータで賢くなる
「お手本が少ししかない」——その制約の中で、AIはどこまで賢くなれるのか。▶続きを読む
6-7 マルチモーダル
画像も、言葉も、音も——複数の情報を同時に扱えるAIは、どのように生まれたのでしょうか。▶続きを読む
写真を言葉で説明し、質問に答え、言葉から絵を描く——マルチモーダルAIができることの全体像です。▶続きを読む
◆代表的なマルチモーダルモデル CLIP・DALL-E・Flamingo・Unified-IO
マルチモーダルの世界を切り開いてきた、四つの代表的なモデルを一つずつ見ていきましょう。▶続きを読む