9-2-2 AIと著作権法30条の4 学習データの利用ルール

AIを学習させるには、大量のデータが必要です。
テキスト、画像、音楽、コード——インターネット上に溢れるこれらのデータの多くには、著作権があります。では、AIの学習にこれらのデータを使うことは、著作権侵害になるのでしょうか。

この問いに答えるのが、著作権法30条の4です。AI開発者にとっても、創作者にとっても、そして私たち全員にとっても、非常に重要な条文です。丁寧に見ていきましょう。

著作権法30条の4とは何か

著作権法30条の4は、「情報解析」を目的とする場合、著作権者の許可なく著作物を利用できると定めた条文です。2018年の著作権法改正で導入されました。

条文の核心はここです——「著作物に表現された思想または感情の享受を目的としない利用」であれば、著作権者の許可なく著作物を利用できる

少し難しい言葉ですが、こう理解するとわかりやすいでしょう。
「享受を目的としない」とは——その著作物を「読んで楽しむ」「見て感動する」という目的ではない、ということです。
AIが小説を学習データとして読み込むとき、AIは小説を「楽しんでいる」わけではありません。文章のパターンを統計的に学ぶために使っているだけです。これが「享受を目的としない利用」にあたります。

ミケにたとえるなら——チュールのパッケージのデザインを「おいしそうだな」と眺めるのが「享受」、パッケージに書かれた文字を「読んで情報を得る」のが「享受を目的としない利用」のイメージです。

30条の4が認める利用の範囲

著作権法30条の4が認める利用は、情報解析に必要な範囲に限られます
具体的にはこんな場面が該当します。

AIモデルの学習——ウェブ上のテキスト・画像・音楽を収集してAIに学習させること。著作権者の許可なく行えます。
データマイニング——大量のデータからパターンや傾向を分析すること。研究・開発目的での著作物の利用が認められます。
著作物のコピー・蓄積——学習のためにデータをサーバーに保存すること。これも30条の4の範囲内とされています。

30条の4の例外

しかし30条の4には、重要な例外があります。
「著作権者の利益を不当に害することとなる場合」には、30条の4は適用されないのです。
これが、現在最も議論になっている論点です。
どんな場合が「著作権者の利益を不当に害する」にあたるのか——明確な基準はまだ確立されていません。

議論になっている具体的な場面を見てみましょう。
学習データ市場の問題——著作権者が「AIの学習用データセット」として販売・提供しているデータと、同じデータを無断でスクレイピングしてAIに学習させる場合。著作権者が本来得られるはずの収益を失うため、「利益を不当に害する」にあたる可能性があります。
特定の著作者のスタイルを模倣する目的の学習——特定の作家の文体や画家の画風を模倣するためだけに、その著作者の作品を大量に学習させる場合。これも「利益を不当に害する」にあたる可能性があるとして、議論が続いています。

「学ぶこと」と「出力すること」

30条の4を理解する上で、最も重要なポイントがあります。
AIが学習に使うこと」と「AIが著作物をそのまま出力すること」は、まったく別の問題として扱われるということです。

学習の段階——ウェブ上の文章をAIが読み込んでパターンを学ぶ——は、30条の4によって許容されます。

しかし出力の段階——AIが学習した著作物をそのまま、あるいはほぼそのままの形で出力する——は、30条の4の保護外です。これは通常の著作権侵害の問題として扱われます。

たとえば、AIに「夏目漱石の『坊っちゃん』の冒頭を書いて」と指示して、原文そのままの文章が出力された場合——学習に使ったことは問題ないが、そのまま出力することは著作権侵害になりえます。
「学ぶことはいい、でも盗むことはいけない」——この区別が、30条の4の本質です。

なぜ日本はこのルールを作ったのか

著作権法30条の4が導入された背景には、日本のAI産業の競争力への配慮があります。
アメリカでは「フェアユース(公正利用)」という柔軟な概念で、AI学習へのデータ利用が広く認められてきました。
一方で日本は、かつてAI学習のためのデータ利用について明確なルールがなく、法的な不確実性がAI開発の足枷になるという懸念がありました。

30条の4の導入により、日本はAI学習のためのデータ利用について、世界でも比較的明確なルールを持つ国の一つになりました。
「日本はAI学習に著作権の制約が少ない」として、海外から注目されることもあります。

しかし一方で、「創作者の権利が軽視されているのではないか」という批判も根強くあります。
小説家・イラストレーター・音楽家——自分の作品がAIの学習に無断で使われることへの不満や不安は、世界中の創作者が共有している感情です。
法律と創作者の感情の間にある溝は、まだ埋まっていません。

まとめ

著作権法30条の4 → 情報解析(AIの学習など)を目的とする場合、著作権者の許可なく著作物を利用できると定めた条文。2018年の著作権法改正で導入された
享受を目的としない利用 → 著作物を「読んで楽しむ」「見て感動する」といった目的ではなく、情報解析のために利用すること。30条の4が許容する利用の核心概念
著作権者の利益を不当に害する場合 → 30条の4の例外規定。この場合には許可なく著作物を利用できない。何がこれにあたるかは現在も議論中
フェアユース → アメリカの著作権法上の概念。著作物の公正な利用を広く認める柔軟な制度。日本にはない

next ▶ AI生成物の著作権 誰が権利を持つのか