10-2-1 プライバシー

あなたが街を歩くとき、カメラがあなたの顔を認識しているかもしれません。あなたがウェブを閲覧するとき、AIがあなたの行動を追跡しているかもしれません。あなたが病院に行くとき、AIがあなたの健康データから、あなた自身も知らない病気のリスクを予測しているかもしれません。

AIは「見えないもの」を見える化する力を持っています。
その力は、医療・防犯・利便性の向上に役立つ一方で、人間の「見られない自由」を静かに侵食していきます。
個人情報保護法の章で登場したハンナ・アーレントの言葉——「プライバシーとは、自分の一部を世界から隠しておける権利だ」——が、ここでも深く響きます。

プライバシー問題の所在
プライバシー問題の事例
カメラ画像とプライバシー
プライバシー・バイ・デザイン
まとめ

プライバシー問題の所在

AIがプライバシーの問題を引き起こす場面は、大きく二つの段階に分けられます。
データ収集段階と推論段階です。この二つを区別して理解することが、プライバシー問題を正確に把握するための出発点です。

データ収集段階のプライバシー問題——AIの学習には大量のデータが必要です。そのデータを収集する過程で、プライバシーの問題が生じることがあります。
本人の同意なく個人データを収集する、公開されている情報でも大量に収集・組み合わせることで個人を特定できるようになる（いわゆる「モザイク効果」）、センシティブな情報（病歴・信条・性的指向など）が含まれるデータを適切な保護なしに収集する——これらがデータ収集段階の代表的なプライバシー問題です。

推論段階のプライバシー問題——データを収集して学習したAIが、推論（予測・判断）を行う段階でも、プライバシーの問題が生じることがあります。
AIが直接収集していない情報を、他のデータから推測してしまう——これが推論段階の最大の問題です。購買履歴から健康状態を推測する、SNSの投稿から政治的信条を推測する、歩き方のデータから病気を推測する——本人が開示していない情報を、AIが「見えないもの」から読み取ってしまうのです。

プライバシー問題の事例

プライバシーをめぐる問題は、すでに現実の社会で起きています。

ケンブリッジ・アナリティカ事件（2018年）——Facebookのユーザーデータが、本人の同意なく政治的な広告ターゲティングに使われた事件です。約8700万人分のデータが流用されました。
何が問題だったのでしょうか。ケンブリッジ・アナリティカは、Facebookのデータからユーザーの性格・不安・政治的な傾向をAIで分析しました。そして一人ひとりの「心理的な弱点」に合わせたターゲット広告を配信したのです。「移民問題に不安を感じやすい人」には移民への不安を煽るメッセージを、「経済への不満が強い人」には既存の政治家への怒りを煽るメッセージを——「説得」ではなく「心理的な操作」が行われました。
この手法が、2016年のアメリカ大統領選挙や英国のBrexit国民投票に影響を与えた可能性があるとして、世界的な問題になりました。「無料のSNSを使うことの代償は、自分のデータだった」——この事件は、データとプライバシーの関係を世界に問いかけました。

顔認識AIによる誤認逮捕——アメリカでは、顔認識AIが無実の黒人男性を犯罪者と誤って識別し、逮捕されるという事件が複数発生しています。
なぜ間違えたのでしょうか。顔認識AIの学習データには白人男性が多く、黒人の顔データが少なかったのです。そのため、黒人全般の顔に対して精度が低く、似た別人と混同しやすい状態になっていました。防犯カメラに映った黒人男性の犯人を特定しようとしたとき、AIが別の黒人男性を「一致する」と誤って判定し、その判定を信じた警察が無実の人を逮捕してしまったのです。
「AIが差別しているのではない、学習データの偏りが差別を再生産している」——この問題は、次のページで見る「公平性」の問題とも深く絡み合っています。

カメラ画像とプライバシー

街中に設置された防犯カメラ、店舗の顔認識システム、ドライブレコーダー——カメラ画像を使ったAIは、私たちの日常に深く入り込んでいます。

日本では、経済産業省・総務省が「カメラ画像利活用ガイドブック」を公表しています。このガイドブックは、カメラ画像を利活用する際のプライバシー上の留意点と対応策を示しています。
ガイドブックが示す主な留意点はこうです——カメラの設置目的を明確にして公表する、撮影範囲を必要最小限にする、取得した画像データの保存期間を限定する、顔認識など高度な分析を行う場合は特に慎重な配慮が必要——これらが基本的な考え方です。

カメラ画像は「撮影された瞬間から個人情報になりえる」という意識を持つことが、カメラAIを扱う事業者に求められています。

プライバシー・バイ・デザイン

プライバシーの問題に対処するための代表的な考え方が、プライバシー・バイ・デザイン（Privacy by Design）です。
GDPRの章でも登場したこの概念——「プライバシー保護を、サービスや製品の設計段階から組み込む」という考え方です。「後からプライバシー対策を追加する」のではなく、「最初からプライバシーを守るように設計する」。

具体的にはどういうことでしょうか。
顔認識システムを開発するとき——後から「プライバシーに問題がある」と指摘されてから対策を考えるのではなく、設計の段階から「最小限のデータしか収集しない」「データの保存期間を限定する」「本人が削除を要求できる仕組みを作る」といった配慮を組み込む。それがプライバシー・バイ・デザインの本質です。

「問題が起きてから対処する」から「問題が起きないように設計する」へ——この発想の転換が、AIの時代のプライバシー保護の鍵になっています。

まとめ

データ収集段階のプライバシー問題 → AIの学習データを収集する過程で生じるプライバシーの問題。本人の同意なき収集・モザイク効果・センシティブ情報の取扱いなどが代表例
推論段階のプライバシー問題 → AIが推論を行う段階で生じるプライバシーの問題。直接収集していない情報を他のデータから推測してしまうことが主な問題
モザイク効果 → 単独では個人を特定できない情報でも、複数を組み合わせることで個人を特定できるようになる現象
カメラ画像利活用ガイドブック → 経済産業省・総務省が公表した、カメラ画像を利活用する際のプライバシー上の留意点と対応策を示したガイドブック
プライバシー・バイ・デザイン → プライバシー保護をサービスや製品の設計段階から組み込む考え方。後付けではなく最初から設計に組み込む

next ▶　公平性