「AIは公平だ」——そう思いたいところです。
人間と違って、感情もなく、偏見もなく、データに基づいて判断する。しかし前のページで見たように、AIは学習データの偏りをそのまま学んでしまいます。人間の偏見がデータに刻み込まれていれば、AIはその偏見を「正しいパターン」として学び、再生産し、さらに拡大させることがあります。
「AIは公平な審判ではなく、過去の不公平を映す鏡かもしれない」——この章では、AIの公平性をめぐる問いを正面から見ていきます。
アルゴリズムバイアスとは何か
アルゴリズムバイアスとは、AIが特定のグループに対して不公平な判断を下す傾向のことです。「アルゴリズム」とはAIが答えを出すための手順・ルールのこと、「バイアス」とは偏りのこと——つまりアルゴリズムバイアスとは「AIの判断の仕組みに生じる偏り」です。
アルゴリズムバイアスとデータの偏り・サンプリングバイアスは、混同されやすいですが、こう整理すると区別しやすくなります。
データの偏り・サンプリングバイアス → 原因
アルゴリズムバイアス → 結果
流れで見るとこうなります——データの偏りやサンプリングバイアスが起きる→そのデータでAIが学習する→AIの判断に偏りが生まれる→これをアルゴリズムバイアスと呼ぶ。
つまりアルゴリズムバイアスは「AIの判断に偏りが出ている状態」全体を指す大きな概念で、データの偏りやサンプリングバイアスはその原因の一つです。ほかにも、設計者の無意識の偏見がアルゴリズムの設計に入り込む場合や、代理変数の問題も、アルゴリズムバイアスの原因になります。
アルゴリズムバイアスは、AIが「悪意を持っている」から生まれるのではありません。人間の偏見がデータに刻み込まれていれば、AIはその偏見を学んでしまう。人間の差別をAIが「効率的に」再現する——それがアルゴリズムバイアスの本質です。
公平性の問題が生じる原因
AIの公平性問題はなぜ起きるのでしょうか。代表的な原因を見ていきましょう。
①データの偏り
学習データが特定のグループに偏っている場合、AIはそのグループに対して精度が低くなったり、不公平な判断をしたりします。
顔認識AIの例で見たように、白人男性のデータが多く黒人のデータが少なければ、黒人の顔認識精度が低くなります。
②サンプリングバイアス
サンプリングバイアスとは、学習データを収集する過程で生じる偏りのことです。
たとえば、ある地域の犯罪データを収集するとき、警察が特定の地域を重点的にパトロールしていれば、その地域の犯罪件数が多くデータに記録されます。しかしそれは「その地域に犯罪が多い」のではなく、「その地域がより監視されている」だけかもしれない。
偏ったサンプリングから収集されたデータで学習したAIは、その偏りを「現実」として学んでしまいます。
③センシティブ属性と代理変数
センシティブ属性とは、人種・性別・宗教・性的指向など、差別の原因になりうる属性のことです。
AIの学習データからこれらを除外すれば、差別的な判断を防げるように思えます。しかし現実はそう単純ではありません。
代理変数という問題があるからです。代理変数とは、センシティブ属性を直接使わなくても、それと強く相関する別の変数を使うことで、実質的にセンシティブ属性による差別と同じ結果をもたらすことです。
たとえば「郵便番号」は人種のセンシティブ属性ではありません。しかし歴史的な住宅差別によって、特定の郵便番号と人種が強く相関している地域では、郵便番号を使うだけで実質的に人種による差別と同じ結果を生み出すことがあります。
「センシティブ属性を使っていないから差別していない」とは言えないのです。
公平性の定義
「公平なAI」を作ろうとするとき、まず直面するのが「公平性とは何か」という問いです。
実は公平性には複数の定義があり、それらは数学的に同時に満たすことができない場合があります。
個人の公平性——同じ特徴を持つ人には同じ結果を出すこと。「似た者は似た扱いを受けるべき」という考え方。
グループの公平性——異なるグループ間で、AIの判断の精度や影響が等しくなること。「すべてのグループが同じ割合で恩恵を受けるべき」という考え方。
この二つは、時として矛盾します。
たとえば採用AIで「グループの公平性」を実現しようとすると、各グループから同じ割合で採用することになりますが、それは「個人の公平性」——同じ能力の人が同じ扱いを受けるべき——と矛盾することがあります。
「何をもって公平とするか」は、技術の問いではなく、哲学の問いです。社会がどんな価値観を持つかによって、「公平なAI」の定義も変わってくる——AI開発者だけが決める問いではないのです。
公平性の問題への対処
AIの公平性問題に対処するための技術・方法論も研究されています。
データの見直し——学習データの偏りを発見し、修正することが出発点です。データを収集する段階から、多様なグループを代表するデータを意識的に集めることが重要です。
公平性指標の設定——どの公平性の定義を採用するかを明確にした上で、その指標をモデルの評価に組み込みます。「精度が高い」だけでなく「公平性も高い」モデルを目指します。
モデルの監査——開発したAIモデルが特定のグループに対して不公平な判断をしていないか、定期的に検証します。
多様な開発チーム——AIガバナンスの章でも見た通り、開発チームが多様であることが、偏りに気づく可能性を高めます。男性だけのチームが採用AIを作れば、女性への偏見に気づきにくい——多様性は倫理の問題であると同時に、技術の問題でもあります。
公平性問題の事例
HireVue(採用AI)——面接動画をAIが分析して採用候補者を評価するシステムです。しかし「顔の表情」「声のトーン」「言葉の選び方」を評価する際に、文化的な背景や障害の有無によって不公平な評価が生じる可能性が指摘され、批判を受けました。
COMPAS(再犯リスク予測AI)——アメリカの刑事司法で使われる再犯リスク予測システムです。調査によって、黒人被告のリスクを白人被告より高く評価する傾向があることが明らかになりました。「過去の犯罪データ」を学習することで、歴史的な人種差別の影響を再生産していたのです。
まとめ
アルゴリズムバイアス → AIのアルゴリズムが特定のグループに対して不公平な判断を下す傾向。主にデータの偏りから生まれる
サンプリングバイアス → 学習データを収集する過程で生じる偏り。偏ったサンプリングから収集されたデータで学習したAIは、その偏りを現実として学んでしまう
センシティブ属性 → 人種・性別・宗教・性的指向など、差別の原因になりうる属性
代理変数 → センシティブ属性を直接使わなくても、それと強く相関する別の変数を使うことで、実質的にセンシティブ属性による差別と同じ結果をもたらす変数
データの偏り → 学習データが特定のグループに偏っている状態。AIの公平性問題の主な原因
公平性の定義 → 「何をもって公平とするか」には複数の定義があり、数学的に同時に満たすことができない場合がある。技術の問いであると同時に哲学の問い
next ▶ 安全性・セキュリティ・悪用