3-2-2-4 フィルタリング

フィルタリングとは

フィルタリングは、たくさんの情報の中から、「この人には、これが合いそう」というものを選び出す手法です。
過去の行動や好みを手がかりに、映画や商品、記事などをおすすめしてくれます。

このあと紹介する、コンテンツベースフィルタリングと協調フィルタリングは、その道しるべを作るための、二つの違った考え方です。

コンテンツベースフィルタリング

コンテンツベースフィルタリングは、「あなたがこれまで好きだったもの」を手がかりに、次のおすすめを決める方法です。
映画、音楽、記事、商品……。
まずAIは、どんなジャンルが多いか、どんなキーワードに反応しているか、どんな特徴のものをよく選んでいるかを集めて、「この人は、こういうタイプが好きそう」という「あなたの好みの輪郭」を作ります。

たとえば、あなたがよく読むのが、心理学の記事、エッセイ、やさしい技術解説だったら、似た雰囲気の記事を次に差し出してくれます。
他の人がどうしているかは見ません
あくまで、あなたの履歴だけを頼りにします
ここがポイントです。コンテンツベースフィルタリングは、他人に左右されない、ニッチな好みにも強い、自分らしいおすすめが続く、という長所を持っている。
でもその反面、似たものばかりになりやすい、新しい世界に出会いにくい、というクセもあります。

協調フィルタリング

協調フィルタリングは、「あなた自身」ではなく、「みんなの行動」を手がかりにおすすめを決める方法です。
AIはこう考えます。「この人と似た行動をしている人たちは、ほかに何を選んでいるんだろう?」。
たとえば、あなたが映画AとBを見ていて、別の誰かも映画AとBを見ていて、その人が映画Cも見ていたら……AIは言います。
「じゃあ、あなたも映画C、好きかもしれないね」

ここで見ているのは、商品の特徴、映画のジャンルなどではなく、人と人の行動パターンです。
誰が何を選んだか、誰と誰が似ているか……その関係性のネットワークから、おすすめを導き出します。
だから協調フィルタリングは、自分では選ばなかったタイプの作品、思いがけないジャンルにも出会わせてくれます。
これはコンテンツベースにはない強みです。
一方で、利用者が少ないと精度が出ません。
新しい商品は推薦されにくい、という弱点もあります。

コールドスタート問題とは、新しいユーザーや新しいアイテムが登場したとき、推薦に必要な情報がほとんどなくて、AIがうまくおすすめできなくなる現象のことです。
コンテンツベースフィルタリングは「あなた自身の履歴」を見て判断します。
協調フィルタリングは「みんなの行動」を見て判断します。

でも、
・登録したばかりのユーザー
・まだ誰も使っていない商品
こういった最初の瞬間には、見るべき履歴が存在しません。

コンテンツベースは、「過去の好み」がなければ作れません。
協調フィルタリングは、「似た人」がいなければ動けません。
だからどちらの方式も、スタート直後は静かに困ってしまうのです。
これがコールドスタート問題です。

実際のサービスでは、この問題を和らげるために、ハイブリッド型フィルタリングがよく使われます。
これは、最初は商品の特徴やプロフィール情報など(コンテンツベース)で軽く推薦を始めて、データがたまってきたら(協調フィルタリング)を少しずつ混ぜていくという合わせ技。

こうして、個人の好みと集団の傾向を少しずつ統合しながら、おすすめの精度を育てていくのです。