3-1-2-1 線形回帰

線形回帰は、とても素朴な考え方から始まります。
たとえば、部屋が広いほど、家賃は高くなります。勉強時間が長いほど、点数は上がりやすいです。
そんなふうに、「これが増えると、あれも増える」という関係。
線形回帰は、そのなんとなくの関係を、一本の線で表そうとします。

たくさんのデータ点を紙の上に並べて、「このあたりを通る線を引いたら、いちばん自然かな?」と考えます。
その線を使って、新しい条件を入れたら、だいたいこのくらいの値になりそう、と未来を予測します。

広さ → 家賃
広告費 → 売上
勉強時間 → テスト点

答えはすべて数字です。
だから線形回帰は、分類じゃなくて回帰の仲間。
ここで大事なのは、線形回帰は、シンプル速い結果が説明しやすいという、とても実務向きなモデルだということ。
「なぜこの予測になったのか」も、係数を見るとだいたい分かります。
ビジネスでよく使われる理由は、ここです。

でも、弱点もあります。
世界はいつも、きれいな直線じゃない。
感情も、行動も、社会も、たいていは曲がっています。線形回帰は、「まっすぐな関係」しか扱えないのです。

線形回帰は教えてくれます。
すべてを完璧に表せなくても、一本の線を引くことで、世界は少し読みやすくなる。
わたしたちもきっと、人生の中で何度も、仮の直線を引きながら生きている。
完全じゃなくていい。だいたいの方向が見えれば、それでいい。
線形回帰は、そんな人間的なやさしさを持ったモデルなのです。

線形回帰には、ふたつの顔があります。
ひとつは、とてもシンプルな 単回帰分析。
もうひとつは、少し現実に近づいた 重回帰分析。

まずは、単回帰分析
これは、「ひとつの原因から、ひとつの結果を見る」という考え方。
たとえば、

勉強時間 → テストの点
部屋の広さ → 家賃

入力はひとつ。答えもひとつ。
分かりやすいし、関係も説明しやすい。
でも、現実はだいたい、もっと複雑です。

そこで出てくるのが、重回帰分析
今度は、

部屋の広さ
駅からの距離
築年数
周辺環境

家賃

のように、複数の要素を同時に使って予測します。
答えは同じ(家賃)でも、見るポイントが増えます。

単回帰が「一対一」なら、重回帰は「みんなで一緒に」。
より現実に近いけれど、どの要素がどれくらい効いているか、似た特徴が混ざっていないか……など、注意することも増えてきます。