機械学習:平均二乗誤差と回帰直線の概要

前書き

この記事では、統計的手法の平均二乗誤差を扱い、この手法と回帰直線との関係について説明します。

この例は、デカルト軸上の点で構成されています。デカルト軸上のすべての点の間を最もよく通過する直線を与える数学関数を定義します。

このようにして、これら2つの方法の関係と、それらの関係の結果がどのように一緒に見えるかを学習します。

一般的な説明

これはウィキペディアからの定義です:

統計では、(観測されていない量を推定する手順の)推定量の平均二乗誤差(MSE)は、誤差の二乗の平均、つまり推定値と推定値の平均二乗差を測定します。MSEはリスク関数であり、二乗誤差損失の期待値に対応します。MSEがほとんどの場合厳密に正である(ゼロではない)という事実は、ランダム性のため、または推定量がより正確な推定値を生成できる情報を考慮していないためです。

記事の構造

  • アイデア、グラフの視覚化、平均二乗誤差方程式の感触をつかんでください。
  • 代数操作と最小値を見つけるための2変数関数の導関数を含む数学的な部分。このセクションは後で数式を取得する方法理解したい人のためのものです。興味がない場合はスキップできます。
  • 受け取った数式の説明と、数式における各変数の役割。

アイデアの感触をつかむ

7つのポイントがあり、これらの異なるポイントまでの距離の2乗を最小化する線を見つけることが目標であるとします。

それを理解してみましょう。

例を挙げて、ポイント間に線を引きます。もちろん、私の絵は最高ではありませんが、それはデモンストレーションの目的のためだけです。

あなたは自分自身に尋ねているかもしれません、このグラフは何ですか?

  • 紫のドットは、グラフ上の点です。各ポイントには、x座標とy座標があります。
  • 青い線は、当社の予測ラインです。これは、すべてのポイントを通過し、それらに最適な方法でフィットする線です。この線には、予測されたポイントが含まれています。
  • 各紫色の点と予測線の間の赤い線エラーです。各エラーは、ポイントからその予測ポイントまでの距離です。

学生時代のこの方程式、y = Mx + Bを覚えておく必要があります。ここで、Mは直線の傾き、Bは直線のy切片です。

二乗誤差を最小化するM(傾き)とB(y切片)を見つけたいです!

すべての点の平均二乗誤差を与える数式を定義しましょう。

この方程式が実際に何を意味するのかを分析してみましょう。

  • 数学では、奇妙なEのように見える文字は総和(ギリシャ語のシグマ)と呼ばれます。これは、i = 1からnまでの一連の数値の合計です。これを、最初(i = 1)から最後(i = n)までのすべてのポイントを通過するポイントの配列のように想像してみましょう。
  • 各ポイントについて、ポイントのy座標とy '座標を取得します。y座標は紫色の点です。y 'ポイントは、作成した線上にあります。y '座標値からy座標値を減算し、結果の2乗を計算します。
  • 3番目の部分は、すべての(y-y ')²値の合計を取り、それをnで割ることです。これにより、平均が得られます。

私たちの目標は、この平均を最小化することです。これにより、すべてのポイントを通過する最良の線が提供されます。

コンセプトから数式まで

この部分は、私たちがどのようにして数式にたどり着いたかを理解したい人のためのものです。必要に応じて、次の部分にスキップできます。

ご存知のように、一次方程式はy = mx + bです。ここで、mは傾き、bはy切片です。

グラフの各点を取り、計算を行います(y-y ')²。

しかし、y 'とは何ですか、そしてそれをどのように計算しますか?データの一部としてはありません。

しかし、y 'を計算するには、一次方程式y = mx + bを使用し、xを方程式に入れる必要があることを私たちは知っています。

ここから、次の方程式が得られます。

この式を単純化するために書き直してみましょう。

方程式のすべての括弧を開くことから始めましょう。方程式の違いをわかりやすくするために色を付けました。

それでは、別の操作を適用してみましょう。それぞれの部分をまとめてまとめていきます。すべてのy、(-2ymx)などを取り、それらをすべて並べて配置します。

この時点で、混乱し始めているので、y、xy、x、x²のすべての2乗値の平均を取りましょう。

それぞれについて、すべての2乗値の平均を表す新しい文字を定義しましょう。

例を見てみましょう。すべてのy値を取得し、それが平均であるためnで除算して、y(HeadLine)と呼びます。

方程式の両辺にnを掛けると、次のようになります。

これにより、次の方程式が導き出されます。

得られたものを見ると、3Dサーフェスがあることがわかります。それはガラスのように見え、それは急激に上向きに上昇します。

関数を最小化するMとBを見つけたいと思います。Mに関して偏導関数を作成し、Bに関して偏導関数を作成します。

最小点を探しているので、偏導関数を取り、0と比較します。

受け取った2つの方程式を取り、両方から変数bを分離してから、下の方程式から上の方程式を引きます。

2番目の方程式から最初の方程式を引きます

方程式から分母を取り除きましょう。

これがMを見つける方程式です。これを取り、B方程式を書き留めましょう。

傾きとy切片の方程式

必要な傾きとy切片を見つけるのに役立つ数式を提供しましょう。

それで、あなたはおそらくあなた自身に考えています、それらの奇妙な方程式は一体何ですか?

それらは実際には理解しやすいので、少し話しましょう。

方程式を理解したので、次はすべてをまとめていくつかの例を示します。

例を挙げてくれたカーンアカデミーに大いに感謝します。

例1

(1,2)、(2,1)、(4,3)の3点を取りましょう。

方程式y = mx + bのMとBを見つけましょう。

M方程式とB方程式に関連する部分を計算したら、それらの値を方程式の中に入れて、傾きとy切片を取得しましょう。

それらの結果を取り、一次方程式y = mx + bの中に設定しましょう。

次に、線を引いて、距離の2乗が最小になるように線がどのように線を通過するかを見てみましょう。

例2

(-2、-3)、(-1、-1)、(1,2)、(4,3)の4点を取りましょう。

方程式y = mx + bのMとBを見つけましょう。

前と同じように、これらの値を方程式の中に入れて、MとBを見つけましょう。

それらの結果を取り、一次方程式y = mx + bの中に設定しましょう。

次に、線を引いて、距離の2乗が最小になるように線がどのように線を通過するかを見てみましょう。

結論として

ご覧のとおり、全体のアイデアは単純です。主要な部分とそれらをどのように扱うかを理解する必要があります。

数式を使用して別のグラフ上の線を見つけ、簡単な計算を実行して、傾きとy切片の結果を取得できます。

それだけです、簡単ですね。?

すべてのコメントとすべてのフィードバックを歓迎します—必要に応じて、記事を修正します。

LinkedInで直接私に連絡してください—ここをクリックしてください。