回帰分析

回帰分析とは、複数の変量、たとえば、身長と体重といったデータで、一方の変数が増える(減る)と、他方の変数も増える(減る)というような場合に、「その関係性をうまく表現できるような数式」を求めることを言います。

Originでは、線形、多項式、非線形フィットツールおよび線形多重回帰ツールで様々な回帰分析を実行できます。

単回帰、多項式回帰、重回帰分析 回帰式の決定(最小二乗法) 回帰結果が良いかどうか Originでの回帰分析の機能とオプション

身長と体重の例の場合、下図のようなデータに対し、Originの線形フィットツールを使用して回帰分析を実行すると、グラフ中の赤線のような直線が計算されます。

体重と身長のデータで線形回帰

この直線を回帰線といい、この線の式として y = a + b*x という回帰式を得られます。この式のなかの、aは直線のY切片(x=0の時のy値)で、bは直線の傾きを表しています。このように数式として表現することによって、たとえば、身長の値からその人の体重を予測するといったことが可能になります。

単回帰、多項式回帰、重回帰分析

単回帰分析

上述の例のように、説明変数であるxが一つで、y = a + b*x という直線の回帰式にを求める分析を単回帰分析あるいは、線形回帰といいます。

多項式回帰分析

同じように説明変数(x)が一つでも、xとyの関係が直線の関係でない場合には、多項式回帰によって分析します。

多項式回帰の場合に得られる回帰式は、y = b0 + b1*x + b2*x² + … + bn*xn という形式になります。

重回帰分析

また、説明変数を複数使った回帰式を求めることもあります。例えば、アパートの部屋面積、築年数、駅徒歩分などの複数の説明変数から、家賃(目的変数:y)を推定するための式を求めるということが可能です。これを重回帰分析とよび、y = a + b1*x1 + b2*x2 + … + bn*xn という式で表現されます。

ほかにも、指数関数、対数関数、三角関数、べき関数、ガウス関数、ローレンツ関数などを使用した非線形の回帰もあります。

回帰式の決定(最小二乗法)

回帰式の決定には、一般的に最小二乗法という手法が使用されます。

Yデータから、Yの予測値を引いた値が残差と呼ばれ、各データの残差を二乗して合計した値(残差平方和、カイ二乗)が最小になるような回帰式を求める方法が最小二乗法です。

回帰結果が良いかどうか

回帰結果の良さは、回帰線が実際のデータポイントにどの程度近いのか、得られた回帰式がどのくらいデータを説明しているかで確認します。その際の指標として、決定係数(R2)というものがあります。

決定係数は0~1までの値をとり、1に近ければ近いほど回帰直線のフィット具合が良いとされています。逆に、0に近ければ近いほど回帰直線のフィット具合が良くないと判断します。

Originで回帰分析を実行した場合は、結果のレポートシートにおいて「R二乗(COD)」が表示されます。

Originではレポートシートに決定係数R二乗が表示

しかし、決定係数 R2は、説明変数の数に左右されるため、Originでは、自由度を考慮した補正R2(自由度調整済み決定係数)も計算します。

自由度が小さいときの回帰直線は、根拠が信用しづらいと判断され、通常の決定係数に比べて補正R2の値は下がります。一方、自由度が大きい場合は十分な根拠となると判断され、補正R2は通常の決定係数に比べてもあまり下がりません。

なお、通常の決定係数は0から1の値を取りますが、補正R2の場合は負の値を取ることもあります。もともとの決定係数が0に近く、かつ自由度が小さい場合に負になることがあります。

Originでの回帰分析の機能とオプション

Originでは、以下のツールを使用して、様々な回帰分析が可能です。

  • 線形回帰:線形フィットツール
  • 多項式回帰:多項式フィットツール
  • 重回帰:線形多重回帰ツール
  • 非線形回帰:非線形曲線フィットツール

以下はフィットツールで使用できるオプションです。

外れ値をマスクしてフィット

グラフ上のあるデータプロットを外れ値としてフィットの計算から除外して実行できます。

外れ値をマスクしてフィット

傾きや切片などのパラメータを固定してフィット

フィットを実行する際に、傾きや切片、各パラメータを一定の値に固定して処理を実行できます。

傾きや切片を固定してフィット

回帰線の表示範囲を変更

出力されるフィット直線/曲線のデータの範囲をカスタマイズできます。

回帰線の表示範囲を変更

信頼区間、信頼楕円を表示

直感的に回帰モデルを解釈するための信頼区間や信頼楕円を表示できます。

信頼区間、信頼楕円を表示

図上値によるフィット

グラフの軸スケールに対応する図上の値で線形/多項式フィットが可能です。たとえば、対数軸でデータプロットが線形に分布するようなデータで線形フィットを実行できます。

図上値でフィット

Xエラー付き線形フィット(Pro)

X、Y双方向にエラーが存在する実験データに対して、XY方向の誤差の二乗和を最小化してフィットを実行します。線形フィットツールでは、York、FV の2つの手法でパラメータのカイ二乗を最小化します。

Xエラー付き線形フィット


 

 

page_top_icon