主成分分析(PCA)

グラフ作成・データ解析ソフトOriginProでは、多変量解析の手法の一つである主成分分析を実行可能です。この動画では、OriginProでの主成分分析の操作を、累積寄与率やスクリープロットから抽出する成分の数を決定するといったテクニックとともにご案内しています。

なお、主成分分析の機能は通常版ではご利用いただけません。予めご了承ください。
※字幕付き動画(音声あり)

右下の拡大ボタンボタンで画面を大きくし、設定ボタンで解像度720以上の設定にしてご覧いただくことをお勧めします。

操作方法

  1. サンプルデータにはヨーロッパ25か国における9種類の食品群ごとのタンパク質消費量データがあります。このデータに主成分分析を実行して、ヨーロッパ各国とタンパク源との関係を調べます。
  2. ワークシート左上の空のセルをクリックして全体を選択します。
  3. 「統計」メニューを開き、「多変量解析:主成分分析」を選択します。
  4. ダイアログでは、主成分分析を実行する際の設定や、計算する値などを変更できます。
  5. ここでは、抽出する成分の数を決定するために、一度デフォルトのまま「OK」ボタンを押して実行します。
  6. レポートシートの「相関行列の固有値」の表と「スクリープロット」から、抽出する成分の数を決定します。
  7. この表の「累積寄与率」を確認すると、上から4つの主成分データまでで80%に達していることがわかります。さらに残りの成分はそれぞれ5%程度かそれ以下であることがわかります。このことから、第4主成分までを解析対象とすると良いことがわかります。
  8. 「スクリープロット」をダブルクリックすると、グラフウィンドウとして開けます。
  9. スクリープロットは抽出された各因子が全体をどのくらい説明することができるのかグラフで示したものです。
  10. 固有値が1を切っている主成分を確認するためにY=1の参照線を引きます。Y軸をダブルクリックしてダイアログを開き、「参照線」タブを開きます。
  11. 「軸の値」欄に1を入力して「線」のチェックが付いた状態で「OK」をクリックします。
  12. 4番目のプロットで固有値が1を切るので、寄与率での判断と同様に第4主成分までで良いことがわかります。この結果をもとに再度、主成分分析を実行します。
  13. レポートシート左上の鍵のアイコンをクリックして「パラメータを変更」を選択します。
  14. 主成分分析のダイアログが再度開きます。「設定」タブを開き、「抽出する成分の数」に4を入力します。
  15. 「プロット」タブでは、結果レポートシートに出力するグラフの種類を指定できます。
  16. 主成分の数が3以上の場合、成分プロットを3Dグラフにすることもできます。「OK」ボタンをクリックして、レポートシートを更新します。
  17. レポートシートの「相関行列」表で、各変数の相関の程度を確認できます。
  18. 「抽出した固有ベクトル」で、各食品群が主成分にどのような影響を与えているかを示しています。この値を使って、各主成分の式を表現できます。PC1の中では、主に動物性たんぱく質を含む食物が大きな係数を示しているのがわかります。PC2では、魚や野菜などの係数が大きいことがわかります。
  19. 次に「プロットのローディング」をダブルクリックで表示します。このグラフのX軸はPC1、Y軸はPC2です。原点からの固有ベクトルをプロットすることで、両主成分軸への寄与を確認できます。
  20. 「バイプロット」をダブルクリックして表示させます。元データの25カ国の主成分スコアを散布図としてプロットしたものです。スペインとポルトガルのタンパク源は他の国々とは異なっていることが分かります。 スペインとポルトガルは果物と野菜からタンパク質を得ているのに対し東ヨーロッパの国々、例えばアルバニア、ブルガリア、ユーゴスラビア、ルーマニアでは穀類とナッツ類からタンパク質を摂取していることがわかります。
  21. 主成分分析を実行する際、データの分布を確認するときに散布図行列を作成する場合があります。散布図行列を作成する場合は、まず元データのB~J列までを選択し、「作図:統計:散布図行列」を選択します。
  22. ダイアログで相関係数や線形フィット直線などの散布図行列で表示する項目を選択します。「OK」をクリックすると作図できます。
  23. 今回のデータの場合主成分の数が4つなので、成分プロットを3Dグラフにすることもできます。再度ダイアログを開くために、主成分分析の結果レポートシートに戻ります。
  24. 左上の緑の鍵のアイコンをクリックして「パラメータを変更」を選択します。
  25. ダイアログが開いたら「プロット」タブで「主成分プロットのタイプ」を「3D」に変更します。
  26. 「Z軸の主成分」を4にして第4主成分の軸に設定します。「OK」をクリックすると、レポートシートが更新され、プロットのローディングとバイプロットが3Dグラフで表示されます。
  27. 3DグラフはキーボードでRキーを押しながらマウスでつかめば自由に回転操作が可能です。また、ウィンドウの下側にあるツールバーボタンでも グラフの回転の操作等が可能です。

参考ページ

page_top_icon