Lasso回帰・推定

Lassoは、オーバーフィッテングの問題に対応したモデルの推定手法です。
モデル推定において既存の標本に新しいデータを追加したとたんに、モデルフィットが極端に悪くなる現象をオーバーフィッティングと呼びます。
Tobshirani(1996)が提案したLassoは、オーバーフィッティングと同時に、非常に多くの説明変数を利用するモデルにおいて、予測力を重視する場合のモデル推定に役立ちます。
機械学習の手法であるLassoをサポートしている統計ソフトウェアStataにて、モデルの選択、予測、統計的推測を行いませんか?
多くの説明変数を利用する為、Stataのエディションは、MP2-core以上を推奨します。

Stata Lassoウェビナーのご案内

ライトストーンでは、どなたでも無料でご視聴いただけるウェビナーを開催中です。
「Lassoウェビナー」では、実際にStataを一緒に操作しながらその機能をコンパクトに紹介します。
詳しくはStataウェビナーページをご覧ください。

Stataウェビナー

ウェビナーアーカイブ動画

Lasso 機能一覧

予測とモデル選択のためのlasso

  • lasso
  • elastic net
  • square-root lasso
  • 連続、二値およびカウントアウトカム
  • クラスターデータ

推論のためのlasso

  • 共変量の効果予測
  • 係数、標準誤差、検定、信頼区間
  • ロバスト、クラスターロバストなSE
  • 調整変数のlassoでの選択
  • Robust to model-selection mistakes by lasso
  • 二重選択
  • パーシャルアウト
  • クロスフィットパーシャルアウト
  • 二重機械学習 (DML1およびDML2)
  • 線形、ロジットおよびポアソン回帰
  • 線形モデルにおける内生性のある共変量
  • 処置効果

ベイジアンlasso

  • 係数のL1罰則を指定するためのラプラス事前情報
  • 罰則パラメータのガンマ事前情報
  • 重要な予測変数を選択するためのベイズ基準

データの準備

  • データランダムな標本に分割
  • 大規模な変数リストの管理
    • 変数名の作成
      • 全ての連続変数
      • 全てのカテゴリ変数
      • ユーザ設定

選択方法

  • 相互検証
  • 適応型lasso
  • Plugin iterative formula
  • ベイズ情報量基準
  • ユーザ定義

選択したモデルの評価

  • グラフ
    • 相互検証関数プロット
    • 係数パス
  • 適合度
    • 予測の平均二乗誤差
    • 標本内・標本外の決定係数
    • 逸脱
    • 標本内・標本外の逸脱比
    • BIC
    • 係数の相対L1-norm
    • 係数の相対二乗L2-norm
  • 推定された係数
    • 罰則付き
    • 選択後

例題集

下記の機能の操作方法を解説した日本語の例題集をご用意しております。

  • Lassoによるフィッティングとモデル選択の方法
  • 選択(cv):クロスバリデーション
  • CV(クロスバリデーション)関数
  • 係数へのペナルティと選択
  • lassoselectコマンドを使って手作業でλを選択する

詳細資料

詳細は、開発元StataCorp.の機能紹介ページにあるマニュアルをご覧ください。

開発元StataCorp.のトレーニングコース

Lasso Using Stata: Methods for Prediction and Inference training course

操作方法の動画

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

page_top_icon