二元グラフ(散布図)
散布図は、2 つの連続変数の関係を視覚化するためによく使用されるツールです。
Stata の graph twoway scatter
コマンドを使用して散布図を作成できます。
また、オプションを追加してカスタマイズされたグラフを作成することもできます。
まず、nhanes2l データセットを開きます。
. webuse nhanes2l
twoway scatter
を使用して、変数 age を横軸に、
変数 bmi (Body Mass Index) を縦軸にした散布図を作成します。
. twoway (scatter bmi age)
次に、グラフにタイトルを追加しましょう。 コマンドを 2 行で記述するために「///」を使用していることに注意してください。 コマンドウィンドウではこれを行うことはできませんが、do ファイルで長いグラフコマンドを記述するときに便利です。
. twoway (scatter bmi age), ///
title("Scatterplot of age (years) and body mass index (BMI)")
マーカーを小さな緑の三角形に変更しましょう。
. twoway (scatter bmi age, ///
mcolor(green) msize(tiny) msymbol(triangle)), ///
title("Scatterplot of age (years) and body mass index (BMI)")
if オプションを使用して、一部のデータを用いて散布図を作成できます。
label list diabetes
と入力して、変数 diabetes のカテゴリを表示してみましょう。
. label list diabetes
下の散布図に if diabetes==0 オプションを追加して、糖尿病のない人の観測値のみをプロットしました。
. twoway (scatter bmi age if diabetes==0, ///
mcolor(green) msize(tiny) msymbol(triangle)), ///
title("Scatterplot of age (years) and body mass index (BMI)")
中サイズの赤い円を使用して、糖尿病患者用の 2 つ目の散布図を追加しましょう。
. twoway (scatter bmi age if diabetes==0, ///
mcolor(green) msize(tiny) msymbol(triangle)) ///
(scatter bmi age if diabetes==1, ///
mcolor(red) msize(small) msymbol(circle)), ///
title("Scatterplot of age (years) and body mass index (BMI)")
次に、どのシンボルがどのグループを表しているかがわかるように凡例を編集しましょう。
. twoway (scatter bmi age if diabetes==0, ///
mcolor(green) msize(tiny) msymbol(triangle)) ///
(scatter bmi age if diabetes==1, ///
mcolor(red) msize(small) msymbol(circle)), ///
title("Scatterplot of age (years) and body mass index (BMI)") ///
legend(order(1 "No Diabetes" 2 "Diabetes") ///
rows(1) position(12))
散布図をカスタマイズするために、他にも多くのオプションが用意されています。
参考
さらに詳しい内容につきましては、下記のマニュアルをご覧ください。