ヒストグラム
ヒストグラムは、連続変数の分布を視覚化するために使用される一般的なツールです。
Stata の histogram
コマンドを使用して簡単にヒストグラムを作成でき、
オプションを追加してグラフをカスタマイズすることもできます。
ヒストグラムを作成するには、twoway graph histogram
を使用することもできます。
ここでは、ヒストグラムのみに焦点を当てます。
まず、nhanes2l データセットを開きます。
. webuse nhanes2l
histogram
を使用して、ボディマス指数 (BMI) のヒストグラムを作成できます。
. histogram bmi
次に、グラフにタイトルを追加しましょう。コマンドを 2 行に記述するために「///」を使用していることに注意してください。 コマンドウィンドウではこれを行うことはできませんが、do ファイルで長いグラフ コマンドを記述するときに便利です。
. histogram bmi, ///
title("Histogram of body mass index (BMI)")
histogram
は密度スケールを使用して y 軸をレンダリングしますが、
頻度、分数、またはパーセントとして再スケールできます。頻度として y 軸を再スケールしてみましょう。
. histogram bmi, frequency ///
title("Histogram of body mass index (BMI)")
各バーは「ビン」と呼ばれ、Stata はビンの数を自動的に選択します。 ただし、必要に応じてビンの数を選択することもできます。以下の例では、15 個のビンを指定しています。
. histogram bmi, frequency bin(15) ///
title("Histogram of body mass index (BMI)")
ビンの数ではなく、ビンの開始値と幅を指定することも可能です。 以下の例では、開始値 10 とビン幅 2 を指定しています。
. histogram bmi, frequency start(10) width(2) ///
title("Histogram of body mass index (BMI)")
addlabel オプションを使用して、各ビンの上部にラベルを追加できます。 また、addlabopts() オプションを使用して、6 ポイントの黒のフォントでラベルを追加できます。
. histogram bmi, frequency start(10) width(2) ///
title("Histogram of body mass index (BMI)") ///
addlabel addlabopts(mlabsize(6-pt) mlabcolor(black))
ヒストグラムに正規分布を追加することもできます。 Stata は BMI の平均と標準偏差を推定し、その平均と標準偏差を含む正規分布をヒストグラムの上に重ねます。
. histogram bmi, frequency start(10) width(2) ///
title("Histogram of body mass index (BMI)") ///
addlabel addlabopts(mlabsize(6-pt) mlabcolor(black)) ///
normopts(lcolor(green) lwidth(thick))
ヒストグラムをカスタマイズするために多くのオプションが用意されており、 それらについてはマニュアルで読むことができます。
参考
さらに詳しい内容につきましては、下記のマニュアルをご覧ください。