グラフ
ヒストグラム作成

地域ごとにサブグラフを作成
by()
でカテゴリを指定し、階級でグラフを分割できます

散布図
標本のサブグループを使用するには、if
条件を追加し、カテゴリ・文字列変数の要素で指定します。

散布図をオーバーレイ
コマンドを並べるだけで、グラフをオーバーレイできます

作成したグラフは、グラフエディタで簡単に編集できます
グラフ(Python)
ヒストグラム作成
print(df.hist(column="summerday"))

地域ごとにサブグラフを作成
matplotlibでは日本語文字が扱えないので、ラテン文字に置き換える必要があります
import seaborn as sns
def categorize(city):
if city == "根室":
return 'nemuro'
elif city == "東京":
return 'tokyo'
elif city == "新潟":
return "niigata"
else:
return 'naha'
df['ccode'] = df['city'].apply(categorize)
df["ccode"] = df["ccode"].astype("category")
print(df.hist(by="ccode", column="summerday"))

散布図
サブサンプルでグラフを作成するには、データフレームを新たに作成することになります
df2 = df[df["city"] == "根室"]
print(sns.scatterplot(data = df2, x = "summerday", y = "temp_mean", edgecolor = "none"))

散布図をオーバーレイ
print(sns.scatterplot(data = df.where((df["city"] == "那覇") | (df["city"] == "東京") ), x = "summerday", y = "temp_mean", edgecolor = "none", hue = "ccode", style ="ccode"))

推定/診断/予測(Python)
線形回帰
from statsmodels.formula.api import ols
model1 = ols(formula="temp_mean ~ rainfall", data=df).fit()
print(model1.summary())

カテゴリ変数を説明変数に追加
model2 = ols(formula="temp_mean ~ rainfall + C(city)", data=df).fit()
print(mod2.summary())

不均一分散の診断
from statsmodels.stats.api import het_breuschpagan
print(het_breuschpagan(model2.resid, model2.model.exog))

予測
yhat = model2.predict
Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.