クラスター分析

クラスター分析は、標本のデータ内で似ている物同士でグループ(クラスタ)を作成しデータを分類する手法です。 教師なしデータ(学習なしデータ)でデータを大きくグループ分けしたい場合に有効です。

階層的クラスタリング

  • 単連結法
  • 完全連結法
  • 平均連結法
  • Ward 連結法
  • 加重平均連結法
  • 重心連結法
  • メディアン連結法

非階層型

  • Kmeans
  • Kmedians

観測値上のクラスター

近接行列を用いたクラスター

樹形図

  • フルツリー
  • サブツリー
  • ツリーの上部
  • 垂直方向、水平方向
  • ブランチ数

停止基準

  • Calínski and Harabasz の擬似-F指標
  • Duda and Hart Je(2)/Je(1) 指標

サポートツール

  • サマリ変数とグルーピング変数の生成
  • 分析への注釈の付加

連続データ用類似度/非類似度

  • L2/ユークリッド
  • L1/absolute/cityblock/manhattan
  • L(#)
  • キャンベラ
  • 相関
  • 角度

2値データ用類似度/非類似度

  • Matching
  • Jaccard
  • Russell
  • Hamann
  • Dice
  • Antidice
  • Sneath
  • Rogers
  • Ochiai
  • Yule
  • Anderberg
  • Kulczynski
  • Gower2
  • Pearson

2値/連続混合データ用Gower尺度

結果管理用ユーティリティ

  • ディレクトリ形式一覧
  • クラスターの詳細一覧
  • クラスター分析の削除
  • 直近のクラスター分析をマーク
  • クラスターの名前変更

ユーザ拡張コマンド

  • 新規クラスタリング手法、ユティリティの追加
  • 各種支援ツール

例題集

下記の機能の操作方法を解説した日本語の例題集をご用意しております。

  • 連続値のデータを用いて、cluster kmeansコマンドを実行
  • 二値データを用いて、cluster kmediansコマンドを実行

詳細資料

詳細は、開発元StataCorp.の機能紹介ページにあるマニュアルをご覧ください。

Stata is a registered trademark of StataCorp LLC, College Station, TX, USA, and the Stata logo is used with the permission of StataCorp.

page_top_icon