文書マップ

類似度によって文書をグループ分けし、図にします。

文書マップ

icon コードの交差: 6つのコードの出現頻度によって10文書を4つのグループに分けています。


作図の手順

  • 図解ツールタブの「文書マップ」から作図を始めます
  • 分析のタイプには、頻度と生起があります
  • グループ分けの因子として、コードの数と文書変数を設定することができます
  1. 「図解ツール」タブから「文書マップ」を選択します。
  2. 開始タブで「文書を選択する」から分析対象の文書を設定します。
    iconをクリックするとアクティブ化されている文書を一括指定できます。
  3. 「コードを選択する」から分析対象のコードを設定します。または、「変数を選択する」から変数を設定します。コードと変数の両方を設定することもできます。
  4. 分析のタイプを選択します。
    分析方法

分析のタイプ

  • 「頻度」は因子の数が考慮されます
  • 「生起」は因子の有無のみが考慮されます

コード/変数値の頻度

1つの文書内に付与されたコード/変数の数が考慮されます。
icon 文書Aにコードaが3個、文書Bにコードaが2個ある場合、違いとみなします。

頻度の類似度の計算式

  • ユークリッド距離の二乗=偏差の二乗和
    偏差が二乗されるため、偏差が大きい程低いものとして評価されます。
  • ブロックの間隔=絶対偏差の合計

変数値を分析に含めることもできるので、すべてのコードの頻度と変数値は事前にZ標準化されます。


コード/変数値の生起

1つの文書内に付与されたコード/変数の有無が考慮されます。
icon 文書Aにコードaが3個、文書Bにコードaが2個ある場合、違いがない(どちらにもコードaがあるので同一)とみなします。コードの数は考慮されません。

生起オプションの類似度の計算式

文書A
存在する存在しない
文書B存在するab
存在しないcd
  • a: 両方の文書に存在するコードの数
  • b: 文書Bにのみ存在するコードの数
  • c: 文書Aにのみ存在するコードの数
  • d: どちらの文書にも存在しないコードの数
  • Simple match = (a + d) / (a + b + c + d)
    両方に存在する・しないの両方が一致と計数されます。
  • Jaccard = a / (a + b + c)
    どちらにも存在しない場合は完全に無視されます。
  • Kuckartz & Radiker zeta = (2a + d) / (2a + b + c + d)
    両方に存在するが2回計数され、どちらにも存在しないが1回計数されます。
  • Russel & Rao = a / (a + b + c + d)
    両方に存在するのみが一致とされますが、どちらにも存在しないと類似性が低下します。

ワンポイントアドバイス

類似性の分析で複数の文書にないコードが存在する場合は、存在しないコードを無視する解析法(Jaccard)もしくは小さく評価する解析法(Kuckartz & Radiker zeta、Russel & Rao)が適しています。

分析結果の確認

  • マウス操作でデータの詳細を確認したり、図のデザインを変更できます
  • フォーマットタブからクラスター数を設定できます
  • フォーマットタブからトポロジテーブルを作成できます

便利なマウス操作

  • プロットにマウスカーソルを重ねる: 詳細が表示されます
  • プロットをダブルクリックする: 該当文書が文書ブラウザウィンドウに表示されます
  • プロットを右クリックする: 「このクラスター内の文書をアクティブ化する」機能が使えます

分析の例

分析結果

icon 上の表は、コード「祖父母」「兄弟姉妹」に関してコードマトリックス・ブラウザで作図しました。
下の図は、同じコードの生起を文書マップで分析した図です。
文書は、「両方のコードがある」「コード:祖父母のみがある」「コード:兄弟姉妹のみがある」「どちらのコードもない」の4つにグループ分けされています。


フォーマットタブ

グリッド線の有無やフォントサイズなど、図のデザインを変更できます。

ワンポイントアドバイス

クラスター数からクラスター数を設定できます。
トポロジテーブルをクリックすると、解析結果を表形式で確認できます。

トポロジーテーブル

icon クラスター1に含まれる文書数(N)は「7」、コード「兄弟姉妹」は7文書中に「2」個あります。

page_top_icon