1つの文書内に付与されたコード/変数の数が考慮されます。
文書Aにコードaが3個、文書Bにコードaが2個ある場合、違いとみなします。
変数値を分析に含めることもできるので、すべてのコードの頻度と変数値は事前にZ標準化されます。
1つの文書内に付与されたコード/変数の有無が考慮されます。
文書Aにコードaが3個、文書Bにコードaが2個ある場合、違いがない(どちらにもコードaがあるので同一)とみなします。コードの数は考慮されません。
文書A | |||
---|---|---|---|
存在する | 存在しない | ||
文書B | 存在する | a | b |
存在しない | c | d |
類似性の分析で複数の文書にないコードが存在する場合は、存在しないコードを無視する解析法(Jaccard)もしくは小さく評価する解析法(Kuckartz & Radiker zeta、Russel & Rao)が適しています。
上の表は、コード「祖父母」「兄弟姉妹」に関してコードマトリックス・ブラウザで作図しました。
下の図は、同じコードの生起を文書マップで分析した図です。
文書は、「両方のコードがある」「コード:祖父母のみがある」「コード:兄弟姉妹のみがある」「どちらのコードもない」の4つにグループ分けされています。
グリッド線の有無やフォントサイズなど、図のデザインを変更できます。