ツイートの分析は、分析タブからTwitter > ツイートを分析すると操作して、専用のダイアログにアクセスできます。
ツイートを分析する専用のダイアログが表示されます。ダイアログでは、読み込んだツイートが表形式で表示され、アカウント名、ツイートした日時、ツイートのタイプ、ツイート本文、リツイートの数、お気に入りの数およびフォロワー数を確認できます。
関連ページTwitterデータの分析
感情分析の結果が表示されます。緑丸アイコンの●単語列はツイートに含まれるポジティブな単語の数、赤丸アイコンの●単語列はネガティブな単語の数です。これらの差が違い列に表示されます。感情列はこの差異を評価して決定されます。
分析したツイートはツイートタイプや感情のスコアでフィルタリングできます。画面左側のチェックボックスにチェックを入れて表示するツイートをフィルタリングしましょう。
Twitter感情分析ツールの感情スコア辞書は、SentiWordNet 3.0をベースにしています。SentiWordNet 3.0とは、単語または連語ごとにポジティブスコアとネガティブスコアを記述したリストです。
MAXQDAでは、SentiWordNet 3.0を元に下記の点をカスタマイズしています。
感情分析に使われる辞書は、下記のLemmatizationフォルダにインストールされています。
SentimentScoreフォルダには、Twitter分析に使用される下記のファイルが入っています。
Resources\Lemmatizationフォルダには、Twitterの感情分析や単語検索などに使用する見出し語リストが含まれます。
※見出し語化(lemmatization)とは、単語の原形を推定する処理です。例えば、この処理によってlookとlookingを同一の単語として扱えるようになります。
SentiWordNet 3.0に絵文字やSNS用語を追加した感情スコア辞書です。単語または連語ごとに、分類(形容詞、動詞、絵文字など)、ポジティブスコア、ネガティブスコア、トータルスコア(ポジティブスコアとネガティブスコアの合計)が記載されています。
ポジティブスコアは正、ネガティブスコアは負の値です。トータルスコアが大きいほどポジティブ度合いが強く、ゼロに使いとニュートラル、負の値になるとネガティブとなります。
感情分析機能ツールは、下記のプロセスで感情スコアを算出します。
感情の自動コーディングは、手作業で行う場合と比較して、60-70%の正解率と報告されています。手作業の場合も、分析者によって評価が異なることを考慮する必要があります。
感情分析の質はいくつかの要因に左右されますが、特にトピックスに対して感情スコア辞書がフィットするかどうかが大きく影響します。感情分析は、感情が全く表現されていないツイートに対してはほとんど意味のないことに注意してください。
例:「生活満足度についての統計はこちら→URL」という情報のみのツイートについて、「満足」がポジティブと判定されてしまうケース