ツイート傾向分析調査報告:ツイートから解析する日本の現状

ポジティブ or ネガティブ?

ツイートの傾向

Twitterはユーザーが自分の思いや考えを140文字で表現できるサービスである。現実におけるつぶやきがそうであるように、誰かに向けているわけでもなく、深い思いもなく軽い気持ちで文字にすることもあるだろう。

この前提に従えば、他人の曖昧なツイートに一喜一憂することなど意味のないことである。しかし、時として誰かのツイートが自分に向けられているのではないかという意識が働くのも事実だ。今、あの人がつぶやいたネガティブなツイートは、もしかしたら自分のことを責めているのではないかなどと、被害妄想に陥る経験をしたことはないだろうか。私にはある。

そこでふと思った。

日々、膨大な数のツイートが流れていく中で、ネガティブなツイートとポジティブなツイートではどちらが多いのだろうか。

私がフォローしている人たちは、あまりネガティブなツイートはしないため、ポジティブなツイートの方が多いという印象がある。あくまで個人のツイートとは言え、世界中に公開されてしまうことを思えば、ネガティブなツイートは控えようというフィルターがかかることも一因だろう。

しかしこれはあくまで仮説である。そこで、仮説を検証するべく、約9万件のツイートを無作為に抽出し、その傾向を分析調査してみた。その結果を報告する。

調査方法について

調査期間

2010年10月25日〜2010年10月31日

調査対象者

日本のTwitter利用者のうち、無作為に抽出した10,000人。

手法

調査対象者10,000人の中から、10分間に一度150人を無作為に抽出し、対象者全員の最新のツイート1件を取得し解析した。

単純計算では1時間に900のツイートを解析することになる。ただし、データ取得後ツイートの更新がない利用者が再度抽出された場合、データが重複するため調査対象から除外することとした。

取得した対象者の最新のツイートは、あらかじめ用意しておいたポジティブキーワードとネガティブキーワードのリストを利用して判定し、データベースに記録していく。

なお、判定の基準となるキーワードリストは、言葉のイメージを元に主観で作成している。例えば、「おはー」というキーワードを含むツイートはポジティブと判定する。「死ね」というキーワードを含むツイートはネガティブと判定する。どちらのキーワードにも当てはまらないものは中立とした。

制限事項および注意

繰り返しになるが、このキーワードリストは主観で作ったものであり、他の人から見た場合は別の判定になる可能性がある。さらに「おはー」であっても「死ね」であっても、たまたまツイートに含まれていただけで、全文を読んだ場合には逆の意味になっていることもある。しかし今回は、ツイート全体の意味解析といった高度な技術は導入しておらず、あくまでキーワードマッチのみでの判定をしている。

念のためお断りしておくが、対象者のツイートは保存していない。もちろん、アカウント名も保存していない。保存しているのはポジティブかネガティブか中立かの結果のみである。

調査結果

全体:8割がポジティブツイート

まず結果からお伝えしよう。集計されたツイートの総計は92,436。

その内、ポジティブと判定されたツイートは約30,000余り。ネガティブと判定されたツイートは、約8,000余りという結果になった。

つまり、全ツイートの内の約41%がポジティブまたはネガティブと判定されたということになる。

判定されたツイートの内、ポジティブは79%、ネガティブは21%という結果になった。

つまり圧倒的にポジティブなツイートの方が多いということになる。

ポジティブ or ネガティブ? (クリックすると拡大します)

ポジティブ or ネガティブ? (クリックすると拡大します)

時間による推移

ポジティブ

まずは以下のグラフを見ていただきたい。

ポジティブなツイートの時間による推移を表したものである。

時間による推移 - ポジティブ(クリックすると拡大します)

時間による推移 - ポジティブ(クリックすると拡大します)

ポジティブなツイートは8:00、13:00、15:00、20:00をピークとしている。これはそれぞれ出勤前、お昼休み、終業のタイミングと想定できる。出勤前は別として、休み時間や終業時につぶやく人たちは総じて開放感からつぶやいている可能性が高い。そして、出勤前は「おはー」というような挨拶が多くなるため、ポジティブと判定されることになる。こうしてツイートするシチュエーションを考えてみると、これらのタイミングでポジティブなツイートが多くなるのもうなずける。

ネガティブ

次に、ネガティブなツイートを見てみよう。

時間による推移 - ネガティブ(クリックすると拡大します)

時間による推移 - ネガティブ(クリックすると拡大します)

こちらもポジティブなツイートと同様、出勤前、お昼休みのツイートが多くなっているが、終業時と思われる17:00から19:00を境に上昇傾向が見られ、21:00まで続いている。

午前と午後を比較すると、午前のほうが圧倒的にネガティブなツイートが多くなっている。平均的な起床時間である7:00から平均的な出勤時刻である9:00にかけて上昇し、いったん10:00で下がり、11:00に再度上昇するという傾向がある。

一般的な会社を想定してみると、10:00は出勤直後で忙しくツイートしている暇がない。そして昼食前は血糖値が下がりイライラすることが増え、ネガティブなツイートをする人が増えるのかもしれない。私も以前会社勤めをしていたときに、上司がよくその時間に怒っていたことを思い出した。何を怒っていたのかは定かではない。皆さんの周りではいかがだろうか?

両者の比較

以下の図はポジティブなツイートとネガティブなツイートを重ね合わせたものだ。

両者の比較(クリックすると拡大します)

両者の比較(クリックすると拡大します)

ポジティブなツイートとネガティブのツイートの間の絶対数に違いはあるにせよ、大まかに増加/減少が同じように推移しているのが分かる。ただし、15:00、21:00の時点が大きく異なっている。15:00の時点ではポジティブは増加し、ネガティブが減少、21:00の時点では逆にポジティブが急速に減少し、ネガティブの増加が夕方以降でのピークを示している。

今回取得したのは判定結果のみであり実際のツイートは取得していないため、それぞれのツイート内容までは解析できないが、21:00という時間は人をネガティブに向かわせる時間帯なのかもしれない。

想像するのは、会社が終わり同僚と楽しく飲みに行った後、みんなと別れて混んだ電車に乗り込み、一人携帯を開く会社員である。そして、まだ社内でサービス残業をしながらツイートするサラリーマンである。家族が終えた夕食の片付けをする主婦の姿である。

21:00というのは一日の疲れがピークに達する時間なのかもしれない。

まとめ

そもそもツイートというのは、リアルタイムの感情を表していると考えていたが、リアルタイムではなく、つぶやける時間帯にまとめてツイートするユーザーが多いことがわかる。つまり、一般的な日本人のツイートできるタイミングは、休み時間や終業時間にあたり、その時にどう感じているかが可視化されているだけなのかもしれない。

上記のことから、ツイートできる時間帯、ツイートできない時間帯が存在しているとしたら、Twitterを使ってユーザー全体のリアルタイムの感情を取得し、分析するということはまだ難しいのかもしれない。しかし、少なくともTwitterの登場によって、人の感情がわずかではあるが取得できるようになったのはまぎれもない事実である。

この結果を見るまでは、特に根拠も無くポジティブなツイートな方が多いと漠然と思っていたが、精度の問題はあるにせよ、実際にこのようにポジティブが多いという結果になった。ニュースなどでは日本の不景気や閉塞感が取りざたされるが、まだまだ日本は大丈夫ではないだろうか。ツイートがネガティブで埋まった時こそ、日本の危機なのかもしれない。

なお、この解析ツールは近日Social Media Experience内で公開する予定である。

関連記事


この記事にコメントをどうぞ

Social Media Experience
記事提供
運営会社