ツイートは視聴率になりうるか?

「1週間に1回はブログに投稿する」
といってから、1ヶ月が経ちました。
あまりに更新しないと、Googleさんに順位を落とされそうで怖いです。

それはともかく
視聴率を図っているビデオリサーチ社さんが
Twitter TV エコー というものをやっています。
テレビ番組のネットでの評価をTwitterへの投稿文から読み解こうという解析方法みたいです。
以前、NHKでもやっていました。

それの真似事をしてみたくなったので、少し手を出してみます。

1.使用するデータ

Twitter APIで検索した過去ツイート文。
ビデオリサーチ社では独自のキーワード設定(おそらくツイート文で頻度の高い単語)を使っていますが、
今回はハッシュタグのみで検索していきます。

調べる番組(検索するハッシュタグ)は
・相棒(#aibou #相棒)
・ウロボロス(#ウロボロス #ウラバラス)
・Doctors(#DOCTORS_tvasahi #ドクターズ)
・銭の戦争(#銭の戦争)
・仮面ライダードライブ(#仮面ライダードライブ)

の5つになります。
選考基準は自分が見ている番組。それだけです。

2.ツイート数の推移

①日別推移
日別の取得できたツイート数の表・グラフ。
TwitterAPIは過去8日までしか取得できませんので、2/8以降は0件になります。
仮面ライダードライブは別件で収集していたので2/6までは取得できています。

黄色く塗っている部分が放送日。どの番組も放送日が件数が最も多くなります。
Doctorsが心配になるぐらいツイート数が少ない・・・内容も視聴率も悪くないんですけどね。
銭の戦争は放送日以外も多くのツイートが行われています。
調べてみると「劇中で出演者が使用したものと同モデルの~」といった広告文が多数ありました。

②放送時間前後のグラフ
放送時間とその前後30分のツイート数の推移をグラフ化します。
リツートと通常ツイートを分けてカウントしています。
「番組中の面白い表現・言い回し」「内容についてのツッコミ」がリツイートされることが多いので
リツイートは番組終了後も件数を伸ばしているのが分かります。





3.KHcoder 共起ネットワーク

どのようなことが話題になったかを共起ネットワークで示します。
相棒・ウロボロスは、先週分は視聴済みなので、この2作品を解析します。
なおリツイート文を含めると結果が偏るため、リツイート文は除いて処理しました。

①相棒
今回の作品は前後編で
「人をなぜ殺してはいけないのか?」と悩む鮎川教授が
杉下右京・社美彌子(仲間由紀恵)ら東大法学部のゼミ卒業生を地下室に監禁する話でした。
甲斐享の彼女の悦子が妊娠したということで
甲斐享が特捜係を卒業(または殉職)するのでは?
と話題になった回でした。

バッチリ結果は出てますね。
雄叫びや反応(「えぇ~」「おぉぉおお」「キタ━(゚∀゚)━!」)なども上手く分類できました。

②ウロボロス
この週の作品は、ウラバラスという副音声付き放送を行っています。
出演者が撮影の裏話・雑談を交えながら解説していくのですが・・・それ関係のツイートが殆どですね。
#ウロボロスのみで検索すれば、本編に関するツイートが多めに取得できたかもしれません。

副音声で話されたネタである
・段野竜哉(小栗旬)が片足を撃たれ、逃げていくシーンで「鬼ケンケン」
・過去編の子役の体重管理が上手く行かず「顔がパンパン」になった
・劇中の挿入歌(シリアス・感動の場面で流れる)を「ナマスフォン」と命名し合唱
などが大部分を占めています。

「ドラマ」「内容」「全く」「(頭に)入らない」というのは事実でしょう。
作品の内容に関するものは「先生」「公安」ぐらいですし。

 

4.今後どうするか

番組によって盛り上がる時間が違っているので、どの場面で盛り上がったのかを
ツイート文をテキストマイニングして解析できれば良いと思います。ネガポジ判定とかも含めて。
ビデオリサーチ社だと性別・年齢・居住地も解析しているようです。
居住地はプロフィールに書いてあれば取り出せますね。
性別はベイズ学習で振り分けるとしても…年代ってどうやってツイート文で判断するんでしょうか?
フォローとフォロワーである程度の判別も出来そうな気はしますけど・・・。