前回のデータと、ユーザー情報を照会するAPIを使ってグラフを作成していきます。
1.使用したデータ
・2014/12/02 10:00の時点で各政党をフォローしていたユーザーのID
・2014/12/03 10:00の時点で各政党をフォローしていたユーザーのID
APIで処理していく都合上、10:00~11:00の間で情報を取得しているため
数件のズレが出ている可能性が考えられます。
2.フォロワー数の増減
まずはフォロワー数の増減から
次世代の党が抜きでて、フォロワーの数を増加させています。
幸福実現党・維新の党が次に続いています。
前のグラフとやや似た形になりました。
フォロワーが増えやすいと減りやすいという流れなのでしょうか。
民主党と公明党が流出を抑えられるのか…が今後の観察すべきポイント?
3.ユーザーのTwitter開始時期
次は、14/12/02~14/12/03の間で新たに各政党をフォローしたユーザーのIDが
いつ頃Twitterを開始したのかを調べていきます。
見辛い…グラフの勉強の成果が出るのは来年にご期待下さい。
やはり2014/12作成のアカウントが一番多いです。次点が2014/11。
解散・選挙と同時期に作られた若干怪しいアカウントになりますね。
民主党も同じ様子。
3月作成のアカウントが多いのは、新学期に備えてのTwitterデビューでしょうか?
『フォロワーの登録数が他より多い』という違いはありますが、
2014/11・2014/12以外にも、1~5月に凸の部分がありますね。
2010年度に作成のアカウントが多いのも何か理由があるのでしょうか・・・。
今年の11月・12月が目立つ型です。
維新の党と同じ様子の、多くの凸が見られます。
2014年度のアカウントが多いのは、2014年に設立した党だから?
今年の11月・12月が多いです。
2014年度のアカウントの割合が高いです。
数が少ないので、ちょっとした数字の大小でグラフが大きく変化してしまいます。
それでも11月・12月は多いですね。
最大が3なので…何とも言えません。
やはり11月・12月が目立ちます。
全体的に2014年度のアカウントが高い値ですが、
バラついている印象です。2014年11月・12月が多くない珍しいパターン。
4.相関係数
統計学でお馴染み相関係数。
『気温とビールの売上(正の相関関係)』
『気温とおでんの売上(負の相関関係)』
といった、片方が変化すればもう一方も変化するであろう事象の関連性を見る数値です。
-1~+1の間で表され、絶対値で
0.7>なら強い相関関係
0.4-0.7なら中間の強さ
0.2-0.4なら弱く
0.2<なら相関関係は無いと考えます。
また、数値がプラスなら正の相関関係(正比例)、マイナスなら負の相関関係(反比例)となります。
詳しくはwikipediaとか見て下さい。
各政党の新規フォロワーの
ツイート数・フォロー数・フォロワー数を調べて、相関係数を計算します。
・フォロワー数とツイート数
頻繁に発言をしている・有意義な発言をしていれば、フォロワー数は増えると考えられるので
そのようなユーザーが多いと正の相関関係になると考えられます。
発言はせずに相互フォローなどでフォロワー数を増やす、
ひたすら発言を繰り返すといったユーザーが多くいると、相関係数は0に近づくと思われます。
維新の党が0.84と強い相関係数を示しています。
自民党・民主党・公明党といった大きな政党もある程度の強さの相関係数となっています。
・フォロー数とツイート数
Twitter本来の使い方をすればこれも正の相関関係になると考えられます。
著名人・フォローをあまりしない人は、ツイート数は多いがフォロー数は少ない状態になるので
相関係数が低くなる要因になります。
またツイート(発言)をせずに、フォローのみを行っている人がいる場合も
相関係数が低くなると考えられます。
これも自民党・民主党・維新の党・公明党がそこそこの値になりました。
自民党が他の3党と比べると低い値です。
・フォロー数とフォロワー数
これも基本的な使い方では正の相関関係になると考えられます。
例外としては、
・芸能人の様にフォロワー数は多いがフォロー数が少ないユーザー
・何らかの理由でフォロー数は多いがフォロワーは少ないユーザー
このようなユーザーがいる場合、相関係数が低くなると思われます。
ほとんどの政党が1に近い数値となり強い相関関係を示しています。
維新の党がやや弱い数値となりました。
なぜか新党改革だけ相関関係が無いといった結果に・・・。
Twitterの使い方が人によって様々です。
長期間使っているユーザーだとツイート数だけが多くなりますし、
有名人だとフォロワー数が突出した数値になります。
よって相関関係が少ない≒変なアカウントが多いということにはなりません。
むしろ、ユーザーの方向性がどれだけ整っているかの指標になるように思われます。
Twitterの使い方が同じ傾向のユーザーが多ければ、相関係数も増加すると考えられます。