Mecab辞書の追加作業、クチコミサイト解析を頑張ってます。
文字コード問題にぶつかるたびに、英語圏に生まれたかったと嘆いています。
波ダッシュと全角チルダ、もう少し仲良くなって欲しいです。
そんな悩みを忘れるために、今回は(かなり)個人的な投稿です。
宇宙世紀ガンダムシリーズ
アナザーガンダムシリーズ
で使用されている曲の形態素解析です。
くだらないとか怒らないで下さい。
一週間に一度、投稿するのを目標にしているので。
ガンダムなんて知らない…という方は多いです。
簡単に説明すると、
宇宙世紀ガンダムというのは、皆さんお馴染み(?)「アムロ」と「シャア」が戦っている世界の話です。
1st→Z→ZZ と宇宙世紀で時系列が続いているものですね。VとターンAも入れています。
アナザーガンダムというのは、舞台が宇宙世紀ではないものです。
平成から始まったガンダムがほとんどコレです。
きっと知らない人はチンプンカンプンだと思うので、
昭和に作られた作品(宇宙世紀ガンダム)
平成に作られた作品(アナザーガンダム)と考えれば大体OKだと思います。
「エンターテイメント性は高いけど、物語が・・・」と言われ気味のアナザーガンダムですが
作品のイメージともいえるOP・EDではどうなのか?という疑問。
では本題。
今回は
アニメソングの歌詞ならここにおまかせ? – ZAQ
http://www.jtw.zaq.ne.jp/animesong/
から歌詞を収集させていただきました。OP・ED・劇中歌・キャラソン、区別なく分析しています。
出てくる単語の回数を曲数で割った数が表の数値です。
一つの曲で「名詞-一般」「名詞-代名詞」の言葉が平均何回出てくるかを示しています。
宇宙世紀(51曲) アナザー(107曲)
君 the 人 you to あなた 夢 心 誰 愛 a 星 胸 t 僕 my 宇宙 何 風 love |
1.235 1.020 0.980 0.784 0.745 0.745 0.725 0.647 0.608 0.569 0.549 0.549 0.510 0.490 0.490 0.471 0.431 0.412 0.392 0.392 |
君 夢 心 胸 I 手 僕 愛 光 誰 空 YOU 未来 僕ら 想い 世界 場所 それ 声 風 |
1.589 0.897 0.804 0.673 0.664 0.664 0.645 0.617 0.579 0.579 0.561 0.551 0.495 0.411 0.402 0.393 0.383 0.364 0.336 0.308 |
思っていたより似ている…。
宇宙世紀に「宇宙」があるのが救いです。
宇宙世紀のほうは英語が所々に出てきますね。
the,you,love…分かりやすい英単語ですけど。
(英語歌詞の多い0083シリーズが入っている影響?)
アナザーは基本的に鬱展開が少なめなので、
歌詞にも「僕ら・未来・光」といったプラス指向の単語が入っているのは納得できます。
どちらも、「君・夢・心・愛・胸」が使われることが多いようです。
ガンダムの歌詞を作りたい場合はこのフレーズを入れるとそれっぽくなるのかもしれません。
反省点
・曲によっては同じフレーズを何度も繰り返す
例:ガンダムZZのOP「アニメじゃない-夢を忘れた古い地球人よ-」では
「アニメじゃない」のフレーズが10回も…。
・リピート部分の処理
歌詞のリピート部分はカットして分析しています。
ちなみに前述のガンダムZZのOP、リピート部分も含めると
「アニメじゃない」を26回繰り返します。
・短い英単語の処理
現在の辞書だと、at・as・in といった短い英単語を
区切って解析してしまうようです。
情報を吟味して、
自然言語処理をもっと勉強しないと…綺麗な結果は出ませんね。