1.使用するデータ
じゃらん『あ・ら・伊達な道の駅』
じゃらん『許田・やんばる物産センター』
伊東マリンセンター
ある程度の数が必要だったので、サンプルとして大きな道の駅を選びました。
比較として沖縄の道の駅、伊豆の道の駅のデータも取得。
他にもレビューサイトは多くあるので
多数のサイトから情報を取れれば、ある程度の数は取れると思われます。
例:
4travel.jp『青森県 道の駅』
@nifty 温泉『道の駅 いかりがせき 津軽 関の庄』
tripadvisor.jp『道の駅 しちのへ』
食べログ『 道の駅おおさと 大郷ふるさとプラザ』
2.ピポットテーブルでの解析
スクレイピングしてきたデータをエクセルに書き込みます。
行った時期が年/月/日と年/月の2種類あるのは
元データがそのようになっていたから。
本来ならレビュー投稿時間で見ていくのですが
じゃらんのサイトでは行った時期の情報もあるのでそちらを使います。
普通の観光地なら伸びるであろう5月・7月・8月が高い数値ではありません。
6月は祝日も無く梅雨なのに、最高値。
5月・7月・8月に最高値である観光地らしいグラフ分布。
マリンセンターという名前の通り、海開きのある7月・8月が高い様子。
3.「あ・ら・伊達な道の駅」形態素解析
2014年度のレビュー文を分かち書きにして、単語を数えます。
道の駅のレビューで何が多く書かれているかを見ることが出来ます。
ロイズ(洋菓子屋)・野菜の頻度が高いです。
それに続いてロイズに関連する「ソフトクリーム」「チョコレート」
野菜に関連しているであろう「地元」「新鮮」「産直」が見られます。
鳴子温泉を経由してのお客さんが多く来られるようです。
次に単語毎の係り受けを数えます。
「美味しい→お鍋」のように「品詞A→品詞B」で係り受けが成り立っています。
上位10個を抜き出しました。
ロイズが目立ちます。
次に、「車」に関連する係り受けを調べると
「車→いっぱい」「駐車場→混む」といったやや印象の悪い組合せが目立ちます。
道の駅だから仕方がないとはいえ、ユーザーからはある程度の不満が出ているようです。