何が原因で数値が上下しているのか?
を知りたいときは、相関係数などを用いた回帰分析を行います。
今回は、家賃はどのような要因で決定されるかを調べてみたいと思います。
0.使用するデータ
不動産サイトから収集した横浜市泉区内の賃貸物件データ。1554件。
家賃・管理費・敷金・礼金・面積・築年数・徒歩・バス・移動合計の数値になります。
駅から徒歩で行ける物件、駅からバスに乗り更に歩いて行く物件があったので、
「徒歩」「バス」「移動合計」という分け方になっています。
例えば、
・駅から8分の物件
徒歩:8分 バス:0分 移動合計:8分
・駅からバスで6分更に歩いて10分の物件
徒歩:6分 バス:10分 移動合計16分
になります。
・データ例
1.散布図
まずは目で見て分かる図の描画。
RとかNumpyでサラサラできるとカッコいいですよね。
不得手なのでエクセルでやりますけど。
・家賃と管理費
微妙にプラスの相関係数を持っていそうです。
グラフが右肩上がりになっています。
・家賃と敷金
綺麗な分布になりました。
3種類に分かれているので相関係数は低くなりそうですけど。
今回は無視した「不動産管理会社」や「マンション」、「アパート」といった物件の条件差でしょうかね。
・家賃と礼金
敷金と同じような分布になりました。
家賃の何割というのが何らかの条件で決められているのでしょうか?
・家賃と面積
相関係数が高そうな分布です。
賃貸ということもあって80㎡以上になると物件数が少なくなるのが分かります。
・家賃と築年数
グラフは右肩下がり、マイナスの相関係数を持っていると考えられます。
常識的にも古い物件のほうが家賃は安いですからね。
・家賃と徒歩
微妙に・・・マイナスの相関係数?
読み取れないです。
・家賃とバス
読み取れません。0分(バスを使わない)が多いですね。
・家賃と移動合計
マイナスの相関係数を持っていそうです。
2.相関係数
R(相関係数)は-1<=R<=1で表されます。
0に近ければ関係が低く、0から遠くなるほど関係が高くなります。
散布図では読み取れないものもあったので、計算した結果がコチラ。
やはり家賃と面積の相関係数が高いですね。0.83です。
家賃と敷金、家賃と礼金もそこそこの数値です。
マイナスの相関係数を持っているのが、家賃と築年数・家賃と移動時間系。
古い物件・遠い物件は家賃が低くなるのが分かります。
「相関があるかを見つける簡便法」
http://www.orsj.or.jp/~archive/pdf/bul/Vol.42_07_493.pdf
によると、r^2>4/(n+2)
が成り立てば、相関があると見なせるらしいですが・・・。
今回のn(データ数)は1554。
4/(1554+2)=0.002
かなり小さい相関係数でもありになってしまいますね。
論文の例を見ると100件程度のデータの時に用いたほうが良さそうです。
3.回帰分析
回帰分析を行って、各要素が家賃にどれだけ影響をあたえるのかを数式化します。
Yを家賃、Xを各要素にして回帰分析を行いました。
バスと移動合計のP-値(値が高いほど説明変数として不適切)が#NUM!になっています。
バスの数値で0分の頻度が非常に多かった(バスを使わず徒歩だけで行ける物件が多かった)ので
エラーを起こしたみたいですね。
バス・徒歩を説明変数から削除して再計算を行います。
管理費のP-値が0.01あるのが気になりますが…見なかったことにしましょう。
とりあえず回帰分析をすることができました。
あとは係数の数値を使って家賃の計算式をもとめることができます。
横浜市泉区の家賃は
家賃=39,157+0.3*管理費+0.07*敷金+940*面積-563*築年数-667*移動合計
と計算できるわけです。
色々突っ込みどころがありますけど・・・。
親の家に同居している自分は、どのくらいの家賃を払うべきか・・・計算してみましょう。
管理費:0円、敷金:0円、面積:10㎡(自室のみ)、築年数:14年、移動合計:6分
家賃=39,157+0.3*0+0.07*0+940*10-563*14-667*6
=36,673(円)
地味にリアルな数字が出ました。これぐらい払ってます。
4.まとめ
大量のデータから家賃と相関関係を持つ要素を見つけることが出来ました。
物件の面積が家賃を決定づける大きな要因でした。
築年数・移動時間はマイナスの相関関係を持っています。
・・・書いていてなんですけど「常識的な結果」しか出ませんでしたね。
敷金・礼金を家賃(Y)の説明係数として設定したのはミスかもしれません。
普通は、家賃を決めてから敷金・礼金を決めるので
敷金(Y)=a*家賃(X)
のほうが正しいと思われます。
今回は物件の種類(アパート・マンション・借家)、管理会社の区別はしなかったため
回帰分析でもとめた計算式が当てはまらない物件も多く見られました。
いつか、定性的データ(文字)を定量的データ(数値)に置き換えての回帰分析を行いたいです。