ガチ初心者が1から競馬指数を作ってみた【第2話】
前回のあらすじ
金欠により生命の危機を感じた競馬犬ミケルは犬並みの知能を駆使し、ついに禁断の競馬指数開発に着手…!
果たしてミケルの運命は…!
早速やってみよう
前回の発言の通りに、まずは大阪杯のデータを使って競馬指数を作っていくよ。
最初の目標は「2022年の大阪杯を当てること」にしましょう!!
(これがどんなにむずかしいことであるのかこの時のミケルは予想だにしなかった…。)
前話でも書いたけど、とりあえず前5走の成績を説明変数、実際のレースの成績を被説明変数として重回帰分析してみた。まずは2021年のデータだけでやってみる。
|
係数 |
標準誤差 |
t |
P-値 |
下限 95% |
上限 95% |
下限 95.0% |
上限 95.0% |
|
切片 |
-3.41653 |
1.655596 |
-2.06362 |
0.077947 |
-7.33139 |
0.498333 |
-7.33139 |
0.498333 |
|
1走前 |
0.879814 |
0.343193 |
2.563614 |
0.037354 |
0.068292 |
1.691337 |
0.068292 |
1.691337 |
|
2走前 |
0.501933 |
0.217245 |
2.31045 |
0.054151 |
-0.01177 |
1.015635 |
-0.01177 |
1.015635 |
|
3走前 |
-0.70137 |
0.575763 |
-1.21815 |
0.262627 |
-2.06283 |
0.660098 |
-2.06283 |
0.660098 |
|
4走前 |
0.333214 |
1.015638 |
0.328084 |
0.752444 |
-2.06839 |
2.734817 |
-2.06839 |
2.734817 |
|
5走前 |
0.840212 |
0.674915 |
1.244916 |
0.253222 |
-0.75571 |
2.436132 |
-0.75571 |
2.436132 |
はい、めちゃくちゃです。(自明)
一番左の「係数」ってやつが、各変数(前5走の成績)がどれだけ説明力がある(実際のレース結果を示唆する)のかを表してます。係数は-1から1の値で、1に近いほど説明力があります。そして逆に-1に近いほど負の関係にあることを示しています。(成績がいいほど悪くなる。)
そして係数を見てみるとかなりぐちゃぐちゃです。特に3走前なんて負に相関しています。3走前が良ければ良いほど本番の成績が悪いことになっています。
P値も見てみても、やはりこの結果は統計的に有意であるとはいえなさそうです。
(P値は結果が統計的に正しいかどうかを示しています。状況によりますが0.05以下であれば統計的に有意といえます。)
原因は明白です。データが少ない!
もっとデータを入れないとクレイジーな結果になることは避けられません。
なので次は6年分の大阪杯のデータを入れてみましょう。
6年分のデータで仕切り直し
するとこんな感じになりました。
|
係数 |
標準誤差 |
t |
P-値 |
下限 95% |
上限 95% |
下限 95.0% |
上限 95.0% |
切片 |
-0.86794 |
0.594388 |
-1.46023 |
0.148459 |
-2.05229 |
0.3164 |
-2.05229 |
0.3164 |
1走前 |
0.761365 |
0.134682 |
5.653066 |
2.79E-07 |
0.493006 |
1.029724 |
0.493006 |
1.029724 |
2走前 |
0.241108 |
0.10878 |
2.216468 |
0.029733 |
0.024359 |
0.457858 |
0.024359 |
0.457858 |
3走前 |
-0.07119 |
0.127466 |
-0.55852 |
0.578177 |
-0.32517 |
0.182789 |
-0.32517 |
0.182789 |
4走前 |
-0.05771 |
0.126653 |
-0.45563 |
0.649988 |
-0.31007 |
0.194654 |
-0.31007 |
0.194654 |
5走前 |
0.277741 |
0.144446 |
1.922793 |
0.058354 |
-0.01008 |
0.565557 |
-0.01008 |
0.565557 |
だいぶマシになってきましたね。相変わらず3走前と4走前が負の相関を示していますが、1走前、2走前、3走前と次第に係数が小さくなっているのは直観に沿う形になってきました。
しかしあいかわらず5走前の成績の係数は謎に高いままです。なんででしょうね…笑。
いろいろツッコミどころはありますが、これでとりあえず競馬指数は作れそうです。
ついに競馬指数が完成!その名も「ミケル指数」
とりあえず式が完成したので、これを競馬指数のプロトタイプとすることにします!
ちゃんとした形は以下の感じですね。
ミケル指数=0.761365(1走前)+0.241108(2走前)+(-0.07119)(3走前)+(-0.05771)(5走前)
この完成した競馬指数、名付けて…「ミケル指数」!!
そして第3回ではこの完成したミケル指数を使って2022年の大阪杯を大予想してみようと思います…!乞うご期待…!
感想をコメントしてくれるとうれしいです!
次回もぜひ読んでね!