ガチ初心者が1から競馬指数を作ってみた。【第4話】
前回のあらすじ
才能の片鱗を見せるもデータ不足から力及ばず敗北したミケル指数…!
もはやここまでと思いきや、競馬犬ミケルにより15年分のデータを注ぎ込まれ、戦いは更なる局面へと展開する…!!
早速データを入れたよ
こんにちは、ミケルです。
今回も競馬指数作りを進めていきます。
前回は6年分のデータを使って2015の大阪杯を予想し、微妙な感じに終わりました笑。
まだ読んでなかったらここから飛べるのでぜひ読んでね。
keibadogmichael.hatenablog.com
微妙な感じで終わるのは不服なので、今度は15年分のデータを入れてモデルを再築して、もう一度予想してみます。
はい、いきなりですが15年分のデータを入れた際の式がこちらになります笑。
(サラッと書きましたが15年分のデータを入れるのは本当に骨の折れる作業でした…。)
ミケル指数=0.409577(1走前)+0.057721(2走前)+(-0.00103)(3走前)+0.039476(4走前)+0.150498(5走前)
ここで1つ注目してほしいポイントがあります。各項の係数を見てください。
各項の説明力を100倍して百分率で表すと1走前の成績が約40%、2走前の成績が約5%、3走前が約0.1%、4走前が約3%、5走前が約15%ほど実際のレースを説明するようです。
面白い点が、5走前の成績が15%ほどの説明力を持っている点です。
私はこのモデルを作る前はレース成績の説明力はだんだん下がっていくと思っていました。しかし実際は5走前の成績だけは一定の説明力を持ち続けています。
なぜだと思いますか?
答えは競馬新聞の馬柱にあります。5走前の日付をよく見てみてください。
大阪杯の5走前はちょうど大阪杯の1年前である場合が多いのです。
つまり、馬によって得意な季節があるということを示唆しています。春に強い馬は毎年春に強いのです。(多分)
競馬の経験がある人は当たり前のことかもしれませんが、私にとってはとても興味深いことでした。しかも今回は分析に回帰分析を用いたため、1年前の同じ季節の時の成績がどのくらい説明力を持っているのかということがわかりました。今回の場合では15%でした。
良いことが分かったところで、この式を使ってもう一度2022年と2015年の大阪杯を予想してみます。
大阪杯リベンジ!
早速やってみました。まずは2022年です。
まずは前のミケル指数が出していた馬たちを振り返ります。
- 9番アリーヴォ(7番人気) ➡3着
- 10番ヒシイグアス(5番人気) ➡4着
- 13番キングオブコージ(6番人気) ➡11着
そして次の3頭が新ミケル指数が選んだ優駿です!
- 9番アリーヴォ(7番人気)
- 13番キングオブコージ(6番人気)
- 4番ジャックドール(2番人気)
あんまり変わってないですね…。ヒシイグアスに代わってつい最近札幌記念を制したジャックドールが入りました。結果は果たしてどうだったんでしょう。
- 9番アリーヴォ(7番人気) ➡3着
- 13番キングオブコージ(6番人気) ➡11着
- 4番ジャックドール(2番人気) ➡5着
あれ…?む、むしろ悪くなってる…??
い、いや落ち着け…!まだ1回しか予想していない…!
俺達にはまだ2015年大阪杯がある…!
前の2015年大阪杯予想がこれでした。
そして新ミケル指数の見抜いた馬たちはこちらです。
デウスウルトとカレンブラックヒルに代わりキズナとラキシスが入りました。
今回は予想が大きく変わりましたね。さあ結果はどうだったんでしょう。
おお!これはすばらしい!
6着8着を外して1着2着をしっかり当ててきました!
進化した強さを見せてくれました。うれしい限りです。
肝心の的中率と回収率は?
今のところ2年分しか予想をしていないので、10年分の大阪杯を予想してみます。
とりあえず指数の高い3頭を選出し、各馬の複勝を買った時の回収率を見てみます。
結果はこんな感じでした。
5-4-5-17 (計30)
的中率46% 回収率122%
これはなかなか悪くないですね!
初めて作った競馬指数でこんなにいい結果が出るとは思いませんでした。
10レースだけなのでたまたまかもしれませんが、これはかなりうれしいです。
ちなみに買う馬券を複勝ではなく単勝にすると回収率は113%に下がりました。
収支はプラスなので悪くはないのですが、回収率は複勝の方がよさそうですね。
総括
今回データ入力を15年分に拡大した結果、回収率122%の競馬指数を作ることができました。(大阪杯過去10年分だけですが笑)
本当は6年分の式の時の的中率と回収率も把握しておくべきなのですが、めんどくさいのでやっていません笑。競走馬の出走ローテが時代に沿って変化している場合、データを近年の分のみに絞って分析した方が回収率が高まる可能性があるので、やってみてもいいかもしれません。
ちなみにですが、今回回収率が122%になったのはたまたまな可能性もあるのでそんなに浮足立たないように心がけます笑。もっと試行回数を増やせば回収率は122%より低いラインに収束するかもしれません。
また、扱うデータの数が増えてきたせいで、僕のクソザコノートPCのスペックではうまく動かなくなる場面が増えてきました笑。正直予想1つするのにも一苦労です。
競馬で稼いで新しいPCを買うしかありませんね。
今機械学習を使った競馬予想にも興味があるのでいつかその投稿もしてみようと思っています。
そして次回以降ですが、大阪杯の次に天皇賞秋を予想してみようと思います。
スプリンターズSも考えたのですが、今のモデルは短距離戦に弱いのでやめておきます。(キーンランドCはひどい結果でした笑)
秋華賞は大阪杯と条件がとても近いですし、今のモデルが長距離戦にも対応できるかどうか気になります。
次回以降も読んでもらえると嬉しいです!
バイバイ!