競馬犬ミケルの1から競馬指数

競馬初心者が1から競馬指数を作ります。

【キーンランドC】作りかけの競馬指数で予想してみた。

いきなりですがキーンランドCを予想します。

皆さんこんにちは、ミケルです。

いよいよ28日はキーンランドCですね。

 

まだ我がミケル指数は開発途中ですが、いきなりキーンランドCを予想してみようと思います。どうなるでしょうかね…! 楽しみです。

 

手順は以下の通りに進めていきます。

  1. キーンランドC15年分のデータを入力
  2. 重回帰分析
  3. 分析結果を基に立式、指数を算出

 

こんな感じです。このデータ入力がめんどくさいんですよ…!

JRAVANやウマホなどのデータサイトから直接持ってこれない形で入力してるので、

めちゃくちゃ人力です。めんどくさいけどやるしかありません。

 

指数完成!

データ入力だけで4時間かかりました(虚無)

肉球をすり減らてつくった指数が以下の通りです。

 

ミケル指数=0.13604(1走前)+0.08814(2走前)+0.05659(3走前)+0.12378(4走前)+0.05668(5走前)


悲しいことにすごく嫌な予感がします。15年分のデータを入力しているのですが、ここ数年で馬のローテ傾向が変わり、それが指数の係数を乱しているのかもしれません。

ただもう時間がないのでこの指数式を使って予想することにします。

 

とりあえず2021年のキーンランドCを予想してみます。

今回指数上位の馬と、その実際の結果です。

  • 15番マイネルアルケミー(11番人気) ➡6着
  • 11番ミッキーブリランテ(2番人気) ➡10着
  • 12番レイハリア(3番人気) ➡1着

 

1着は予想できているんですが、それ以外が正直微妙ですね…。

ミッキーブリランテなんて10着ですからね。

 

まだ指数式の見直しが必要そうですが、時間がないので今回はこれで強引に進めます。

 

 

今年のキーンランドC予想!

では2022年の指数上位馬を紹介します。

  • 11番オパールシャルム(11番人気)
  • 1番ヴァトレニ(3番人気)
  • 2番ビリーバー(13番人気)
  • 9番ジュビリーヘッド(4番人気)

 

当たる気がしない…笑 外枠有利をガン無視しています。(変数に入れていないので当たり前ですが)

ですがまあとりあえずこれで行こうと思います。

 

 

はたして結果は…!

競馬指数上位4頭の馬券を手に、いざテレビへ…!

馬券はすべて複勝です笑 当たる気が全くしないので複勝に逃げました笑

さあどんな結果だったんでしょうか?

 

  • 11番オパールシャルム(11番人気) ➡5着
  • 1番ヴァトレニ(3番人気) ➡3着
  • 2番ビリーバー(13番人気) ➡14着
  • 9番ジュビリーヘッド(4番人気) ➡7着

う〇こです。

敗因はいろいろありますがいくつか出してみます。

  • 重回帰分析を使っているが、その結果を見る限り統計的に有意ではない。
  • データ入力時、長期間休養の扱いが良く定まっていない。
  • 15年分のデータを使っているが、15年間で馬のローテ傾向に変化が生じている可能性がある。
  • 現在データ入力時にG1,G2,G3などのレベル差を考慮できていない。etc...

まだまだ厳しいですね...!

一朝一夕では良い競馬指数は作れないのでしょう。

 

キーンランドCの結果次第では中山のG1スプリンターズSにも今作っている競馬指数を使ってみようと思っていたのですが、それはやめておきます。結果が悲惨だったので笑。(統計的に有意でないとわかっていたので無理もないですが。)

もっとまともなものに改良しないといけませんね。

 

 

ご拝読ありがとうございました!

 

ガチ初心者が1から競馬指数を作ってみた【第2話】

前回のあらすじ

金欠により生命の危機を感じた競馬犬ミケルは犬並みの知能を駆使し、ついに禁断の競馬指数開発に着手…!

果たしてミケルの運命は…!

 

 

早速やってみよう

前回の発言の通りに、まずは大阪杯のデータを使って競馬指数を作っていくよ。

最初の目標は「2022年の大阪杯を当てること」にしましょう!!

(これがどんなにむずかしいことであるのかこの時のミケルは予想だにしなかった…。)

 

 

前話でも書いたけど、とりあえず前5走の成績を説明変数、実際のレースの成績を被説明変数として重回帰分析してみた。まずは2021年のデータだけでやってみる。

 

 

係数

標準誤差

t

P-値

下限 95%

上限 95%

下限 95.0%

上限 95.0%

 

切片

-3.41653

1.655596

-2.06362

0.077947

-7.33139

0.498333

-7.33139

0.498333

 

1走前

0.879814

0.343193

2.563614

0.037354

0.068292

1.691337

0.068292

1.691337

 

2走前

0.501933

0.217245

2.31045

0.054151

-0.01177

1.015635

-0.01177

1.015635

 

3走前

-0.70137

0.575763

-1.21815

0.262627

-2.06283

0.660098

-2.06283

0.660098

 

4走前

0.333214

1.015638

0.328084

0.752444

-2.06839

2.734817

-2.06839

2.734817

 

5走前

0.840212

0.674915

1.244916

0.253222

-0.75571

2.436132

-0.75571

2.436132

 

 

はい、めちゃくちゃです。(自明)

一番左の「係数」ってやつが、各変数(前5走の成績)がどれだけ説明力がある(実際のレース結果を示唆する)のかを表してます。係数は-1から1の値で、1に近いほど説明力があります。そして逆に-1に近いほど負の関係にあることを示しています。(成績がいいほど悪くなる。)

 

そして係数を見てみるとかなりぐちゃぐちゃです。特に3走前なんて負に相関しています。3走前が良ければ良いほど本番の成績が悪いことになっています

 

P値も見てみても、やはりこの結果は統計的に有意であるとはいえなさそうです。

(P値は結果が統計的に正しいかどうかを示しています。状況によりますが0.05以下であれば統計的に有意といえます。)

 

原因は明白です。データが少ない!

もっとデータを入れないとクレイジーな結果になることは避けられません。

 

なので次は6年分の大阪杯のデータを入れてみましょう。

 

 

6年分のデータで仕切り直し

するとこんな感じになりました。

 

係数

標準誤差

t

P-値

下限 95%

上限 95%

下限 95.0%

上限 95.0%

切片

-0.86794

0.594388

-1.46023

0.148459

-2.05229

0.3164

-2.05229

0.3164

1走前

0.761365

0.134682

5.653066

2.79E-07

0.493006

1.029724

0.493006

1.029724

2走前

0.241108

0.10878

2.216468

0.029733

0.024359

0.457858

0.024359

0.457858

3走前

-0.07119

0.127466

-0.55852

0.578177

-0.32517

0.182789

-0.32517

0.182789

4走前

-0.05771

0.126653

-0.45563

0.649988

-0.31007

0.194654

-0.31007

0.194654

5走前

0.277741

0.144446

1.922793

0.058354

-0.01008

0.565557

-0.01008

0.565557

 

だいぶマシになってきましたね。相変わらず3走前と4走前が負の相関を示していますが、1走前、2走前、3走前と次第に係数が小さくなっているのは直観に沿う形になってきました。

 

しかしあいかわらず5走前の成績の係数は謎に高いままです。なんででしょうね…笑。

いろいろツッコミどころはありますが、これでとりあえず競馬指数は作れそうです。

 

ついに競馬指数が完成!その名も「ミケル指数」

とりあえず式が完成したので、これを競馬指数のプロトタイプとすることにします!

ちゃんとした形は以下の感じですね。

 

ミケル指数=0.761365(1走前)+0.241108(2走前)+(-0.07119)(3走前)+(-0.05771)(5走前)

 

この完成した競馬指数、名付けて…「ミケル指数」!!

 

そして第3回ではこの完成したミケル指数を使って2022年の大阪杯を大予想してみようと思います…!乞うご期待…!

 

感想をコメントしてくれるとうれしいです!

次回もぜひ読んでね!

 

 

 

ガチ初心者が1から競馬指数を作ってみた【第1話】

競馬犬ミケル

皆さん初めまして、ミケルです。

先日の札幌記念は残念でした。私はにわか競馬ファンらしくソダシちゃんを応援していたのですが、あえなく撃沈してしまいました。

 

 

生まれて初めて行った競馬場でソダシの雄姿がみたかったんですが、残念です。

(しっかりソダシグッズは買い込みました。笑)

 

 

しかしソダシの敗北以上に私の心を突き動かしたのは、「馬券を外した」ということ。

限界金欠犬である私には馬券を外すことはすなわち餓死を意味します。

 

 

それはほんとにまずい。そこで世界でも数少ない競馬をする犬という独自の視点から最強の競馬指数を作り出し、最強馬券犬になることを目指すことにしました。

 

 

1から競馬指数を作る?無理でしょ!

 

絶対に作ります。(鋼の意思)

私は回収率1000%の競馬指数を作って一生それで生きていくんです…!

1億円の犬小屋をたて、1皿1万円のドッグフードを毎食食べ、近くにかわいい女の子の犬をはべらせるんです‼ ペットに人間も飼うんです!!

 

はい。でもまぁ競馬ド初心犬の作る競馬指数なので、面白半分で見てやってください。

コメントでアドバイスとドッグフードをくれると喜びます。

 

ネタバレを避けるため全情報は出せませんが、できる限り共有しようと思います。

そして指数を使った競馬予想もこのブログで公開する予定なのでぜひ見てくださいね。

(もちろん無料です。笑)

 

 

具体的にどうするの?

はい。前5走分のデータを説明変数、実際の走りを被説明変数とする重回帰分析を行います。そして各説明変数の係数を求めて未来のレース結果を予想します。

回帰分析について知りたい方は下のリンクを見てみてください。正直誰にでもできるので皆さんもやってみてね。

https://data.wingarc.com/regression-analysis-31489

 

 

さて、まず前5走のデータって具体的にどこを見るねんって思ってますね??

自分も悩みましたがとりあえず1着からのタイム差を使おうと思います。

まぁ競馬も統計学も初心者だから多少はね?

 

 

分析するレースは大阪杯です。

なぜ大阪杯かというと…!とくに意味はありません!

ただ大阪杯だけのデータで競馬指数を作っても大阪杯だけに特化した指数になってしまうので、後々拡張するつもりです。

 

では次回以降、大阪杯のデータを使った競馬指数開発を始めていこうと思います。

 

感想をコメントしてくれるとありがたいです!

次回以降もぜひよんでね!