ゆる~く競馬指数作り【第5話】
あけましておめでとうございます。
ミケルです。新年もよろしくお願いします。
今年ももう始まって2か月ですが、調子はいかがですか?
私が熱心に聞いている競馬ポッドキャストの皆さんによれば今年は午年だそうなので(笑)、みなさんの馬券運もますます上向いていく年になるでしょう!
私は新年早々初めて中京競馬場に足を運びました。
いろいろ面白かったので、また改めて記事を書けたらいいなと思います。
(書くかな?(笑))
本題
はい、今回は完全に怠けていた競馬指数作りでちょっと遊んでいこうかなと思います。
どうするかというと、リッジ回帰を使って天皇賞秋を予想しようと思います。
書こうと思えばいくらでも書けてしまうのでかなり省略します。(笑)
(ブロガーとしてあるまじき行為)
結論から言うとエクセルの結果とほとんど同じでした!(笑)
なさけない!(笑)悲しいのでもう少しあがきます。
質的データを持ち込んでもっかいやってみようと思います。
さあどうなるでしょうか!
爆死
はい、爆死です。
質的なものを考えない方がむしろ回収率は良かったです。
回収率の数字はもう出すのを控えようと思います、、(笑)
そもそも天皇賞秋が結構人気馬でがちがちに決まってしますことが多いので、当たっても全然お金になりませんでした。
人間の集合知(人気)と実際の馬の実力が乖離しているレースが買い目であり、そこでその差を見出すのがデータ分析の目的だったりするので、人気が来やすいレースはそもそも向いてないのかもしれませんね。知らんけど。
今後
まあ残念な結果になりましたが、指数作りは今後も引き続きゆる~くやっていきたいなと思います。
みなさん今年もよろしくお願いします。
近況報告【12/22】
すっかり月1更新するかしないかのレベルになってしまいました。(笑)
誰も読んでくれていないかもしれませんが一応近況報告しようと思います。
競馬指数作りについて
結論からいうとほとんど進んでいません。
サボっていたわけではありませんよ!
嘘ですサボってました。(笑)
一応関係する分野の勉強はしていたんですが、学べば学ぶほど沼にハマってしまいなにも成果物を出せていません。
文系の博士が、60代になるまで博士論文を出さない心境ってこんな感じなんだなと思いました。(たかが競馬予想でなにいってんですかね(笑))
まだまだ勉強も足りていませんが、そろそろ遊びでなにか作っていようかなと思っています。もともとこの企画も遊びで始めたものですしね。そんなに気張らず始めようと思います。
その他の競馬に関する近況報告
前回がいつだったかはっきり覚えていませんが、競馬は追っていました。
結構前ですが天皇賞秋を現地観戦したりしました。
正直競馬そのものをしっかり見ようと思ったらテレビの方がいいんでしょうが、あの会場の熱を肌で感じることが楽しいので、現地に行けてよかったです。
特にイクイノックスがパンサラッサを差すか差さないかの戦いはすごく盛り上がりましたね。
初めて東京競馬場に行ったのでそのすごさにびっくりです。
めちゃくちゃでかい。中山のレベルじゃなかったです。(笑)
帰りにターフィーショップによって記念品を買おうと思っていたんですが、人の山で入ることができませんでした。競馬場内に3店舗ぐらいあるのにやばすぎです。
あと若い人がいっぱいいました。ネットで入場券を買わないと入れないので、ネットに弱いお年寄りとかは多少少なくなっているんですかね?
ウマ娘効果で競馬を始める若い人も多いので、その影響もありそうですね。(かくいう私もウマ娘から競馬にハマりました。)
JCは指定席をとってゆったりと見ようと思ったのですが、抽選に敗北してしまったので諦めました。いつかとれるといいな。
他にもいろいろありましたがとりあえずこんな感じです。
もう今年度は更新しないと思うので(笑)、良いお年を!
1から競馬指数の進捗【11/11】
近況報告
お久しぶりです。ミケルです。
しばらくぶりの更新です。以前更新したときからかなり時間が空いてしまいました。
その間にはまぁ普通に勉強したり(サボり気味でしたが)、初めて東京にいって天皇賞秋を現地観戦したり、いろいろしていました。笑
今回は以前の更新時からいろいろ知識をつけた状態で、もう一度思考を整理したいと思います。
原点に立ち戻る
なんで思考整理しようと思ったのかというのを端的に言うと、余計な欲が生まれて本来の目的から脱線しそうだったからです。笑
今までpythonの勉強をするうちに、これを将来仕事に生かしたりしたいなという欲が生まれてきてしまい、勉強の範囲をあれやこれやと伸ばしまくっていました。
その結果、肝心の競馬予想作りに関係ない分野ばかり勉強してしまい、本来の目的に近づけていない状況になってしまいました。それはよろしくない。
仕事に生かせるレベルまでスキルを磨こうという心意気はいいのですが、そのレベルに達するには途方もないレベルの勉強時間が必要になってしまい、最悪スキルもほかのことも中途半端な感じになってしまうのではと思いました。
なのでここで一度原点に立ち戻り、やることとやらないことを区別して優先順位をつけようと思います。
今後の方針
今後は勉強の範囲を深層学習を利用した競馬予想に絞ろうと思います。
不完全ですが、今考えている競馬予想フローはこんな感じです。
- JRAVANから取得した情報をインプット
- 深層学習で予想
- アウトプット
悩んでいるのが、アウトプットについてです。
深層学習のアウトプットとして、好走するかどうかを示す指数を各馬について導出するのは深層学習に適しているのかわかりません。
何なら今まで通りの回帰分析でやった方が直観的には早そうな気もします。
まぁまだ深層学習について全然勉強できていないので、勉強を進めるにつれてアウトプットの形は考えていこうと思います。
そして今回大切なのが何をやらないかです。
今後は上に関係なさそうな事柄については勇気をもってスルーしていこうと思います。
後々勉強すべきだとわかった場合は随時勉強すればいいですしね。
はたして競馬予想が完成するのはいつになることやら…笑
イクイノックス君が引退するまでには完成させたいですね。
ではまた!
1から競馬指数の進捗報告!
お久しぶりです。
こんにちは、ミケルです。
ずいぶん久々の投稿になってしまいました。
ブログや競馬指数企画の存在を忘れていたわけではなく、むしろここ2,3週間は競馬指数関係のことしかしていませんでした。
軽い進捗報告
今まで具体的に何をやっていたのかというと、端的に言うと勉強です。
1話から作っていた競馬指数作りは、データを自分でエクセルに打ち込み、エクセルの回帰分析を用いて指数を作るというものでした。
しかしこのやり方はめちゃくちゃ大変で、正直長続きしないだろうなと思っていました。理由は以下の通りです。
- データ打ち込みがめんどくさい
- 精度UPに限界がある
- あんまかっこよくない(笑)
まずデータ打ち込みがだるすぎるんです。下手したら1200個以上のデータを手打ちで計算して入力してるので、マジできついです。関数用いてやればいいと思うかもしれませんが、まず元のデータがすべてネット上にあるので、それを掘るのができないです。しかもそれを1レースごとにやるので、もう発狂してしまいます。
次に精度の問題ですが、今のやり方は端的に言うと自分の予想にもとづいて説明変数をえらんでいるので、そもそもの自分の予想が間違っているといい指数は作れません。しかも所詮犬の知能での予想なので、機械に予想してもらった方が絶対良いんですよね笑。
なので今はPythonを用いた機械学習で指数を作ろうとしています。
ただこれが大変でめっちゃくちゃ勉強しないといけないので、実際に指数ができるのは相当先になりそうです。
なのでしばらく更新は競馬場レポや小ネタになりそうです。
気長に頑張ろうと思います。
それでは!
ガチ初心者が1から競馬指数を作ってみた。【第4話】
前回のあらすじ
才能の片鱗を見せるもデータ不足から力及ばず敗北したミケル指数…!
もはやここまでと思いきや、競馬犬ミケルにより15年分のデータを注ぎ込まれ、戦いは更なる局面へと展開する…!!
早速データを入れたよ
こんにちは、ミケルです。
今回も競馬指数作りを進めていきます。
前回は6年分のデータを使って2015の大阪杯を予想し、微妙な感じに終わりました笑。
まだ読んでなかったらここから飛べるのでぜひ読んでね。
keibadogmichael.hatenablog.com
微妙な感じで終わるのは不服なので、今度は15年分のデータを入れてモデルを再築して、もう一度予想してみます。
はい、いきなりですが15年分のデータを入れた際の式がこちらになります笑。
(サラッと書きましたが15年分のデータを入れるのは本当に骨の折れる作業でした…。)
ミケル指数=0.409577(1走前)+0.057721(2走前)+(-0.00103)(3走前)+0.039476(4走前)+0.150498(5走前)
ここで1つ注目してほしいポイントがあります。各項の係数を見てください。
各項の説明力を100倍して百分率で表すと1走前の成績が約40%、2走前の成績が約5%、3走前が約0.1%、4走前が約3%、5走前が約15%ほど実際のレースを説明するようです。
面白い点が、5走前の成績が15%ほどの説明力を持っている点です。
私はこのモデルを作る前はレース成績の説明力はだんだん下がっていくと思っていました。しかし実際は5走前の成績だけは一定の説明力を持ち続けています。
なぜだと思いますか?
答えは競馬新聞の馬柱にあります。5走前の日付をよく見てみてください。
大阪杯の5走前はちょうど大阪杯の1年前である場合が多いのです。
つまり、馬によって得意な季節があるということを示唆しています。春に強い馬は毎年春に強いのです。(多分)
競馬の経験がある人は当たり前のことかもしれませんが、私にとってはとても興味深いことでした。しかも今回は分析に回帰分析を用いたため、1年前の同じ季節の時の成績がどのくらい説明力を持っているのかということがわかりました。今回の場合では15%でした。
良いことが分かったところで、この式を使ってもう一度2022年と2015年の大阪杯を予想してみます。
大阪杯リベンジ!
早速やってみました。まずは2022年です。
まずは前のミケル指数が出していた馬たちを振り返ります。
- 9番アリーヴォ(7番人気) ➡3着
- 10番ヒシイグアス(5番人気) ➡4着
- 13番キングオブコージ(6番人気) ➡11着
そして次の3頭が新ミケル指数が選んだ優駿です!
- 9番アリーヴォ(7番人気)
- 13番キングオブコージ(6番人気)
- 4番ジャックドール(2番人気)
あんまり変わってないですね…。ヒシイグアスに代わってつい最近札幌記念を制したジャックドールが入りました。結果は果たしてどうだったんでしょう。
- 9番アリーヴォ(7番人気) ➡3着
- 13番キングオブコージ(6番人気) ➡11着
- 4番ジャックドール(2番人気) ➡5着
あれ…?む、むしろ悪くなってる…??
い、いや落ち着け…!まだ1回しか予想していない…!
俺達にはまだ2015年大阪杯がある…!
前の2015年大阪杯予想がこれでした。
そして新ミケル指数の見抜いた馬たちはこちらです。
デウスウルトとカレンブラックヒルに代わりキズナとラキシスが入りました。
今回は予想が大きく変わりましたね。さあ結果はどうだったんでしょう。
おお!これはすばらしい!
6着8着を外して1着2着をしっかり当ててきました!
進化した強さを見せてくれました。うれしい限りです。
肝心の的中率と回収率は?
今のところ2年分しか予想をしていないので、10年分の大阪杯を予想してみます。
とりあえず指数の高い3頭を選出し、各馬の複勝を買った時の回収率を見てみます。
結果はこんな感じでした。
5-4-5-17 (計30)
的中率46% 回収率122%
これはなかなか悪くないですね!
初めて作った競馬指数でこんなにいい結果が出るとは思いませんでした。
10レースだけなのでたまたまかもしれませんが、これはかなりうれしいです。
ちなみに買う馬券を複勝ではなく単勝にすると回収率は113%に下がりました。
収支はプラスなので悪くはないのですが、回収率は複勝の方がよさそうですね。
総括
今回データ入力を15年分に拡大した結果、回収率122%の競馬指数を作ることができました。(大阪杯過去10年分だけですが笑)
本当は6年分の式の時の的中率と回収率も把握しておくべきなのですが、めんどくさいのでやっていません笑。競走馬の出走ローテが時代に沿って変化している場合、データを近年の分のみに絞って分析した方が回収率が高まる可能性があるので、やってみてもいいかもしれません。
ちなみにですが、今回回収率が122%になったのはたまたまな可能性もあるのでそんなに浮足立たないように心がけます笑。もっと試行回数を増やせば回収率は122%より低いラインに収束するかもしれません。
また、扱うデータの数が増えてきたせいで、僕のクソザコノートPCのスペックではうまく動かなくなる場面が増えてきました笑。正直予想1つするのにも一苦労です。
競馬で稼いで新しいPCを買うしかありませんね。
今機械学習を使った競馬予想にも興味があるのでいつかその投稿もしてみようと思っています。
そして次回以降ですが、大阪杯の次に天皇賞秋を予想してみようと思います。
スプリンターズSも考えたのですが、今のモデルは短距離戦に弱いのでやめておきます。(キーンランドCはひどい結果でした笑)
秋華賞は大阪杯と条件がとても近いですし、今のモデルが長距離戦にも対応できるかどうか気になります。
次回以降も読んでもらえると嬉しいです!
バイバイ!
【競馬場巡り】初めて中山競馬場に行ってみた。
こんにちは、ミケルです。
今回縁あって初めて中山競馬場に来たので、その体験を書き連ねようと思います。
気長に読んでね!
いやー、でかい!
今まで自分は中央競馬は札幌競馬場、地方競馬は船橋競馬場しか言ったことがありません。中山競馬場には前々から行ってみたんです。
いやーでかいっすね!笑
中山開催週ではなかったので立ち入れない区域があったのですが、それにしてもでかかったです。色々見て回るだけで1万歩以上歩きました。
投票場の量も場所も札幌の倍以上でした笑(体感ね笑)
投票場のすごさにも驚いたんですが、レストランの充実度にも驚きましたね。
上の案内を見てもらえばわかると思うのですが、レストラン多いです。
ただ今は開催週じゃないのとコロナの関係で多くのレストランがしまっていました…。
残念です。
正門にも行ってみた
ハイセイコー号です。4連勝中の3勝が中山競馬場だったということで中山競馬場に像を立てたみたいですね。良い待ち合わせスポットだったりするんでしょうか。
肥田金一郎と中村勝五郎です。
肥田金一郎は中山競馬倶楽部(戦前、中山競馬場を運営していた団体)を、腐敗と権力闘争で崖っぷちだった状態から救った人です。中山大障害を作ったのもこの肥田金一郎です。中村勝五郎は中山競馬場が現在の位置に移る際、土地の確保に貢献した元中山町長で名士です。
有馬記念創設者として有名な有馬頼寧の像もあってもいいんじゃないかと思っているんですが、彼は中山競馬場に貢献というより日本の競馬全般に貢献したという感じなので中山競馬場には像を作っていないんでしょうね。
馬頭観音様もいらっしゃいました。パドックからちらっと見える位置にあるので、あれは何だろうと思っていた人も多いんじゃないかと思います。ちゃんとお参りさせていただきました。
歴代の有馬記念を制した名馬たちが並んでいました。私の敬愛するイナリワン号もいたのでしっかり写真に収めました。
正門から左に進むとグランプリロードがありました。花道ですね。こちらは新しく整備されていて、とてもきれいです。そのままグランプリロードの横を進むといよいよターフとスタンドです。
開催週ではないため人も馬もいませんでしたが、「おぉ…!」となる景色でした。
やはり競馬場といえばこの風景ですよね。今度はぜひ開催週に来てみたいものです。
正門に戻るとタイキシャトル号のポスターがありました。おそらくタイキシャトル号が現役の時に作られたポスターなのでしょうが、こうしてまた当時のポスターを見られるのはうれしいですね。
競馬場の中に吹き抜けになっているゾーンがあり、おいしそうな飲食店が並んでいました。開放感があり、ショッピングセンターと見間違えるほどです。ちなみにそのゾーンはベンジャミンプラザと呼ぶそうです。生えている木がベンジャミンというからそう呼ぶそうですね笑。
写真にも写っていますが、タイキシャトル号の献花と記帳が行われてました。しっかり記帳させていただきました。タイキシャトルは昔からの競馬ファンのみならず、ウマ娘から入った新参競馬ファンからも認知度の高い名馬ですね。
最後にベンジャミンプラザ地下1階にあるターフィーショップでお買い物をしました。
いろんな商品があって見ているだけで楽しかったです笑。
ガチ競馬ファンからライトなファン、男性女性、年配の方から若い方まで各層がそそられる商品がそろっていました。
特に目を引いたのはオジュウチョウサングッズですね。
彼は中山大障害のレジェンドですからね…!
グッズといわずもはや銅像をたててもいいレベルなのでは…?笑
ちなみに私はソダシちゃんグッズを買いました笑。
次は開催週で!
今回は開催週ではなかったので、中山競馬場の魅力を最大限感じきることができなかったので、次機会があれば開催週にお邪魔したいと思います!
ご拝読ありがとうございました~!
ガチ初心者が1から競馬指数を作ってみた【第3話】
皆さんこんにちは、ミケルです。
今回も競馬指数を作ります。
前回のあらすじ
ついに競馬指数プロトタイプを作った競馬犬ミケル…!
その破壊力やいかに…!
2022年の大阪杯を予想
前回作ったミケル指数を使って早速2022年の大阪杯を予想してみよう。
楽しみだなぁ…!うまくいったら馬券で荒稼ぎしてむかつくニンゲンどもをペットにしてやるんだ!
使う式は前回のとおりです。まだ見てなかったらぜひ見てみてね。
keibadogmichael.hatenablog.com
一応式だけ載せておきます。
ミケル指数=0.761365(1走前)+0.241108(2走前)+(-0.07119)(3走前)+(-0.05771)(5走前)
そしてこの愛しいミケル指数が導き出した最強馬は…!
- 9番アリーヴォ(7番人気)
- 10番ヒシイグアス(5番人気)
- 13番キングオブコージ(6番人気)
大丈夫か…?人気のある馬が必ずしも勝つわけではないけども、プロトタイプなのにいきなり穴攻めするなんて…。なんて狂暴な競馬指数なんでしょう。
肝心の、それぞれの馬がミケル指数においてどんな数値だったのか、というのは、私が記録しておくのを完全に忘れていたのでここでお伝え出来ません…!!ごめんなさい!
まあ私はただの犬なのでしょうがないね(達観)
ただアリーヴォとヒシイグアスがいい感じの指数で、キングオブコージがまあいいかなって感じの結果だったことは覚えています。
さあ、実際の着順はどうだったんでしょうか!
プロトタイプにしては悪くないのでは?
まずはnetkeibaさんの競馬新聞をここに貼っておきます。
そしてミケル指数に選ばれし優駿たちは…!!
- 9番アリーヴォ(7番人気) ➡3着
- 10番ヒシイグアス(5番人気) ➡4着
- 13番キングオブコージ(6番人気) ➡11着
うーーーーーん。悪くはないんだけどなぁ…。
特にアリーヴォなんかはあわや1着レベルの好走を見せてくれています。
動画でもみてみてね。
人気薄の馬の好走を予見できたのはすごくうれしいことなんですが、これで馬券を買っていても1円にもなりません…。キングオブコージとかは11着ですし。
しかもポタジェの1着を全く予想できていないのはとてもよくないです。やはりプロトタイプはプロトタイプですね。まだまだ改善が必要です。
ただ一つうれしかったのは、netkeibaで競馬予想を販売している「リュウジ」さんと3頭とも予想が丸被りしていたんです…!(もちろんたまたまですが。)これはなんともうれしい…!
そこのあなた、嘘だと思っていますね?
埋め込みリンク先で確認してみて下さい。ちゃんとページ下の的中予想家の欄にリュウジさんがいらっしゃいます。
プロトタイプにしてもうすでにプロ予想家と同じレベルにいるのでしょうか…!このミケル指数は…!
ほかの年のレースでもやってみよう
さすがに1レースだけ予想して有頂天になるのは駄犬すぎるので、もう1つ予想してみます。今回予想するのは2015年大阪杯です。
そしてこちらがミケル指数が導き出した最強馬たちです。
やはりここでも1番人気と2番人気は選ばれていませんね。
馬券としてはおいしくなるのでありがたいんですが…。ほんとにあたんのかな?笑
結果はどうだったんでしょうか。
うーんやはりまだ実践レベルとは言い難いですね。
動画で見てもとくに光るような走りはしていません…。
やはりミケル指数はまだまだです。
改善しよう
さて、ではこの困ったミケル指数をもっと改善していきましょう。
問題点は多々あります。
- 大阪杯しか予想できない。
- データが6年分しかない。
- 馬場や騎手などの他の変数を考慮できていない。etc...
まだまだ課題だらけですが、気長に改善していきましょう。
まずは「データ不足」の問題に取り組んでいきましょうか。
では次回以降、ミケル指数を15年分のデータをぶち込み、さらなる強化を目指します。
ここまで読んでくれてありがとう!
感想をコメントしてくれるとうれしいです。
次回もぜひよんでね!