データマイニング導入事例:JRAシステムサービス株式会社様
2011年12月22日
■ ライトウェル お客様に聞く - JRAシステムサービス![]() 写真中央:情報企画課 課長 橋本高氏 写真右:コンテンツ開拓リーダー 藤倉祐樹氏 写真左:開発係 花島宏氏
― JRAシステムサービスの業態について教えてください。 JRAシステムサービス(以下JRASS)はJRAの100%出資の小会社で、中央競馬に特化した情報提供サービスを行っています。 主力となるのはインターネットと携帯で展開する有料サービス「JRA-VAN」です。これは、JRAの公式データと競馬ソフトが利用できる「Data Lab(データラボ)」、同じく公式データが携帯で確認できる「ケータイサービス」、公式データをリアルタイムで配信し、予測データを利用できる「NEXT(ネクスト)」の3つのサービスで構成しており、競馬初心者から本格的な予想を行うコアなファンまで、幅広いユーザーにご満足いただいています。
― JRASSでは、ライトウェルをどのように活用していますか。 JRASSでは、2001年、日本IBMを通じ、IBMパートナー企業であるライトウェルに競馬予測システムの開発を依頼しました。これは、「データマイニング」※を使った人工知能による予測システムで、JRA-VANの3つのサービスすべてにその予測値が利用されています。ライトウェルには開発終了後もシステム精度向上の研究、および保守サービスを継続的にお願いしています。 JRA-VAN NEXTの画面例(2008年5月実施 HNKマイルカップ)
― JRASSがデータマイニングを使った競馬予測システムを開発するに至った経緯をお聞かせください。 システム開発当時の2001年は、コンピュータを使った有料、無料の「競馬予想」ソフトウエアやサービスが一般的になってきた頃です。JRASSでも、より競馬ファンに喜んでいただける予測サービスを提供するため模索をしていました。競合他社との差別化を図るには、膨大なJRA公式データを利用できるという自社の強みを活かし、「主観ではなく客観的データに基づくもの」、「統計学による説得性の高いもの」、「第三者の見解や操作が加えられないもの」という条件のもと、公正なデータ予測を提供したいと考えました。 そこで、最新のIT技術を活用して競馬予測ができないかと、おつきあいのあるIBMに相談したところ、同社のデータマイニングツールインテリジェントマイナーを使ってみてはどうかという提案を受けました。 ― 当時、データマイニングが競馬予測に有効だという確信はあったのですか。 いえ、確信は全くありませんでした。そこで、試験的に過去何年かのG1競走の過去データを使って、着順グループおよび速度の算出を行いました。結果、全く的外れではなく、ある程度有効な数値を得ることができたため、人工知能に学習させるデータの精査を行っていけばデータマイニング手法は優れた競馬予測システムになり得ると判断、2001年4月、システムの開発を正式に依頼しました。実装を行うライトウェルからは3名の開発担当技術者、JRASSからは2名の担当者でチームを組み、打ち合わせを繰り返しながら開発を進めていきました※。
― 競馬予測システムの開発で一番重要なことは何ですか。 予測の精度を高めるためには何もかもを入れればよいというわけではなく、馬の速度に影響する要素は何かを見極め、人工知能に何を学習させるかを決定することが一番重要な部分であり、苦労をしたところです。最初は血統、性別、馬体重、枠番、過去走実績、調教師、脚質など競馬の常識に合った要素から学習させていきました。馬1頭につき100項目にもおよぶデータを入れ、加えて騎手、馬場の状況、天候など馬以外の要素も入れます。そのうちどれが有効でどれが有効でないのかを見分けるためには、専門家によるアドバイスが必要だと判断しました。 そこで競馬予想ソフトウエア開発の第一人者の方や、JRAの「競走馬総合研究所」で馬の血統研究を進めている方の意見を聞き、データをどのように扱うか、血統のどの要素が馬の速度と関連するのかなどを教えていただき、様々な角度からの情報を参考にしました。― JRAが持つ過去データは膨大な量だと思いますが、どれぐらいの年数のデータを使用するのですか。 最初は多ければよいと思い過去20年分ぐらいを入れていましたが、ライトウェルから「過去に何度か馬場の改修などがあるので、条件にばらつきがあるものを入れると精度に影響します」という意見があり、過去5年分に限ることにしました。 期間を区切って予想因子の見直しを行い、必要があれば差し替えをし、成果が出ればまたそれを検証していく、ということを繰り返し行いながら、予測モデルを作成していきました。 このような試行錯誤ののち、データマイニングによる競馬予測システムはJRA-VANの新サービス「NEXT」の目玉の一つとして2001年10月の秋華賞がデビューとなりました。わずか半年というタイトなスケジュールでしたが、ライトウェルの努力もあり無事に開発を終えることができました。 ― 新システムの予測結果はいかがでしたか。 馬連一点100%弱の回収率が出るなど予測が好調だったためリリース直後はG1、重賞などレースを限ってのサービスでしたが、翌2002年からは全レースで予測ができるように広げました。リリース後の課題はユーザーにこのシステムを浸透させることでした。そこで、データマイニング予測の回収率の傾向などが調べられるツールを提供し、データマイニングはどのような場面でどのように利用すればよいのか、ユーザーに理解を深めてもらう工夫をしています。 ― ユーザーの評判はどうですか。 サービス開始後、徐々に浸透してきています。NEXTのユーザー掲示板における一番の話題は常にデータマイニングで、「マイニングでこのレースが当たった」「こういう使い方をしてみた」などという話題がしばしば上ります。 リリースを終え、ユーザーに浸透もしてきました。しかしこのシステムに終わりはありません。試行錯誤を繰り返しながら、新たな予測モデルを開発し、今後も進化をし続けるシステムでありたいと思っています。
― ところで、データマイニングによる競馬予想システムの使い方のコツのようなものがあればお聞かせください。 先ほども述べたように、NEXTではデータマイニング予測の傾向がわかるツールを提供していますので、予測すべての結果を買うのではなく、それらを参考にご自身で選んで買っていくやり方がよいと思います。 また、予測結果を深く読み取ることもできるでしょう。例えば,予測結果が0.1秒ぐらいの差で並んでいるようなレースは馬の能力が僅差であるということですから、そこを買うのはリスキーと言えます。逆に大きく差がついている予測結果ならばデータマイニングは馬の能力の差に自信を持っているという見方もできるでしょう。
― 今回、競馬予測システムの開発を行ったライトウェルへの評価をお聞かせください。 ライトウェルは金融系のデータマイニングには強いと聞いていましたが、「競馬予測」という特殊かつ未知の世界での開発は、まずは競馬の仕組みから解きほぐしていかなければならなかったことでしょう。そんなゼロからのスタートでしたが、ライトウェルの技術者はみな業務にのめりこみ、2001年から今日まで一貫して熱意を持ち続けてくれています。その様子は、もはや技術者ではなく、「研究者」の域に入っているとすら言えると思います。ライトウェルの仕事ぶりで評価できる具体的なところは以下3点です。 評価1:「チームワークが良いこと」 ライトウェルの技術者同士、「ここはこうしたら」「いや、このほうがいい」など、真剣に議論や工夫を行っているやりとりを聞くのは楽しかったです。皆チャレンジ精神がありよいチームワークだと思いました。 評価2:「斬新な発想」 データマイニングには、どのデータを採用するかなどのアイデアが重要です。その点、ライトウェルは斬新な発想を提供してくれました。印象的だったのが「2段階予測」です。これはその名の通り予測を2段階に分け、1段階目で別々のレースで走った馬を共通に比較できるようにし、2段階目で本番の予測を行うというもので、これにより苦戦していた予測モデルが目標回収率に届きだしたという実績があります。その後また違うやり方に変えていきましたが、あれは画期的なアイデアであったと今でも高く評価しています。 評価3:「地道にコツコツやってくれたこと」 データマイニングは、延々と試行錯誤を繰り返す作業です。私たちは研究結果を聞くだけですが、技術者は仮説を立て、コツコツと一から作業を積み重ね、検証の結果だめだとまた同じ事を最初から繰り返すわけですから、気の遠くなるような作業です。それをやり続ける精神力には敬服します。
― ライトウェルへ、今後の期待があればお聞かせください。 JRASSは、今後も競馬予想システムの精度向上のための絶えざる努力を行い、競馬ファンの期待に応えていきたいと思っています。ライトウェルにはこれからも引き続き、その研究のサポートをお願いしたく思います。今後も一緒に、より完成度の高いシステムを作っていきましょう。よろしくお願いします。 お忙しい中、ありがとうございました。
※ JRAシステムサービスのWebサイト ※ 取材日時 2008年5月 ※ 事例制作 カスタマワイズ |
|||||||||||||||||||||
- サイト内検索
- 製品&ソリューション




そこで競馬予想ソフトウエア開発の第一人者の方や、JRAの「競走馬総合研究所」で馬の血統研究を進めている方の意見を聞き、データをどのように扱うか、血統のどの要素が馬の速度と関連するのかなどを教えていただき、様々な角度からの情報を参考にしました。
馬連一点100%弱の回収率が出るなど予測が好調だったためリリース直後はG1、重賞などレースを限ってのサービスでしたが、翌2002年からは全レースで予測ができるように広げました。
ライトウェルは金融系のデータマイニングには強いと聞いていましたが、「競馬予測」という特殊かつ未知の世界での開発は、まずは競馬の仕組みから解きほぐしていかなければならなかったことでしょう。そんなゼロからのスタートでしたが、ライトウェルの技術者はみな業務にのめりこみ、2001年から今日まで一貫して熱意を持ち続けてくれています。その様子は、もはや技術者ではなく、「研究者」の域に入っているとすら言えると思います。