ステラ牧場

cafestella.exblog.jp

チョコボのブログです。

ブログトップ

タイム分析 - 神殿 -

神殿競羽場のタイム予測に関する記事です。少しずつ加筆していきます。( 最終更新日:11/18


【 前提条件 】 次の 3 つで、レース回数は 640 ( 対象の羽数 80 × 距離の個数 8 ) です。

  1.対象となる羽は 5 枠発走の早仕掛けで固定。その内枠は全能力 0 の羽で埋める。
  2.対象羽の気性難 ( かかり ・ あおり ・ いれこみ ) とクロス病は両方とも 「なし」 とする。
  3.複数の能力値を原因、実測タイムを結果として、最小二乗法で線形回帰モデルを作る。


★ 羽数 80 で原因 7 つ ( 先、長、瞬、自、加、祭、左得意 ) の重回帰分析

b0299705_20043291.png

たとえば 1200 m の場合は、モデルの適合度を表す自由度修正済み決定係数が 0.9926 で

  タイム = 81.5524 - 0.02237 × 先 + 0.00021 × 長 - 0.03540 × 瞬 - 0.00343 × 自
              - 0.04986 × 加 - 0.04625 × 祭 - 0.43692 × □    が予測式です。

ただし、タイムの単位は秒であり、左回り得意の羽は □ = 1 、そうでない羽は □ = 0 です。


< 長距離について >

通常は能力が上がるとタイムも縮まりますが、1800 m 以下では長距離の回帰係数が正という

結果が返ってきました。とはいえ、ごくごく小さな値 ( 1600 m だと 0.000016 ) なので無影響と

見なして差し支えないかなぁ、といった感じです。反対に 3200 m 以上はガラリと変化していて

3600 m に至っては先行力の回帰係数に匹敵するほど、長距離はタイム短縮に貢献しましたね。


< 自在性について >

2400 m 以下では安定し、3200 m 以上だとそれより若干強めに響くかな、といった結果でした。

長距離もそうですが、2400 m 以下なら原因に含めなくとも定数項がうまく調整してくれそうです。


< 先、瞬、加について >

主要 3 能力のタイム貢献度は常に 先 < 瞬 < 加 という大小関係でした。 距離に注目すると

1600 m は若干強め、3200 m は気持ち弱めに響いているのは興味深い箇所かもしれません。

加速力は 2400 m で大きく変化しています。他の距離と 0.01 程度異なるのは特徴的ですね。

距離に応じてレースに出す羽を適切に見極められると、より深く面白く楽しめる形になりそうです。


< 以下、工事中。時間のあるときに続きを書いていく予定です。>

[PR]
# by Rune-3 | 2017-11-14 21:40 | チョコボ

タイム分析 - 準備 -

エクセルで回帰分析を行う方法に関する記事です。理論面に関しては下のリンクからどうぞ。



具体例として、羽数は 8 羽、原因となる説明変数は 「加+祭」 の 3 つを利用して

結果のタイムを予測する線形モデルを作成してみます。( ※ Excel 2013 を使用しています )


【 手順1 】  データ分析ツールを使えるようにする

エクセルを開いて、左上のファイル ⇒ 左下のオプションを選びます。現れたオプション画面で

左列のアドイン ⇒ 画面下の設定(G) を押したあと、分析ツールにチェックを入れて完了です。


【 手順2 】  回帰分析に必要なデータを入力する ( 下の画像を用意する )

b0299705_14591769.png

【 手順3 】  導入したツールを使用する

画面上のデータから データ分析 ⇒ 回帰分析 を選びます。入力 Y 範囲にタイムデータを、

入力 X 範囲に 先、瞬、加+祭 のデータをそれぞれ範囲指定します。 上の例の場合だと、

Y 範囲は $F$4:$F$11、X 範囲は $C$4:$E$11 と表示されていれば OK です。その他の

項目は触らなくても大丈夫ですが、今回は有意水準の項目を 99 %にして、結果を出します。

( ※ 本来は 「信頼度 99 %」 が適切な表現ですが、エクセルでは有意水準となっています )

b0299705_14594732.png

上のような表が出てきます。色を付けた 3 つの部分が主要な情報でそれぞれ説明すると

補正 R2 … モデルの適合度を表す自由度修正済み決定係数で、1 に近いほど良精度。

係数 … 上から順に 定数項、先、瞬、加+祭 の回帰係数。この例は次のモデルを表す。
        タイム = 81.4032 - 0.0229 × 先 - 0.0354 × 瞬-0.0546 × (加+祭)

下限、上限 …  回帰係数を区間推定したときの両端を表す。% が増えると区間も広まる。
           サンプル数が増えると区間が狭くなり、真の値の推定がより好ましくなる。


同じ羽数 8 でも、選択する 8 羽が変わると分析結果ももちろん変わります。その変更を

繰り返して、たとえば 100 個のモデルを作ると、区間推定の結果も 100 通り出現します。

その 100 通りのうち 95 個分の区間に真の値が含まれている、と考えられる形の推定を

行うのが区間推定です。今回の例では、ある 1 個のモデルから得た先行力の推定区間は

- 0.0262 ≦ 先の回帰係数 ≦ -0.0195 となっているわけですね。99 %に設定した場合、

- 0.0284 ≦ 先の回帰係数 ≦ -0.0174 のように 95 %より広い区間となって、間違った

判断 ( 推定区間に真の値が入らない ) を避けやすい反面、消極的な判断になりがちです。


以上でエクセルの基本的な使い方の説明はおしまいです。思ったよりもお手軽に実行できる

ので、色々な回帰モデルを作って楽しめそうですね。次回から羽数を増やして 6 競羽場の

分析を行う予定なので、より深い理解につなげて進捗を産みたいところです。ではでは。(^^)/

[PR]
# by Rune-3 | 2017-11-01 20:30 | チョコボ

確率・統計の演習

半年ほど確率・統計の分野を少しずつ学び続けて、そろそろアウトプット用の記事もほしい

ということで、テストを作ってみました。 大問は 6 つで、時間は 90 ~ 120 分が目安です。

b0299705_19420833.png

★ 各設問の内容について

[ 1 ]  記述統計+回帰分析

最初の問題ということもあり、やさしめに作りました。もし 2 試験の得点データが破損して
いても、相関係数さえ残っていれば偏差値ベースの回帰直線は描くことは可能なんですね。

[ 2 ]  ポアソン分布+指数分布

平均が安定している 2 つの分布の導出がテーマです。人数と間隔 ( X と T ) の対応を
押さえることがメインですが、それらの平均や分散も計算できるようになっておきたいです。

[ 3 ]  多項分布+幾何分布

離散型確率変数の計算問題です。(1) の前半は 条件付き+最大確率 という融合問題で
(2) は表向きの表現は異なるものの、いわゆる 「クーポンコレクター問題」 が土台ですね。

[ 4 ]  一様分布+変数変換

連続型確率変数の計算問題です。○ の中に □ をランダムに描いたら広さはどれくらいか、
というシンプルな問い掛けに対して、答えを出すのに長い時間を要するのだなぁと感じます。

[ 5 ]  推測統計 ( 理論 )

小問は 2 つですが、チェビシェフの不等式、大数の法則、不偏推定量、モーメント母関数、
中心極限定理と扱う題材は盛りだくさんです。ネイピア数 e の重要性が垣間見えますね。

[ 6 ]  推測統計 ( 実践 )

[ 5 ] で示した事柄を運用してみようというつながりで、母比率の推定、検定がテーマです。
正規分布表なしで 「ド・モアブル=ラプラスの定理」 を使う問題は少しレアかもしれません。

[PR]
# by Rune-3 | 2017-08-15 22:30

LLN & CLT

基本的な確率分布における大数の法則 (LLN) と中心極限定理 (CLT) を証明してみます。

まず、土台となる仮定 & 示すべき結論 を下の黒板にまとめておき、順に進めていきます。

b0299705_07005589.png

【 1 】 LLN の証明 … 2 行目はいわゆる 「チェビシェフの不等式」 です。期待値 E は

    離散型で Σ、連続型で ∫ ですが、不等号の駆使でその場合分けも省けますね。

b0299705_07010178.png

【 2 】 標準正規分布のモーメント母関数 … 定義にしたがって、素直に計算していきます。

    最後の行は 平行移動 + 全区間の積分が 1 という合わせ技で計算量カットです。

b0299705_07010685.png

【 3 】 標準化 Sn のモーメント母関数 … こちらは長丁場です。必要な文字の置き換え、

    分布の特徴を押さえた変形、さらにべき級数展開と、フルコースとも言える内容です。

b0299705_07011158.png

【 4 】 CLT の証明 … 上記 2 つの関数が近づくことを示します。 an は n の指数を

    追いかけて、あとは e の定義式に立ち返れば 【 2 】 の計算結果と結びつきます。

b0299705_07011846.png

LLN は証明付きで CLT はなし、という本しか手元にないため、モーメント母関数の力を

存分に借りることで、ようやく大事な理論の 「橋渡し」 ができたのかな、という感じがします。


7 月 22 日は円周率近似値の日 ( 22/7 ≒ 3.14 ) ということで、そのお祝い記事として

画像内では LLN : 3 行、CLT : 14 行の証明にまとまりましたね!将来的にはもう少し

仮定を緩めたバージョンも着手したいところです。画像外 15 行でお届けしました。(^^)/

[PR]
# by Rune-3 | 2017-07-22 09:26 | チョコボ

6,000,000 m の道

2017 年のうちに達成したい目標の 1 つが実現したので、この記事で報告させて頂きます。


愛羽紹介 & 回帰分析 という 2 つの用途から、神殿と都市のスプリントのみ単走タイムを

取っていましたが、後々のことを考えると別の競羽場や距離のデータも集めたほうが研究が

捗りそうだなぁと思い、それなら 3000 レース くらいやろうか、という運びになりました。

b0299705_18415652.png

上記画像では全体の 5 %にも満たない量ですが、今月が終わる前に 100 %埋め尽くす

ことができました。 少ない日は 0 レース、多いときには 1 日 250 レースを超えることも

ありましたが、途中で折れず無事に完走できたことは大きな自信と宝物になったと思います。


約 3000 レース、走行距離に換算すると 6000 km くらいになっていたので、地球の半径

( ≒ 6378.137 km ) 近くを羽たちと走ったことになるんですね。 FF 5 後半にバッツとボコが

世界を一周するイベントがありますが、リアルの世界で自分と羽たちがそれを達成する日は

はたして来るのでしょうか。(^^; 十分なリフレッシュが終わったら、また走りたいですね。b

[PR]
# by Rune-3 | 2017-06-23 21:00 | チョコボ