ステラ牧場

cafestella.exblog.jp

チョコボのブログです。

ブログトップ

確率・統計の演習

半年ほど確率・統計の分野を少しずつ学び続けて、そろそろアウトプット用の記事もほしい

ということで、テストを作ってみました。 大問は 6 つで、時間は 90 ~ 120 分が目安です。

b0299705_19420833.png

★ 各設問の内容について

[ 1 ]  記述統計+回帰分析

最初の問題ということもあり、やさしめに作りました。もし 2 試験の得点データが破損して
いても、相関係数さえ残っていれば偏差値ベースの回帰直線は描くことは可能なんですね。

[ 2 ]  ポアソン分布+指数分布

平均が安定している 2 つの分布の導出がテーマです。人数と間隔 ( X と T ) の対応を
押さえることがメインですが、それらの平均や分散も計算できるようになっておきたいです。

[ 3 ]  多項分布+幾何分布

離散型確率変数の計算問題です。(1) の前半は 条件付き+最大確率 という融合問題で
(2) は表向きの表現は異なるものの、いわゆる 「クーポンコレクター問題」 が土台ですね。

[ 4 ]  一様分布+変数変換

連続型確率変数の計算問題です。○ の中に □ をランダムに描いたら広さはどれくらいか、
というシンプルな問い掛けに対して、答えを出すのに長い時間を要するのだなぁと感じます。

[ 5 ]  推測統計 ( 理論 )

小問は 2 つですが、チェビシェフの不等式、大数の法則、不偏推定量、モーメント母関数、
中心極限定理と扱う題材は盛りだくさんです。ネイピア数 e の重要性が垣間見えますね。

[ 6 ]  推測統計 ( 実践 )

[ 5 ] で示した事柄を運用してみようというつながりで、母比率の推定、検定がテーマです。
正規分布表なしで 「ド・モアブル=ラプラスの定理」 を使う問題は少しレアかもしれません。

[PR]
# by Rune-3 | 2017-08-15 22:30

LLN & CLT

基本的な確率分布における大数の法則 (LLN) と中心極限定理 (CLT) を証明してみます。

まず、土台となる仮定 & 示すべき結論 を下の黒板にまとめておき、順に進めていきます。

b0299705_07005589.png

【 1 】 LLN の証明 … 2 行目はいわゆる 「チェビシェフの不等式」 です。期待値 E は

    離散型で Σ、連続型で ∫ ですが、不等号の駆使でその場合分けも省けますね。

b0299705_07010178.png

【 2 】 標準正規分布のモーメント母関数 … 定義にしたがって、素直に計算していきます。

    最後の行は 平行移動 + 全区間の積分が 1 という合わせ技で計算量カットです。

b0299705_07010685.png

【 3 】 標準化 Sn のモーメント母関数 … こちらは長丁場です。必要な文字の置き換え、

    分布の特徴を押さえた変形、さらにべき級数展開と、フルコースとも言える内容です。

b0299705_07011158.png

【 4 】 CLT の証明 … 上記 2 つの関数が近づくことを示します。 an は n の指数を

    追いかけて、あとは e の定義式に立ち返れば 【 2 】 の計算結果と結びつきます。

b0299705_07011846.png

LLN は証明付きで CLT はなし、という本しか手元にないため、モーメント母関数の力を

存分に借りることで、ようやく大事な理論の 「橋渡し」 ができたのかな、という感じがします。


7 月 22 日は円周率近似値の日 ( 22/7 ≒ 3.14 ) ということで、そのお祝い記事として

画像内では LLN : 3 行、CLT : 14 行の証明にまとまりましたね!将来的にはもう少し

仮定を緩めたバージョンも着手したいところです。画像外 15 行でお届けしました。(^^)/

[PR]
# by Rune-3 | 2017-07-22 09:26 | チョコボ

6,000,000 m の道

2017 年のうちに達成したい目標の 1 つが実現したので、この記事で報告させて頂きます。


愛羽紹介 & 回帰分析 という 2 つの用途から、神殿と都市のスプリントのみ単走タイムを

取っていましたが、後々のことを考えると別の競羽場や距離のデータも集めたほうが研究が

捗りそうだなぁと思い、それなら 3000 レース くらいやろうか、という運びになりました。

b0299705_18415652.png

上記画像では全体の 5 %にも満たない量ですが、今月が終わる前に 100 %埋め尽くす

ことができました。 少ない日は 0 レース、多いときには 1 日 250 レースを超えることも

ありましたが、途中で折れず無事に完走できたことは大きな自信と宝物になったと思います。


約 3000 レース、走行距離に換算すると 6000 km くらいになっていたので、地球の半径

( ≒ 6378.137 km ) 近くを羽たちと走ったことになるんですね。 FF 5 後半にバッツとボコが

世界を一周するイベントがありますが、リアルの世界で自分と羽たちがそれを達成する日は

はたして来るのでしょうか。(^^; 十分なリフレッシュが終わったら、また走りたいですね。b

[PR]
# by Rune-3 | 2017-06-23 21:00 | チョコボ

重回帰の決定係数

本記事は以前に取り上げた重回帰の補足的な内容になります。そのリンクは下からどうぞ。

単回帰では 「決定係数」 というものを扱いましたが、上記リンクの重回帰ではそれに触れて

いませんでした。 それをカバーしながら、ベクトルの内積を主軸とした回帰係数の求め方を

思いついたので、ここに記しておきます。 和の記号 Σ を書かないライトな形になりました。

b0299705_20031833.png

 上から 3 つめの赤字がおそらく最大の難所なので、つかみにくいようなら実際に成分を

表示して、きちんと積が計算されていることを紙に書いて確認してみると様子がわかります。

なお、u の二乗平均 ≧ 0 より、単回帰なら -1 ≦ 相関係数 ≦ 1 も導出できています。


これでモデルの適合度を表す決定係数がわかりました。 内積の威力が強く出ていますね。

上記結果に基づき、リンク先の 80 羽が作った回帰モデルで計算すると 0.9917 となり、

99 %以上の適合度となっていた模様です。重回帰は原因の個数が増えると決定係数は

大きくなりやすく、その調整を施した 「自由度修正済み決定係数」 というものを使うことが

多いそうです。そちらで計算しても 0.9914 だったので、サンプル数が十分なら修正値も

大きな変動はあまりないと考えてよさそうですね。以上、重回帰の補足記事でした。(^^)/

[PR]
# by Rune-3 | 2017-06-02 21:00 | チョコボ

スタンプラリー まとめ

当牧場で行われているスタンプラリーのまとめ記事です。 最終更新日:2017.05/12

part 00  ルール説明
part 01  シルフスペース ♀ T:447 ( 143-159-132-13 )
part 02  メルセオーダー ♂ T:457 ( 159-157-126-15 )
part 03  シルフメーヴェ  ♀ T:463 ( 136-165-148-14 )
part 04  ウインドホルン  ♂ T:466 ( 139-172-142-13 )
part 05  シルフリップル  ♀ T:476 ( 164-156-141-15 )
part 06  エリアルダーツ ♂ T:478 ( 160-168-136-14 )
part 07  ステラフィーユ  ♀ T:480 ( 169-157-142-12 )
part 08  準備中

[PR]
# by Rune-3 | 2017-05-12 21:10 | スタンプラリー