FC2ブログ

2012-03-22<<05<<統計学メモ

・区間推定

標本から母数を推定する原理

 

ある集団からランダムに標本を1つをとったところ58.5だった

この場合、母集団の平均は58.5とも言えなくはない

 

仮にこの状況で母数の分散が50であるとの情報が付加された場合

正規分布の性質から次のことが言える

「母集団の平均をμとし、そこからランダムに1つ抽出し、その値をXとすると、Xが以下の不等式を満たす可能性は0.95」

\mu-1.96\times \sqrt{50} \leq X \leq \mu+1.96 \times \sqrt{50}

X -1.96\times \sqrt{50} \leq \mu \leq X+1.96 \times \sqrt{50}

 

さて、上の例でランダムに抽出した1つの値が58.5だったので、上の式に代入すると

 

上の例では母集団の平均μは

58.5-1.96\times \sqrt{50} \leq \mu \leq 58.5 \times \sqrt{50}

44.6 \leq \mu \leq 72.4

 

したがって、上の例では

「確率0.95で、その母集団の平均は上の区間の中に入っている」

↑区間推定の考え方

 

0.95・・・信頼度

上の区間・・・信頼度95%に対する信頼区間

 

 

標本の分布がわかれば推定が可能

標本から求めたある推定量(標本平均や標本比率)に着目し、この統計量の確率分布を調べる。

その確率分布を下に母数を区間推定する。

スポンサーサイト



2012-03-22<<04<<統計学メモ

いきなりですが・・・

L(p)=p^3(1-p)^2

image

gnuplot> f(x)=x**3*(1-x)**2
gnuplot> set xr[0:1]
gnuplot> pl f(x)




\dfrac{d}{dp}\{ L(p) \} = 3p^2(1-p)^2-2p^3(1-p)




=-5p^2(1-p)(p-0.6)








ただしpは確率変数なので[0:1]



まあ、厳密な証明なしでも上のグラフからと微分式からp=0.6の時に最大になるというのはわかる



 



最尤推定法を例で調べる



→「現象は起こりやすいもとで起こる」



 



尤度関数




L(p)=p^m(1-p)^n



上と同じように微分しちゃいます



\dfrac{d}{dp}\{ L(p) \} = mp^{m-1}(1-p)^n-np^m(1-p)^{n-1}




=p^{m-1}(1-p)^{n-1}\{ m-p(m+n)\}








ただしpは確率変数なので[0:1]



故にL(p)は



p=\frac{m}{m+n}


の時に最大になることがわかる



補足 :

\dfrac{d}{dp}\{ L(p) \}

がp

 



「100人中45人が男の場合、一般的な男性の比率は45/100だろう」



という判断は最尤推定法に支えられていることがわかる。



 



ちなみに・・・






L(p)=p^{45}(1-p)^{55}



image




gnuplot> f(x)=x**45*(1-x)**55
gnuplot> set xr[0:1]
gnuplot> pl f(x)



 



言ってることは難しいが、やってることは大したことではない

2012-03-22<<03<<統計学メモ

点推定の方法

・モーメント法

大きさnの標本から算出される次の推定量

\hat{\mu}_k=\frac{X^k_1+X^k_2+\cdots+X^k_n}{n}

を原点の周りのk次のモーメント(積率)という

 

\hat{\mu}_1=\frac{X_1+X_2+\cdots+X_n}{n}

1次のモーメント

\hat{\mu}_2=\frac{X^2_1+X^2_2+\cdots+X^2_n}{n}

2次のモーメント

 

ここで

\hat{\mu}_1=\frac{X_1+X_2+\cdots+X_n}{n}=\overline{X}

また

\hat{\mu}_2=\frac{X^2_1+X^2_2+\cdots+X^2_n}{n}

を以下のように変形する

=\lbrace (X_1-\overline{X})^2+(X_2-\overline{X})^2+\cdots+(X_n-\overline{X})^2+2(X_1+X_2+\cdots+X_n)\overline{X}-n\overline{X}^2\rbrace / n

ここで

2(X_1+X_2+\cdots+X_n)\overline{X}=2n\overline{X}

なぜなら

\overline{X}=\frac{X_1+X_2+\cdots+X_n}{n}

故に上の式は

=\frac{(X_1-\overline{X})^2+(X_2-\overline{X})^2+\cdots+(X_n-\overline{X})^2}{n}+\overline{X}^2

と変形される

 

ここで分散の母数の推定量を

\hat{\sigma}^2=\frac{(X_1-\overline{X})^2+(X_2-\overline{X})^2+\cdots+(X_n-\overline{X})^2}{n}

とすると

上の式変形より

\hat{\sigma}^2=\hat{\mu_2}-\hat{\mu_1}^2

 

平均値や分散の定義式にそのまま標本から得られた1次、2次のモーメントの値を代入した結果がモーメント法の算出結果になる

 

        /// <summary>
/// n次モーメント
/// </summary>
/// <param name="dec">標本のdecimal型の配列</param>
/// <param name="n">n次モーメント</param>
/// <returns>n次モーメント</returns>
public static decimal moment(decimal[] dec,int n)
{

decimal sum = 0;
for (int x = 0; x < dec.GetLength(0); x++)
{
sum += decimal_pow(dec[x], n);
}
return sum / dec.GetLength(0);
}

/// <summary>
/// decimal型の累乗
/// </summary>
/// <param name="dec">decimal型/何を</param>
/// <param name="n">int型/何乗するか</param>
/// <returns>累乗された値</returns>
public static decimal decimal_pow(decimal dec, int n)
{
decimal pow = 1;
for (int i = 1; i <= n; ++i)
{
pow = pow * dec;
}
return pow;
}


 



例.97,100,103のサンプルから母集団の平均、分散を推定する



Image1778



            //モーメント法
decimal mom_1,mom_2;
decimal[] sample = new decimal[3];

sample[0] = 97;
sample[1] = 100;
sample[2] = 103;

mom_1 = stat.moment(sample, 1);
mom_2 = stat.moment(sample, 2);

Console.WriteLine("1次モーメント="+mom_1.ToString());
Console.WriteLine("2次モーメント=" + mom_2.ToString());
Console.WriteLine("母平均の推定値=" + mom_1.ToString());
Console.WriteLine("母分散の推定値=" + (mom_2-stat.decimal_pow(mom_1,2)).ToString());
Console.ReadLine();

2012-03-22<<02<<統計学メモ

点推定の条件

・母集団に関する情報を標本の情報から一意的に決めてしまう、極めて大胆な方法

・故に利用するのには制約がある

 

・不偏性

推定量の期待値が母数に一致する性質

母数を中心に、推定量が釣り合いよくばらついていることを意味する

 

・一致性

標本の大きさを増やすと推定量が母数に収束していく性質

 

・有効性

推定量の分散が小さいこと

分散が小さいと、推定量は母数の近辺に集中する(当然)

不偏性と一致性を備えた2つの推定量があるとき、その優劣を判断する判断材料になる。

特に最小の分散値を持つ推定量を最小分散性という。

2012-03-22<<01<<統計学メモ

・標本によって値が変動する

推定統計学

ランダムサンプリングで得た兵法ンを下に算出した推定値は抽出のたびに変動する(当たり前)

→標本変動

 

変動する標本平均などの集団の代表値から1つだけを抽出しようとする

→統計的推定

 

ex.nケの標本から平均を導き、母集団の平均を統計学的に推定する

\overline{X}=\frac{\overline{X_1}+\overline{X_2}+\cdots+\overline{X_n}}{n}

 

・用語

統計量

標本を得ることで値が確定する確率変数

平均値、分散、中央値、最頻値

母数

母集団の持つ特性値

母平均、母分散

推定量

母数を推定するために用いる統計量

母平均に対する標本平均、母分散に対する不偏分散

推定値

標本値から得られた推定量の値

平均値、不偏分散

母集団分布

母集団の個体の分布

正規分布

標本分布

推定量の分布

正規分布、2項分布、t分布

 

点推定

母集団に関する真の値を、ある一つの推定値で予想する方法

区間推定

例えば「95%の確率で、この区間に母数が入る」というような推定方法

ある確率を与えて、母集団に関する真の値が入る区間を提示する推定法

プロフィール

Naka210

Author:Naka210
FC2ブログへようこそ!

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR