Chapter 7 Sampling distributions and the Central Limit Theorem
Kap 7.2, forts
Påminnelse om två viktiga statistikor :
(En statistika är en funktion av en uppsättning iid slumpvariabler \(Y_1\) , \(Y_2\) , … , \(Y_n\) )
-
\(\bar{Y}\) = \(\displaystyle \frac{ Y_1+Y_2+… +Y_n}{n}\)
-
\(S^2\) = \(\frac{ \bigl(Y_1-\bar{Y} \bigr )^2+\bigl(Y_2-\bar{Y} \bigr )^2+… +\bigl(Y_n-\bar{Y} \bigr )^2}{n-1}\)
Om statistikan Stickprovsvariansen \(S^2\)
Eftersom \(S^2\) är en statistika , dvs en funktion av slumpvariabler, så är \(S^2\) själv en slumpvariabel.
Dags att fundera på sannolikhetsfördelningen för denna slumpvariabel \(S^2\) .
\(S^2\) följer ingen känd fördelning, men däremot följer statistikan \(\frac{(n-1)S^2}{\sigma^2}\) en Chitvå-fördelning med \(n-1\) frihetsgrader.
En förutsättning för detta är dock att slumpvariablerna \(Y_1\) , \(Y_2\) , … , \(Y_n\) är normalfördelade.
.
Beviset av detta finns i kursboken (sats 7.3 med efterföljande bevis) Detta bevis ingår dock inte i kursfordringarna för denna kurs.
Räkneexempel
Exempel 1
Inkomsten i en population är normalfördelad med \(\sigma^{2}=20\) kronor. Om vi drar ett slumpmässigt stickprov på 10 individer, vad är sannolikheten att vi får en stickprovsvarians som är större än 15 men mindre än 25?
Lösning Exempel 1
\(P\left( 15\leq S^{2}\leq 25\right)\) = \(P\left( \frac{\left( n-1\right) 15}{\sigma ^{2}}\leq \frac{\left(n-1\right) S^{2}}{\sigma^{2}}\leq \frac{\left( n-1\right) 25}{\sigma ^{2}}\right)\) = \(P\left( \frac{9\cdot 15}{20}\leq \frac{\left( n-1\right) S^{2}}{\sigma^{2}}\leq \frac{9\cdot 25}{20}\right)\) = \(P\left(6.25\leq \frac{\left( n-1\right) S^{2}}{\sigma ^{2}}\leq 11.25\right)\) = \(P\left( \frac{\left( n-1\right) S^{2}}{\sigma ^{2}}\leq 11.25\right)\) – \(P\left( \frac{\left( n-1\right) S^{2}}{\sigma ^{2}}\leq 6.25\right)\) =
{med hjälp av dator}
= \(0.74-0.29=0.45\) .
Exempel 2
Gör bokens exempel 7.5
Fler intressanta statistikor och deras sannolikhetsfördelningar
Om t-fördelningen
Statistikan \(\displaystyle \frac{\bar{Y}-\mu}{\frac{S}{\sqrt{n}}}\) följer en t-fördelning med \(n-1\) frihetsgrader,
under förutsättning att \(Y_1\) , \(Y_2\) , … , \(Y_n\) är iid och att \(Y_i\) är normalfördelade.
Lite teori
Definition av t-fördelning (Definition 7.2)
Låt \(Z\sim N\left( 0;1\right)\) och \(U\sim \chi^2 \left( n-1 \right)\) .
Om \(Z\) och \(U\) är oberoende,
då är kvoten \(T=\frac{Z}{\left( U/\left( n-1\right) \right) ^{1/2}}\)
t-fördelad med \(n-1\) frihetsgrader.
Kvoten kan skrivas om som \(T=\frac{\frac{\bar{Y}-\mu }{\sigma /n^{1/2}}}{\left( \left[ \frac{\left(n-1\right) S^{2}}{\sigma ^{2}}\right] /\left( n-1\right) \right) ^{1/2}}\) =
\(\frac{\frac{\bar{Y}-\mu }{\sigma /n^{1/2}}}{\frac{S}{\sigma }}=\frac{\bar{Y}-\mu }{S/n^{1/2}}\)
Exempel 3
Gör bokens exempel 7.6
Om F-fördelningen
Statistikan \(\frac{S_{1}^{2}/\sigma_{1}^{2}}{S_{2}^{2}/\sigma_{2}^{2}}\) följer en F-fördelning med \(n_1-1\) och \(n_2-1\) frihetsgrader,
under förutsättning att vi har två oberoende stickprov från varsin normalfördelad population.
Lite teori
Definition av F-fördelning (Definition 7.3)
Låt \(W_1\sim \chi^2 \left( n_1-1 \right)\) och \(W_2\sim \chi^2 \left( n_2-1 \right)\) vara två oberoende slumpvariabler.
Då är kvoten \(F=\frac{W_{1}/\left( n_{1}-1\right) }{W_{2}/\left(n_{2}-1\right) }\)
F-fördelad med \(n_1-1\) och \(n_2-1\) frihetsgrader.
Kvoten kan skrivas om som
\(F=\frac{W_{1}/\left( n_{1}-1\right) }{W_{2}/\left( n_{2}-1\right) }\) = \(\frac{\left[ \left( n_{1}-1\right) S_{1}^{2}/\sigma _{1}^{2}\right] /\left(n_{1}-1\right) }{\left[ \left( n_{2}-1\right) S_{2}^{2}/\sigma _{2}^{2}\right] /\left( n_{2}-1\right) }\) =
\(\frac{S_{1}^{2}/\sigma _{1}^{2}}{S_{2}^{2}/\sigma _{2}^{2}}\sim F\left(n_{1}-1,n_{2}-1\right)\)
Exempel 4
Gör bokens exempel 7.7
// add bootstrap table styles to pandoc tables $(document).ready(function () { $('tr.header').parent('thead').parent('table').addClass('table table-condensed'); });