« 3. Přesnost měření
» 5. Intervalové odhady
Kromě charakteristik náhodných veličin je nejúplnější charakteristikou tzv. rozdělení pravděpodobnosti náhodné veličiny, které je udáno vzorcem, grafem, či tabulkou. Uvedeme zde v naší disciplíně nejpoužívanější rozdělení, jak pro diskrétní, tak pro spojité náhodné proměnné a to binomické rozdělení a normální rozdělení. Dále v řadě matematicko - statistických úloh mají zvláštní význam tři rozdělení, která jsou odvozena z normálního rozdělení. Jsou to rozdělení ${\chi }^2$ (čteme chí-kvadrát), Studentovo $t$-rozdělení a Snedecorovo - Fischerovo $F$-rozdělení.
Pro diskrétní náhodnou proměnnou používáme v grafickém vyjádření nejčastěji sloupcovitý graf, zvaný histogram a typickým rozdělením je tzv. binomické rozdělení použitelné při opakovaném pokusu (či měření téže veličiny) za stejných podmínek. Náhodnou veličinou je zde počet výskytů $k$ určitého jevu $x$ (počet chyb stejného znaménka) při provedení $n$ opakování.
Pravděpodobnost je dána vztahem
$$ P_n\left(k\right)=\left(\begin{array}{c}n \\ k\end{array}\right)p^kq^{n-k} \quad pro \quad k=0\dots \ n , $$
kde jsme označili pravděpodobnost zkoumaného jevu $p$ a opačnou pravděpodobnost (pravděpodobnost, že zkoumaný jev nenastane) $q=\ 1\ -\ p$. Tento vztah se též nazývá frekvenční funkcí a pravděpodobnost, že se náhodná proměnná uskuteční až do konkrétního počtu $x$ je dána distribuční funkcí danou zde vztahem:
$$ F\left(x\right)=\sum^k_{x=0}{\left( \begin{array}{c}n \\ x \end{array}\right)p^xq^{n-x}} \quad pro \quad x\in \ \left\langle 0,\ k\right\rangle . $$
Základními charakteristikami binomického rozdělení jsou:
$$ E\left(x\right)=n\cdot p, $$
$$ V\left(x\right)={\sigma }^2=n\cdot p\cdot q. $$
Toto rozdělení je nejdůležitějším rozdělením spojité náhodné veličiny, kterým lze za jistých podmínek aproximovat i některá rozdělení diskrétní. Obecně lze říci, že toto rozdělení je použitelné všude tam, kde kolísání náhodné veličiny je způsobeno součtem velkého počtu nepatrných a vzájemně nezávislých vlivů. Matematickým odvozením normálního rozdělení se nebudeme zabývat, velmi názorně však ilustruje vznik normálního rozdělení případ binomického rozdělení s pravděpodobnostmi $p=q=0,5$ (pravděpodobnost výskytu kladné a záporné chyby) a s rostoucím $n\to \infty $.
Hustota pravděpodobnosti normálního rozdělení je dána frekvenční funkcí, jejíž graf je znám pod názvem „Gaussova křivka“:
$$ \varphi \left(x\right)=\frac{1}{\sigma \sqrt{2\pi }}\cdot e^{-\frac{{\left(x-E\left(x\right)\right)}^2}{2\cdot {\sigma }^2}} , x\in \left(-\infty ,+\infty \right). $$
Tato frekvenční funkce má dva parametry a to střední hodnotu $E(x)$ (může být libovolná) a varianci $V(x)=E{\left\{x-E\left(x\right)\right\}}^2={\sigma }^2$. Normální rozdělení značíme $N(E(x),\ {\sigma }^2)$. Frekvenční funkce má vrchol v bodě $x=E(x)$. Distribuční funkce normálního rozdělení bude
$$ F\left(x\right)=\int^x_{-\infty }{\varphi \left(x\right)\ dx}. $$
Z dalších charakteristik uvedeme momenty
$$ {\mu }_3\left(x\right)=0={\mu }_3\left(t\right), $$
$$ {\mu }_4\left(x\right)=3\cdot {\sigma }^4, $$
$$ {\mu }_4\left(t\right)-3=0. $$
Uvedeme zde také normovanou veličinu $t$, která se získá transformací
$$ t=\frac{\left(x-E\left(x\right)\right)}{\sigma }. $$
Tato veličina má normované normální rozdělení $N(0,1)$, protože platí relace $E(t)\ =\ 0$, $V(t)=1$. Hustota pravděpodobnosti veličiny $t$ bude
$$ \varphi \left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot e^{-\frac{t^2}{2}} , t\in \left(-\infty ,+\infty \right) $$
a distribuční funkce
$$ F\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_{-\infty }{e^{-\frac{t^2}{2}}\ dt}. $$
;#;
Obr. 1 Normální rozdělení $N(0,1)$
;#;
Obě funkce se tabelují a tyto tabulky se používají i pro stanovení hodnot hustoty pravděpodobnosti i distribuční funkce nenormovaného normálního rozdělení.
Při praktických aplikacích se při výpočtech vždy nejdříve přechází z náhodné veličiny $x$ na normovanou veličinu $t$, s výhodou se použijí tabulky $\varphi(t)$ a $F(t)$ a přejde se zpět na veličinu $x$. Tabelace obou funkcí se často omezuje na nezáporná $t$. Hodnoty pro $t<0$ se odvozují ze vztahů
$$ \varphi \left(-t\right)=\varphi \left(t\right), $$
$$ F\left(-t\right)=1-F\left(t\right). $$
V praxi se často využívá symetrie frekvenční funkce normálního rozdělení a tabeluje se místo distribuční funkce tzv. Laplaceova funkce (pro $t\ge 0$)
$$ G\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_0{e^{-\frac{t^2}{2}}\ dt}=F\left(t\right)-0,5, $$
pro kterou platí následující relace: $G(0)=0$; $G(\infty )=0,5$; $G(-t)=-G(t)$; $G(-\infty )$$=-0,5$.
Pro stanovení pravděpodobnosti, že náhodná veličina s rozdělením $N(E(x);{\sigma }^2)$ nabude hodnoty z nějakého intervalu $\left(x_1,\ x_2\right)$ postupujeme tak, že stanovíme dolní mez normované veličiny $t_1$, stanovíme dolní mez normované veličiny $t_2$:
$$ t_{{\rm 1}}{\rm =}\frac{\left(x_{{\rm 1}}{\rm -}E\left(x\right)\right)}{\sigma }, $$
$$ t_{{\rm 2}}{\rm =}\frac{\left(x_{{\rm 2}}{\rm -}E\left(x\right)\right)}{\sigma }. $$
Hledaná pravděpodobnost pak bude:
$$ P\left(x_1<x<x_2\right)=P\left(t_1<t<t_2\right)=F\left(t_2\right)-F\left(t_1\right)=G\left(t_2\right)-G(t_1) $$
Uvažujme $n'$ náhodných veličin $U_1, U_2, \dots U_{n'}$, které jsou vzájemně nezávislé a každá z nich má normální rozdělení $N(0;1)$. Potom rozdělení součtu čtverců
$$ {\chi }^2=\sum^{n'}_{i=1}{U^2_i} $$
těchto veličin má tzv. ${\chi }^2$-rozdělení s hustotou pravděpodobnosti
$$ {\varphi }_{n'}\left({\chi }^2\right)=\frac{1} {2^{\frac{n'}{2}}\Gamma \left(\frac{n'}{2}\right)}e ^{-\frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n'}{2}-1}. $$
;#;
Obr. 2 $\chi $${}^{2}$ rozdělení
;#;
Parametr $n'$ se nazývá počet stupňů volnosti a je roven počtu nezávislých prvků (počet všech prvků zmenšený o počet lineárních vztahů mezi nimi) a rozdělení se značí ${\chi }^2\left(n'\right)$. Funkce $\Gamma $ (Eulerův integrál) je pro $p>0$ definována:
$$ \Gamma \left(p\right)=\int^{\infty }_0{x^{p-1}e^{-x}\ dx}. $$
Pro celá $p$ platí:
$$ \Gamma \left(p\right)=\left(p-1\right)!. $$
Např. platí $\Gamma \left(\frac{1}{2}\right)=\sqrt{\pi }$. Střední hodnota bude: $E({\chi }^2)=n'$ a variance $V\left({\chi }^2\right)=2\cdot n'$. Distribuční funkce bude
$$ F_{n'}\left({\chi }^2\right)=\frac{1}{2^{\frac{n'}{2}}\Gamma \left(\frac{n'}{2}\right)}\int^{{\chi }^2}_0{e^{-\ \frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n'}{2}-1}}\ d{\chi }^2 $$
a bývá tabelována pro různé počty stupňů volnosti $n'$ a hodnoty ${\chi }^2$. Místo distribuční funkce jsou často tabelovány:
$$ P\left({\chi }^{{\rm 2}}{\rm <}{\chi }^{{\rm 2}}_P\right){\rm =}P, $$
$$ P\left({\chi }^{{\rm 2}}{\rm >}{\chi }^{{\rm 2}}_{\alpha }\right){\rm =}\alpha {\rm =1-}P. $$
$\alpha $ nazýváme hladinou významnosti či rizikem.
Mějme dvě nezávislé veličiny $U$ a ${\chi }^2$. Veličina $U$ nechť má rozdělení $N(0;1)$ a veličina ${\chi }^2$ rozdělení ${\chi }^2(n')$. Potom hustota pravděpodobnosti veličiny
$$ t=\frac{U}{\sqrt{\frac{{\chi }^2}{n'}}} $$
bude
${\varphi }_{n'}\left(t\right)=\frac{\Gamma \left(\frac{n'+1}{2}\right)}{\Gamma \left(\frac{n'}{2}\right)\sqrt{\pi \ n'}}{\left(1+\frac{t^2}{n'}\right)}^{-\frac{n'+1}{2}}$, pro $t\in \left(-\infty ,+\infty \right)$ a $n'=1,\ 2,\ \dots $
Distribuční funkce bude:
$$ F_{n'}\left(t\right) =\int^t_{-\infty }{{\varphi }_{n'}\left(t\right)\ dt}. $$
;#;
Obr. 3 Studentovo $t$-rozdělení
;#;
Rozdělení s hustotou pravděpodobnosti ${\varphi }_{n'}\left(t\right)$ se nazývá Studentovo $t$-rozdělení (autorem odvození byl Gosset, píšící pod pseudonymem Student) o $n'$ stupních volnosti a označuje se $t(n')$. Počet stupňů volnosti je dán počtem stupňů volnosti veličiny ve jmenovateli veličiny $t$.
Rozdělení t je symetrické s jedním vrcholem v bodě $t\ =\ 0$. Pro $n'\ >\ 30$ lze velmi dobře Studentovo $t$-rozdělení nahradit normovaným normálním rozdělením $N(0;1)$. Tabelují se:
Při tabelaci kritických hodnot pouze pro $\alpha \ <\ 0,5$ se kritické hodnoty pro $\alpha \ >\ 0,5$ stanoví ze vztahu $t_{\alpha }=-t_{1-\alpha }=-\ t_P$ , což současně platí i pro kvantily $t_P$.
Mějme dvě nezávislé veličiny $y_1$ a $y_2$. Veličina $y_1$ má rozdělení ${\chi }^2(n_1')$ a veličina $y_2$ rozdělení ${\chi }^2(n_2')$. Potom veličina
$$ F=\frac{\frac{y_1}{{n'}_1}}{\frac{y_2}{{n'}_2}} $$
má Snedecorovo (Fisherovo) $F$-rozdělení s hustotou pravděpodobnosti
$$ {\varphi }_{n'_1,n'_2}\left(F\right)=\frac{\Gamma \left(\frac{n'_1+n'_2}{2}\right)}{\Gamma \left(\frac{n'_1}{2}\right)\Gamma \left(\frac{n'_2}{2}\right)}{\left(\frac{n'_1}{n'_2}\right)}^{\frac{n'_1}{2}}F^{\frac{n'_1}{2}-1}{\left(1+\frac{n'_1}{n'_2}\right)}^{-\left(\frac{n'_1+n'_2}{2}\right)}. $$
Distribuční funkce bude
$$ F_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right){\rm =}\int^F_0{{\varphi }_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right)dF}. $$
;#;
Obr. 4 Snedecorovo - Fisherovo $F$-rozdělení
;#;
Rozdělení s hustotou pravděpodobnosti ${\varphi }_{n'_1,n'_2}\left(F\right)$ se nazývá Snedecorovo $F$-rozdělení s $n_1'$, $n_2'$ stupni volnosti a značí se $F(n_1',n_2')$. Přitom $n_1'$ ($n_2'$) je počet stupňů volnosti náhodné veličiny ${\chi }^2_1$, (${\chi }^2_2$) v čitateli (jmenovateli) náhodné veličiny $F$. Tabelují se:
V případě tabelace kritických hodnot pouze pro hodnoty $\alpha <0,5$, použijeme pro výpočet hodnot pro $\alpha >0,5$ vztah $F_{1-\alpha }(n_1',n_2')\ =\ 1/F_{\alpha }(n_2',n_1')$, což znamená, že za $100\cdot (1-\alpha )$ procentní kritickou hodnotu rozdělení $F(n_1',n_2')$ použijeme reciprokou hodnotu $100\cdot \alpha $ procentní kritické hodnoty rozdělení $F(n_2',n_1')$, tedy z rozdělení se zaměněnými počty stupňů volnosti.