**[[..:04_teorie_chyb|Teorie chyb]]** **<<** [[04_teorie_chyb:0403_presnost_mereni|3. Přesnost měření]]\\ **>>** [[04_teorie_chyb:0405_intervalove_odhady|5. Intervalové odhady]] 4. Některá rozdělení náhodných veličin ===== Úvod ===== ### Kromě charakteristik náhodných veličin je nejúplnější charakteristikou tzv. rozdělení pravděpodobnosti náhodné veličiny, které je udáno vzorcem, grafem, či tabulkou. Uvedeme zde v naší disciplíně nejpoužívanější rozdělení, jak pro diskrétní, tak pro spojité náhodné proměnné a to binomické rozdělení a normální rozdělení. Dále v řadě matematicko - statistických úloh mají zvláštní význam tři rozdělení, která jsou odvozena z normálního rozdělení. Jsou to rozdělení ${\chi }^2$ (čteme chí-kvadrát), Studentovo $t$-rozdělení a Snedecorovo - Fischerovo $F$-rozdělení. ### ===== Binomické rozdělení ===== ### Pro diskrétní náhodnou proměnnou používáme v grafickém vyjádření nejčastěji sloupcovitý graf, zvaný histogram a typickým rozdělením je tzv. binomické rozdělení použitelné při opakovaném pokusu (či měření téže veličiny) za stejných podmínek. Náhodnou veličinou je zde počet výskytů $k$ určitého jevu $x$ (počet chyb stejného znaménka) při provedení $n$ opakování. Pravděpodobnost je dána vztahem $P_n\left(k\right)=\left(\begin{array}{c} n \\ k\end{array} \right)p^kq^{n-k}$ pro $k=0\dots \ n$, kde jsme označili pravděpodobnost zkoumaného jevu $p$ a opačnou pravděpodobnost (pravděpodobnost, že zkoumaný jev nenastane) $q=\ 1\ -\ p$. Tento vztah se též nazývá frekvenční funkcí a pravděpodobnost, že se náhodná proměnná uskuteční až do konkrétního počtu $x$ je dána distribuční funkcí danou zde vztahem: $F\left(x\right)=\sum^k_{x=0}{\left( \begin{array}{c} n \\ x \end{array} \right)p^xq^{n-x}}$ pro $x\in \ \left\langle 0,\ k\right\rangle $. Základními charakteristikami binomického rozdělení jsou: $$ E\left(x\right)=n\cdot p, $$ $$ V\left(x\right)={\sigma }^2=n\cdot p\cdot q. $$ ### ===== Normální rozdělení (Laplace - Gaussovo) ===== ### Toto rozdělení je nejdůležitějším rozdělením spojité náhodné veličiny, kterým lze za jistých podmínek aproximovat i některá rozdělení diskrétní. Obecně lze říci, že toto rozdělení je použitelné všude tam, kde kolísání náhodné veličiny je způsobeno součtem velkého počtu nepatrných a vzájemně nezávislých vlivů. Matematickým odvozením normálního rozdělení se nebudeme zabývat, velmi názorně však ilustruje vznik normálního rozdělení případ binomického rozdělení s pravděpodobnostmi $p=q=0,5$ (pravděpodobnost výskytu kladné a záporné chyby) a s rostoucím $n\to \infty $. Hustota pravděpodobnosti normálního rozdělení je dána frekvenční funkcí, jejíž graf je znám pod názvem „Gaussova křivka": $$ \varphi \left(x\right)=\frac{1}{\sigma \sqrt{2\pi }}\cdot e^{-\frac{{\left(x-E\left(x\right)\right)}^2}{2\cdot {\sigma }^2}} , x\in \left(-\infty ,+\infty \right). $$ Tato frekvenční funkce má dva parametry a to střední hodnotu $E(x)$ (může být libovolná) a varianci $V(x)=E{\left\{x-E\left(x\right)\right\}}^2={\sigma }^2$. Normální rozdělení značíme $N(E(x),\ {\sigma }^2)$. Frekvenční funkce má vrchol v bodě $x=E(x)$. Distribuční funkce normálního rozdělení bude $$ F\left(x\right)=\int^x_{-\infty }{\varphi \left(x\right)\ dx}. $$ Z dalších charakteristik uvedeme momenty $$ {\mu }_3\left(x\right)=0={\mu }_3\left(t\right), $$ $$ {\mu }_4\left(x\right)=3\cdot {\sigma }^4, $$ $$ {\mu }_4\left(t\right)-3=0. $$ Uvedeme zde také normovanou veličinu $t$, která se získá transformací $$ t=\frac{\left(x-E\left(x\right)\right)}{\sigma }. $$ Tato veličina má normované normální rozdělení $N(0,1)$, protože platí relace $E(t)\ =\ 0$, $V(t)=1$. Hustota pravděpodobnosti veličiny $t$ bude $$ \varphi \left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot e^{-\frac{t^2}{2}} , t\in \left(-\infty ,+\infty \right) $$ a distribuční funkce $$ F\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_{-\infty }{e^{-\frac{t^2}{2}}\ dt}. $$ {{ :04_teorie_chyb:040401_normalni_rozdeleni.jpg }} ;#; Obr. 1 //Normální rozdělení// $N(0,1)$ ;#; Obě funkce se tabelují a tyto tabulky se používají i pro stanovení hodnot hustoty pravděpodobnosti i distribuční funkce nenormovaného normálního rozdělení. Při praktických aplikacích se při výpočtech vždy nejdříve přechází z náhodné veličiny $x$ na normovanou veličinu $t$, s výhodou se použijí tabulky $\varphi(t)$ a $F(t)$ a přejde se zpět na veličinu $x$. Tabelace obou funkcí se často omezuje na nezáporná $t$. Hodnoty pro $t<0$ se odvozují ze vztahů $$ \varphi \left(-t\right)=\varphi \left(t\right), $$ $$ F\left(-t\right)=1-F\left(t\right). $$ V praxi se často využívá symetrie frekvenční funkce normálního rozdělení a tabeluje se místo distribuční funkce tzv. Laplaceova funkce (pro $t\ge 0$) $$ G\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_0{e^{-\frac{t^2}{2}}\ dt}=F\left(t\right)-0,5, $$ pro kterou platí následující relace: $G(0)=0$; $G(\infty )=0,5$; $G(-t)=-G(t)$; $G(-\infty )$$=-0,5$. Pro stanovení pravděpodobnosti, že náhodná veličina s rozdělením $N(E(x);{\sigma }^2)$ nabude hodnoty z nějakého intervalu $\left(x_1,\ x_2\right)$ postupujeme tak, že stanovíme dolní mez normované veličiny $t_1$, stanovíme dolní mez normované veličiny $t_2$: $$ t_{{\rm 1}}{\rm =}\frac{\left(x_{{\rm 1}}{\rm -}E\left(x\right)\right)}{\sigma }, $$ $$ t_{{\rm 2}}{\rm =}\frac{\left(x_{{\rm 2}}{\rm -}E\left(x\right)\right)}{\sigma }. $$ Hledaná pravděpodobnost pak bude: $$ P\left(x_1{{ :04_teorie_chyb:040402_chi_kvadrat_rozdeleni.jpg }} ;#; Obr. 2 $\chi $${}^{2}$ //rozdělení// ;#; Parametr $n'$ se nazývá počet stupňů volnosti a je roven počtu nezávislých prvků (počet všech prvků zmenšený o počet lineárních vztahů mezi nimi) a rozdělení se značí ${\chi }^2\left(n^'\right)$. Funkce $\Gamma $ (Eulerův integrál) je pro $p>0$ definována: $$ \Gamma \left(p\right)=\int^{\infty }_0{x^{p-1}e^{-x}\ dx}. $$ Pro celá $p$ platí: $$ \Gamma \left(p\right)=\left(p-1\right)!. $$ Např. platí $\Gamma \left(\frac{1}{2}\right)=\sqrt{\pi }$. Střední hodnota bude: $E({\chi }^2)=n'$ a variance $V\left({\chi }^2\right)=2\cdot n'$. Distribuční funkce bude $$ F_{n'}\left({\chi }^2\right)=\frac{1}{2^{\frac{n^'}{2}}\Gamma \left(\frac{n^'}{2}\right)}\int^{{\chi }^2}_0{e^{-\ \frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n^'}{2}-1}}\ d{\chi }^2 $$ a bývá tabelována pro různé počty stupňů volnosti $n'$ a hodnoty ${\chi }^2$. Místo distribuční funkce jsou často tabelovány: * **a)** kvantily ${\chi }^2_P$, tj. hodnoty, které splňují pro dané $n'$ vztah $$ P\left({\chi }^{{\rm 2}}{\rm <}{\chi }^{{\rm 2}}_P\right){\rm =}P, $$ * **b)** nebo kritické hodnoty ${\chi }^2_{\alpha }$, tj. hodnoty, které splňují pro dané $n'$ vztah $$ \label{GrindEQ__2_94_} P\left({\chi }^{{\rm 2}}{\rm >}{\chi }^{{\rm 2}}_{\alpha }\right){\rm =}\alpha {\rm =1-}P. $$ $\alpha $ nazýváme hladinou významnosti či rizikem. ### ===== Studentovo t-rozdělení ===== ### Mějme dvě nezávislé veličiny $U$ a ${\chi }^2$. Veličina $U$ nechť má rozdělení $N(0;1)$ a veličina ${\chi }^2$ rozdělení ${\chi }^2(n')$. Potom hustota pravděpodobnosti veličiny $$ t=\frac{U}{\sqrt{\frac{{\chi }^2}{n'}}} $$ bude ${\varphi }_{n'}\left(t\right)=\frac{\Gamma \left(\frac{n'+1}{2}\right)}{\Gamma \left(\frac{n'}{2}\right)\sqrt{\pi \ n'}}{\left(1+\frac{t^2}{n'}\right)}^{-\frac{n'+1}{2}}$, pro $t\in \left(-\infty ,+\infty \right)$ a $n'=1,\ 2,\ \dots $ Distribuční funkce bude: $$ F_{n'}\left(t\right) =\int^t_{-\infty }{{\varphi }_{n'}\left(t\right)\ dt}. $$ {{ :04_teorie_chyb:040403_studentovo_rozdeleni.jpg }} ;#; Obr. 3 //Studentovo// $t$//-rozdělení// ;#; Rozdělení s hustotou pravděpodobnosti ${\varphi }_{n^'}\left(t\right)$ se nazývá Studentovo $t$-rozdělení (autorem odvození byl Gosset, píšící pod pseudonymem Student) o $n'$ stupních volnosti a označuje se $t(n')$. Počet stupňů volnosti je dán počtem stupňů volnosti veličiny ve jmenovateli veličiny $t$. Rozdělení t je symetrické s jedním vrcholem v bodě $t\ =\ 0$. Pro $n'\ >\ 30$ lze velmi dobře Studentovo $t$-rozdělení nahradit normovaným normálním rozdělením $N(0;1)$. Tabelují se: * **a)** hodnoty distribuční funkce $F_{n'}(t)$, * **b)** kvantily $t_P$ pro argument $P$, $n'$, * **c)** kritické hodnoty $t_{\alpha }$ pro argument $\alpha $,$n'$. Při tabelaci kritických hodnot pouze pro $\alpha \ <\ 0,5$ se kritické hodnoty pro $\alpha \ >\ 0,5$ stanoví ze vztahu $t_{\alpha }=-t_{1-\alpha }=-\ t_P$ , což současně platí i pro kvantily $t_P$. ### ===== Rozdělení F (Snedecorovo - Fisherovo) ===== ### Mějme dvě nezávislé veličiny $y_1$ a $y_2$. Veličina $y_1$ má rozdělení ${\chi }^2(n_1')$ a veličina $y_2$ rozdělení ${\chi }^2(n_2')$. Potom veličina $$ F=\frac{\frac{y_1}{{n'}_1}}{\frac{y_2}{{n'}_2}} $$ má Snedecorovo (Fisherovo) $F$-rozdělení s hustotou pravděpodobnosti $$ {\varphi }_{n'_1,n'_2}\left(F\right)=\frac{\Gamma \left(\frac{n'_1+n'_2}{2}\right)}{\Gamma \left(\frac{n'_1}{2}\right)\Gamma \left(\frac{n'_2}{2}\right)}{\left(\frac{n'_1}{n'_2}\right)}^{\frac{n'_1}{2}}F^{\frac{n'_1}{2}-1}{\left(1+\frac{n'_1}{n'_2}\right)}^{-\left(\frac{n'_1+n'_2}{2}\right)}. $$ Distribuční funkce bude $$ \label{GrindEQ__2_100_} F_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right){\rm =}\int^F_0{{\varphi }_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right)dF}. $$ {{ :04_teorie_chyb:040404_f_rozdeleni.jpg }} ;#; Obr. 4 //Snedecorovo - Fisherovo// $F$//-rozdělení// ;#; Rozdělení s hustotou pravděpodobnosti ${\varphi }_{n'_1,n'_2}\left(F\right)$ se nazývá Snedecorovo $F$-rozdělení s $n_1'$, $n_2'$ stupni volnosti a značí se $F(n_1',n_2')$. Přitom $n_1'$ ($n_2'$) je počet stupňů volnosti náhodné veličiny ${\chi }^2_1$, (${\chi }^2_2$) v čitateli (jmenovateli) náhodné veličiny $F$. Tabelují se: * **a)** kvantily $F_P(n_1',n_2')$ pro argument $P$, $n_1'$, $n_2'$, * **b)** kritické hodnoty $F_{\alpha }(n_1',n_2')$ pro argument $\alpha $, $n_1'$,$n_2'$. V případě tabelace kritických hodnot pouze pro hodnoty $\alpha <0,5$, použijeme pro výpočet hodnot pro $\alpha >0,5$ vztah $F_{1-\alpha }(n_1',n_2')\ =\ 1/F_{\alpha }(n_2',n_1')$, což znamená, že za $100\cdot (1-\alpha )$ procentní kritickou hodnotu rozdělení $F(n_1',n_2')$ použijeme reciprokou hodnotu $100\cdot \alpha $ procentní kritické hodnoty rozdělení $F(n_2',n_1')$, tedy z rozdělení se zaměněnými počty stupňů volnosti. ### ---- **<<** [[04_teorie_chyb:0403_presnost_mereni|3. Přesnost měření]]\\ **>>** [[04_teorie_chyb:0405_intervalove_odhady|5. Intervalové odhady]]