Teorie chyb

« 3. Přesnost měření
» 5. Intervalové odhady

4. Některá rozdělení náhodných veličin

Úvod

Kromě charakteristik náhodných veličin je nejúplnější charakteristikou tzv. rozdělení pravděpodobnosti náhodné veličiny, které je udáno vzorcem, grafem, či tabulkou. Uvedeme zde v naší disciplíně nejpoužívanější rozdělení, jak pro diskrétní, tak pro spojité náhodné proměnné a to binomické rozdělení a normální rozdělení. Dále v řadě matematicko - statistických úloh mají zvláštní význam tři rozdělení, která jsou odvozena z normálního rozdělení. Jsou to rozdělení ${\chi }^2$ (čteme chí-kvadrát), Studentovo $t$-rozdělení a Snedecorovo - Fischerovo $F$-rozdělení.

Binomické rozdělení

Pro diskrétní náhodnou proměnnou používáme v grafickém vyjádření nejčastěji sloupcovitý graf, zvaný histogram a typickým rozdělením je tzv. binomické rozdělení použitelné při opakovaném pokusu (či měření téže veličiny) za stejných podmínek. Náhodnou veličinou je zde počet výskytů $k$ určitého jevu $x$ (počet chyb stejného znaménka) při provedení $n$ opakování.

Pravděpodobnost je dána vztahem

$P_n\left(k\right)=\left(\begin{array}{c}
n \\ 
k\end{array}
\right)p^kq^{n-k}$ pro $k=0\dots \ n$,

kde jsme označili pravděpodobnost zkoumaného jevu $p$ a opačnou pravděpodobnost (pravděpodobnost, že zkoumaný jev nenastane) $q=\ 1\ -\ p$. Tento vztah se též nazývá frekvenční funkcí a pravděpodobnost, že se náhodná proměnná uskuteční až do konkrétního počtu $x$ je dána distribuční funkcí danou zde vztahem:

$F\left(x\right)=\sum^k_{x=0}{\left( \begin{array}{c}
n \\ 
x \end{array}
\right)p^xq^{n-x}}$ pro $x\in \ \left\langle 0,\ k\right\rangle $.

Základními charakteristikami binomického rozdělení jsou:

$$
E\left(x\right)=n\cdot p,           
$$

$$
V\left(x\right)={\sigma }^2=n\cdot p\cdot q.         
$$

Normální rozdělení (Laplace - Gaussovo)

Toto rozdělení je nejdůležitějším rozdělením spojité náhodné veličiny, kterým lze za jistých podmínek aproximovat i některá rozdělení diskrétní. Obecně lze říci, že toto rozdělení je použitelné všude tam, kde kolísání náhodné veličiny je způsobeno součtem velkého počtu nepatrných a vzájemně nezávislých vlivů. Matematickým odvozením normálního rozdělení se nebudeme zabývat, velmi názorně však ilustruje vznik normálního rozdělení případ binomického rozdělení s pravděpodobnostmi $p=q=0,5$ (pravděpodobnost výskytu kladné a záporné chyby) a s rostoucím $n\to \infty $.

Hustota pravděpodobnosti normálního rozdělení je dána frekvenční funkcí, jejíž graf je znám pod názvem „Gaussova křivka“:

$$
\varphi \left(x\right)=\frac{1}{\sigma \sqrt{2\pi }}\cdot e^{-\frac{{\left(x-E\left(x\right)\right)}^2}{2\cdot {\sigma }^2}} ,  x\in \left(-\infty ,+\infty \right). 
$$

Tato frekvenční funkce má dva parametry a to střední hodnotu $E(x)$ (může být libovolná) a varianci $V(x)=E{\left\{x-E\left(x\right)\right\}}^2={\sigma }^2$. Normální rozdělení značíme $N(E(x),\ {\sigma }^2)$. Frekvenční funkce má vrchol v bodě $x=E(x)$. Distribuční funkce normálního rozdělení bude

$$
F\left(x\right)=\int^x_{-\infty }{\varphi \left(x\right)\ dx}.         
$$

Z dalších charakteristik uvedeme momenty

$$
{\mu }_3\left(x\right)=0={\mu }_3\left(t\right),         
$$

$$
{\mu }_4\left(x\right)=3\cdot {\sigma }^4,         
$$

$$
{\mu }_4\left(t\right)-3=0.         
$$

Uvedeme zde také normovanou veličinu $t$, která se získá transformací

$$
t=\frac{\left(x-E\left(x\right)\right)}{\sigma }.            
$$

Tato veličina má normované normální rozdělení $N(0,1)$, protože platí relace $E(t)\ =\ 0$, $V(t)=1$. Hustota pravděpodobnosti veličiny $t$ bude

$$
\varphi \left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot e^{-\frac{t^2}{2}} ,  t\in \left(-\infty ,+\infty \right) 
$$

a distribuční funkce

$$
F\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_{-\infty }{e^{-\frac{t^2}{2}}\ dt}.         
$$

Normální rozdělení

Obr. 1 Normální rozdělení $N(0,1)$

Obě funkce se tabelují a tyto tabulky se používají i pro stanovení hodnot hustoty pravděpodobnosti i distribuční funkce nenormovaného normálního rozdělení.

Při praktických aplikacích se při výpočtech vždy nejdříve přechází z náhodné veličiny $x$ na normovanou veličinu $t$, s výhodou se použijí tabulky $\varphi(t)$ a $F(t)$ a přejde se zpět na veličinu $x$. Tabelace obou funkcí se často omezuje na nezáporná $t$. Hodnoty pro $t<0$ se odvozují ze vztahů

$$
\varphi \left(-t\right)=\varphi \left(t\right),         
$$

$$
F\left(-t\right)=1-F\left(t\right).         
$$

V praxi se často využívá symetrie frekvenční funkce normálního rozdělení a tabeluje se místo distribuční funkce tzv. Laplaceova funkce (pro $t\ge 0$)

$$
G\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_0{e^{-\frac{t^2}{2}}\ dt}=F\left(t\right)-0,5,       
$$

pro kterou platí následující relace: $G(0)=0$; $G(\infty )=0,5$; $G(-t)=-G(t)$; $G(-\infty )$$=-0,5$.

Pro stanovení pravděpodobnosti, že náhodná veličina s rozdělením $N(E(x);{\sigma }^2)$ nabude hodnoty z nějakého intervalu $\left(x_1,\ x_2\right)$ postupujeme tak, že stanovíme dolní mez normované veličiny $t_1$, stanovíme dolní mez normované veličiny $t_2$:

$$
t_{{\rm 1}}{\rm =}\frac{\left(x_{{\rm 1}}{\rm -}E\left(x\right)\right)}{\sigma },          
$$

$$
t_{{\rm 2}}{\rm =}\frac{\left(x_{{\rm 2}}{\rm -}E\left(x\right)\right)}{\sigma }.          
$$

Hledaná pravděpodobnost pak bude:

$$
P\left(x_1<x<x_2\right)=P\left(t_1<t<t_2\right)=F\left(t_2\right)-F\left(t_1\right)=G\left(t_2\right)-G(t_1) 
$$

Rozdělení Chí-kvadrát

Uvažujme $n'$ náhodných veličin $U_1$, $U_2$, …, $U_{n^'}$, které jsou vzájemně nezávislé a každá z nich má normální rozdělení $N(0;1)$. Potom rozdělení součtu čtverců

$$
{\chi }^2=\sum^{n'}_{i=1}{U^2_i} 
$$

těchto veličin má tzv. ${\chi }^2$-rozdělení s hustotou pravděpodobnosti

$$
{\varphi }_{n'}\left({\chi }^2\right)=\frac{1}{2^{\frac{n^'}{2}}\Gamma \left(\frac{n^'}{2}\right)}e^{-\frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n^'}{2}-1}.        
$$

Chí-kvadrát rozdělení

Obr. 2 $\chi $${}^{2}$ rozdělení

Parametr $n'$ se nazývá počet stupňů volnosti a je roven počtu nezávislých prvků (počet všech prvků zmenšený o počet lineárních vztahů mezi nimi) a rozdělení se značí ${\chi }^2\left(n^'\right)$. Funkce $\Gamma $ (Eulerův integrál) je pro $p>0$ definována:

$$
\Gamma \left(p\right)=\int^{\infty }_0{x^{p-1}e^{-x}\ dx}.        
$$

Pro celá $p$ platí:

$$
\Gamma \left(p\right)=\left(p-1\right)!.          
$$

Např. platí $\Gamma \left(\frac{1}{2}\right)=\sqrt{\pi }$. Střední hodnota bude: $E({\chi }^2)=n'$ a variance $V\left({\chi }^2\right)=2\cdot n'$. Distribuční funkce bude

$$
F_{n'}\left({\chi }^2\right)=\frac{1}{2^{\frac{n^'}{2}}\Gamma \left(\frac{n^'}{2}\right)}\int^{{\chi }^2}_0{e^{-\ \frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n^'}{2}-1}}\ d{\chi }^2 
$$

a bývá tabelována pro různé počty stupňů volnosti $n'$ a hodnoty ${\chi }^2$. Místo distribuční funkce jsou často tabelovány:

  • a) kvantily ${\chi }^2_P$, tj. hodnoty, které splňují pro dané $n'$ vztah

$$
P\left({\chi }^{{\rm 2}}{\rm <}{\chi }^{{\rm 2}}_P\right){\rm =}P,         
$$

  • b) nebo kritické hodnoty ${\chi }^2_{\alpha }$, tj. hodnoty, které splňují pro dané $n'$ vztah

$$ \label{GrindEQ__2_94_} 
P\left({\chi }^{{\rm 2}}{\rm >}{\chi }^{{\rm 2}}_{\alpha }\right){\rm =}\alpha {\rm =1-}P.        
$$

$\alpha $ nazýváme hladinou významnosti či rizikem.

Studentovo t-rozdělení

Mějme dvě nezávislé veličiny $U$ a ${\chi }^2$. Veličina $U$ nechť má rozdělení $N(0;1)$ a veličina ${\chi }^2$ rozdělení ${\chi }^2(n')$. Potom hustota pravděpodobnosti veličiny

$$
t=\frac{U}{\sqrt{\frac{{\chi }^2}{n'}}} 
$$

bude

${\varphi }_{n'}\left(t\right)=\frac{\Gamma \left(\frac{n'+1}{2}\right)}{\Gamma \left(\frac{n'}{2}\right)\sqrt{\pi \ n'}}{\left(1+\frac{t^2}{n'}\right)}^{-\frac{n'+1}{2}}$, pro $t\in \left(-\infty ,+\infty \right)$ a $n'=1,\ 2,\ \dots $

Distribuční funkce bude:

$$
F_{n'}\left(t\right)    =\int^t_{-\infty }{{\varphi }_{n'}\left(t\right)\ dt}.        
$$

Studentovo t-rozdělení

Obr. 3 Studentovo $t$-rozdělení

Rozdělení s hustotou pravděpodobnosti ${\varphi }_{n^'}\left(t\right)$ se nazývá Studentovo $t$-rozdělení (autorem odvození byl Gosset, píšící pod pseudonymem Student) o $n'$ stupních volnosti a označuje se $t(n')$. Počet stupňů volnosti je dán počtem stupňů volnosti veličiny ve jmenovateli veličiny $t$.

Rozdělení t je symetrické s jedním vrcholem v bodě $t\ =\ 0$. Pro $n'\ >\ 30$ lze velmi dobře Studentovo $t$-rozdělení nahradit normovaným normálním rozdělením $N(0;1)$. Tabelují se:

  • a) hodnoty distribuční funkce $F_{n'}(t)$,
  • b) kvantily $t_P$ pro argument $P$, $n'$,
  • c) kritické hodnoty $t_{\alpha }$ pro argument $\alpha $,$n'$.

Při tabelaci kritických hodnot pouze pro $\alpha \ <\ 0,5$ se kritické hodnoty pro $\alpha \ >\ 0,5$ stanoví ze vztahu $t_{\alpha }=-t_{1-\alpha }=-\ t_P$ , což současně platí i pro kvantily $t_P$.

Rozdělení F (Snedecorovo - Fisherovo)

Mějme dvě nezávislé veličiny $y_1$ a $y_2$. Veličina $y_1$ má rozdělení ${\chi }^2(n_1')$ a veličina $y_2$ rozdělení ${\chi }^2(n_2')$. Potom veličina

$$
F=\frac{\frac{y_1}{{n'}_1}}{\frac{y_2}{{n'}_2}} 
$$

má Snedecorovo (Fisherovo) $F$-rozdělení s hustotou pravděpodobnosti

$$
{\varphi }_{n'_1,n'_2}\left(F\right)=\frac{\Gamma \left(\frac{n'_1+n'_2}{2}\right)}{\Gamma \left(\frac{n'_1}{2}\right)\Gamma \left(\frac{n'_2}{2}\right)}{\left(\frac{n'_1}{n'_2}\right)}^{\frac{n'_1}{2}}F^{\frac{n'_1}{2}-1}{\left(1+\frac{n'_1}{n'_2}\right)}^{-\left(\frac{n'_1+n'_2}{2}\right)}.    
$$

Distribuční funkce bude

$$ \label{GrindEQ__2_100_} 
F_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right){\rm =}\int^F_0{{\varphi }_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right)dF}.        
$$

Snedecorovo - Fisherovo F-rozdělení

Obr. 4 Snedecorovo - Fisherovo $F$-rozdělení

Rozdělení s hustotou pravděpodobnosti ${\varphi }_{n'_1,n'_2}\left(F\right)$ se nazývá Snedecorovo $F$-rozdělení s $n_1'$, $n_2'$ stupni volnosti a značí se $F(n_1',n_2')$. Přitom $n_1'$ ($n_2'$) je počet stupňů volnosti náhodné veličiny ${\chi }^2_1$, (${\chi }^2_2$) v čitateli (jmenovateli) náhodné veličiny $F$. Tabelují se:

  • a) kvantily $F_P(n_1',n_2')$ pro argument $P$, $n_1'$, $n_2'$,
  • b) kritické hodnoty $F_{\alpha }(n_1',n_2')$ pro argument $\alpha $, $n_1'$,$n_2'$.

V případě tabelace kritických hodnot pouze pro hodnoty $\alpha <0,5$, použijeme pro výpočet hodnot pro $\alpha >0,5$ vztah $F_{1-\alpha }(n_1',n_2')\ =\ 1/F_{\alpha }(n_2',n_1')$, což znamená, že za $100\cdot (1-\alpha )$ procentní kritickou hodnotu rozdělení $F(n_1',n_2')$ použijeme reciprokou hodnotu $100\cdot \alpha $ procentní kritické hodnoty rozdělení $F(n_2',n_1')$, tedy z rozdělení se zaměněnými počty stupňů volnosti.


« 3. Přesnost měření
» 5. Intervalové odhady

Slovník

 
04_teorie_chyb/0404_nektera_rozdeleni_nahodny_velicin.txt · Poslední úprava: 2016/06/01 07:48 (upraveno mimo DokuWiki)
Recent changes RSS feed Creative Commons License Valid XHTML 1.0 Valid CSS Driven by DokuWiki
Drupal Garland Theme for Dokuwiki