User Tools

Site Tools


04_teorie_chyb:0404_nektera_rozdeleni_nahodny_velicin

This is an old revision of the document!


Teorie chyb

« 3. Přesnost měření
» 5. Intervalové odhady

4. Některá rozdělení náhodných veličin

Úvod

Kromě charakteristik náhodných veličin je nejúplnější charakteristikou tzv. rozdělení pravděpodobnosti náhodné veličiny, které je udáno vzorcem, grafem, či tabulkou. Uvedeme zde v naší disciplíně nejpoužívanější rozdělení, jak pro diskrétní, tak pro spojité náhodné proměnné a to binomické rozdělení a normální rozdělení. Dále v řadě matematicko - statistických úloh mají zvláštní význam tři rozdělení, která jsou odvozena z normálního rozdělení. Jsou to rozdělení χ2{\chi }^2 (čteme chí-kvadrát), Studentovo tt-rozdělení a Snedecorovo - Fischerovo FF-rozdělení.

Binomické rozdělení

Pro diskrétní náhodnou proměnnou používáme v grafickém vyjádření nejčastěji sloupcovitý graf, zvaný histogram a typickým rozdělením je tzv. binomické rozdělení použitelné při opakovaném pokusu (či měření téže veličiny) za stejných podmínek. Náhodnou veličinou je zde počet výskytů kk určitého jevu xx (počet chyb stejného znaménka) při provedení nn opakování.

Pravděpodobnost je dána vztahem

Pn(k)=(nk)pkqnkprok=0 n, P_n\left(k\right)=\left(\begin{array}{c}n \\ k\end{array}\right)p^kq^{n-k} \quad pro \quad k=0\dots \ n ,

kde jsme označili pravděpodobnost zkoumaného jevu pp a opačnou pravděpodobnost (pravděpodobnost, že zkoumaný jev nenastane) q= 1  pq=\ 1\ -\ p. Tento vztah se též nazývá frekvenční funkcí a pravděpodobnost, že se náhodná proměnná uskuteční až do konkrétního počtu xx je dána distribuční funkcí danou zde vztahem:

F(x)=x=0k(nx)pxqnxprox 0, k. F\left(x\right)=\sum^k_{x=0}{\left( \begin{array}{c}n \\ x \end{array}\right)p^xq^{n-x}} \quad pro \quad x\in \ \left\langle 0,\ k\right\rangle .

Základními charakteristikami binomického rozdělení jsou:

E(x)=np, E\left(x\right)=n\cdot p,

V(x)=σ2=npq. V\left(x\right)={\sigma }^2=n\cdot p\cdot q.

Normální rozdělení (Laplace - Gaussovo)

Toto rozdělení je nejdůležitějším rozdělením spojité náhodné veličiny, kterým lze za jistých podmínek aproximovat i některá rozdělení diskrétní. Obecně lze říci, že toto rozdělení je použitelné všude tam, kde kolísání náhodné veličiny je způsobeno součtem velkého počtu nepatrných a vzájemně nezávislých vlivů. Matematickým odvozením normálního rozdělení se nebudeme zabývat, velmi názorně však ilustruje vznik normálního rozdělení případ binomického rozdělení s pravděpodobnostmi p=q=0,5p=q=0,5 (pravděpodobnost výskytu kladné a záporné chyby) a s rostoucím nn\to \infty .

Hustota pravděpodobnosti normálního rozdělení je dána frekvenční funkcí, jejíž graf je znám pod názvem „Gaussova křivka“:

φ(x)=1σ2πe(xE(x))22σ2,x(,+). \varphi \left(x\right)=\frac{1}{\sigma \sqrt{2\pi }}\cdot e^{-\frac{{\left(x-E\left(x\right)\right)}^2}{2\cdot {\sigma }^2}} , x\in \left(-\infty ,+\infty \right).

Tato frekvenční funkce má dva parametry a to střední hodnotu E(x)E(x) (může být libovolná) a varianci V(x)=E{xE(x)}2=σ2V(x)=E{\left\{x-E\left(x\right)\right\}}^2={\sigma }^2. Normální rozdělení značíme N(E(x), σ2)N(E(x),\ {\sigma }^2). Frekvenční funkce má vrchol v bodě x=E(x)x=E(x). Distribuční funkce normálního rozdělení bude

F(x)=xφ(x) dx. F\left(x\right)=\int^x_{-\infty }{\varphi \left(x\right)\ dx}.

Z dalších charakteristik uvedeme momenty

μ3(x)=0=μ3(t), {\mu }_3\left(x\right)=0={\mu }_3\left(t\right),

μ4(x)=3σ4, {\mu }_4\left(x\right)=3\cdot {\sigma }^4,

μ4(t)3=0. {\mu }_4\left(t\right)-3=0.

Uvedeme zde také normovanou veličinu tt, která se získá transformací

t=(xE(x))σ. t=\frac{\left(x-E\left(x\right)\right)}{\sigma }.

Tato veličina má normované normální rozdělení N(0,1)N(0,1), protože platí relace E(t) = 0E(t)\ =\ 0, V(t)=1V(t)=1. Hustota pravděpodobnosti veličiny tt bude

φ(t)=12πet22,t(,+) \varphi \left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot e^{-\frac{t^2}{2}} , t\in \left(-\infty ,+\infty \right)

a distribuční funkce

F(t)=12πtet22 dt. F\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_{-\infty }{e^{-\frac{t^2}{2}}\ dt}.

<a id="obr040401"></a>Normální rozdělení ;#; Obr. 1 Normální rozdělení N(0,1)N(0,1) ;#;

Obě funkce se tabelují a tyto tabulky se používají i pro stanovení hodnot hustoty pravděpodobnosti i distribuční funkce nenormovaného normálního rozdělení.

Při praktických aplikacích se při výpočtech vždy nejdříve přechází z náhodné veličiny xx na normovanou veličinu tt, s výhodou se použijí tabulky φ(t)\varphi(t) a F(t)F(t) a přejde se zpět na veličinu xx. Tabelace obou funkcí se často omezuje na nezáporná tt. Hodnoty pro t<0t<0 se odvozují ze vztahů

φ(t)=φ(t), \varphi \left(-t\right)=\varphi \left(t\right),

F(t)=1F(t). F\left(-t\right)=1-F\left(t\right).

V praxi se často využívá symetrie frekvenční funkce normálního rozdělení a tabeluje se místo distribuční funkce tzv. Laplaceova funkce (pro t0t\ge 0)

G(t)=12π0tet22 dt=F(t)0,5, G\left(t\right)=\frac{1}{\sqrt{2\pi }}\cdot \int^t_0{e^{-\frac{t^2}{2}}\ dt}=F\left(t\right)-0,5,

pro kterou platí následující relace: G(0)=0G(0)=0; G()=0,5G(\infty )=0,5; G(t)=G(t)G(-t)=-G(t); G()G(-\infty )=0,5=-0,5.

Pro stanovení pravděpodobnosti, že náhodná veličina s rozdělením N(E(x);σ2)N(E(x);{\sigma }^2) nabude hodnoty z nějakého intervalu (x1, x2)\left(x_1,\ x_2\right) postupujeme tak, že stanovíme dolní mez normované veličiny t1t_1, stanovíme dolní mez normované veličiny t2t_2:

t1=(x1E(x))σ, t_{{\rm 1}}{\rm =}\frac{\left(x_{{\rm 1}}{\rm -}E\left(x\right)\right)}{\sigma },

t2=(x2E(x))σ. t_{{\rm 2}}{\rm =}\frac{\left(x_{{\rm 2}}{\rm -}E\left(x\right)\right)}{\sigma }.

Hledaná pravděpodobnost pak bude:

P(x1<x<x2)=P(t1<t<t2)=F(t2)F(t1)=G(t2)G(t1) P\left(x_1<x<x_2\right)=P\left(t_1<t<t_2\right)=F\left(t_2\right)-F\left(t_1\right)=G\left(t_2\right)-G(t_1)

Rozdělení Chí-kvadrát

Uvažujme nn' náhodných veličin U1,U2,UnU_1, U_2, \dots U_{n'}, které jsou vzájemně nezávislé a každá z nich má normální rozdělení N(0;1)N(0;1). Potom rozdělení součtu čtverců

χ2=i=1nUi2 {\chi }^2=\sum^{n'}_{i=1}{U^2_i}

těchto veličin má tzv. χ2{\chi }^2-rozdělení s hustotou pravděpodobnosti

φn(χ2)=12n2Γ(n2)eχ22(χ2)n21. {\varphi }_{n'}\left({\chi }^2\right)=\frac{1} {2^{\frac{n'}{2}}\Gamma \left(\frac{n'}{2}\right)}e ^{-\frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n'}{2}-1}.

<a id="obr040402"></a>Chí-kvadrát rozdělení ;#; Obr. 2 χ\chi 2{}^{2} rozdělení ;#;

Parametr nn' se nazývá počet stupňů volnosti a je roven počtu nezávislých prvků (počet všech prvků zmenšený o počet lineárních vztahů mezi nimi) a rozdělení se značí χ2(n){\chi }^2\left(n'\right). Funkce Γ\Gamma (Eulerův integrál) je pro p>0p>0 definována:

Γ(p)=0xp1ex dx. \Gamma \left(p\right)=\int^{\infty }_0{x^{p-1}e^{-x}\ dx}.

Pro celá pp platí:

Γ(p)=(p1)!. \Gamma \left(p\right)=\left(p-1\right)!.

Např. platí Γ(12)=π\Gamma \left(\frac{1}{2}\right)=\sqrt{\pi }. Střední hodnota bude: E(χ2)=nE({\chi }^2)=n' a variance V(χ2)=2nV\left({\chi }^2\right)=2\cdot n'. Distribuční funkce bude

Fn(χ2)=12n2Γ(n2)0χ2e χ22(χ2)n21 dχ2 F_{n'}\left({\chi }^2\right)=\frac{1}{2^{\frac{n'}{2}}\Gamma \left(\frac{n'}{2}\right)}\int^{{\chi }^2}_0{e^{-\ \frac{{\chi }^2}{2}}{\left({\chi }^2\right)}^{\frac{n'}{2}-1}}\ d{\chi }^2

a bývá tabelována pro různé počty stupňů volnosti nn' a hodnoty χ2{\chi }^2. Místo distribuční funkce jsou často tabelovány:

  • a) kvantily χP2{\chi }^2_P, tj. hodnoty, které splňují pro dané nn' vztah

P(χ2<χP2)=P, P\left({\chi }^{{\rm 2}}{\rm <}{\chi }^{{\rm 2}}_P\right){\rm =}P,

  • b) nebo kritické hodnoty χα2{\chi }^2_{\alpha }, tj. hodnoty, které splňují pro dané nn' vztah

P(χ2>χα2)=α=1P. P\left({\chi }^{{\rm 2}}{\rm >}{\chi }^{{\rm 2}}_{\alpha }\right){\rm =}\alpha {\rm =1-}P.

α\alpha nazýváme hladinou významnosti či rizikem.

Studentovo t-rozdělení

Mějme dvě nezávislé veličiny UU a χ2{\chi }^2. Veličina UU nechť má rozdělení N(0;1)N(0;1) a veličina χ2{\chi }^2 rozdělení χ2(n){\chi }^2(n'). Potom hustota pravděpodobnosti veličiny

t=Uχ2n t=\frac{U}{\sqrt{\frac{{\chi }^2}{n'}}}

bude

φn(t)=Γ(n+12)Γ(n2)π n(1+t2n)n+12{\varphi }_{n'}\left(t\right)=\frac{\Gamma \left(\frac{n'+1}{2}\right)}{\Gamma \left(\frac{n'}{2}\right)\sqrt{\pi \ n'}}{\left(1+\frac{t^2}{n'}\right)}^{-\frac{n'+1}{2}}, pro t(,+)t\in \left(-\infty ,+\infty \right) a n=1, 2, n'=1,\ 2,\ \dots

Distribuční funkce bude:

Fn(t)=tφn(t) dt. F_{n'}\left(t\right) =\int^t_{-\infty }{{\varphi }_{n'}\left(t\right)\ dt}.

<a id="obr040403"></a>Studentovo t-rozdělení ;#; Obr. 3 Studentovo tt-rozdělení ;#;

Rozdělení s hustotou pravděpodobnosti φn(t){\varphi }_{n'}\left(t\right) se nazývá Studentovo tt-rozdělení (autorem odvození byl Gosset, píšící pod pseudonymem Student) o nn' stupních volnosti a označuje se t(n)t(n'). Počet stupňů volnosti je dán počtem stupňů volnosti veličiny ve jmenovateli veličiny tt.

Rozdělení t je symetrické s jedním vrcholem v bodě t = 0t\ =\ 0. Pro n > 30n'\ >\ 30 lze velmi dobře Studentovo tt-rozdělení nahradit normovaným normálním rozdělením N(0;1)N(0;1). Tabelují se:

  • a) hodnoty distribuční funkce Fn(t)F_{n'}(t),
  • b) kvantily tPt_P pro argument PP, nn',
  • c) kritické hodnoty tαt_{\alpha } pro argument α\alpha ,nn'.

Při tabelaci kritických hodnot pouze pro α < 0,5\alpha \ <\ 0,5 se kritické hodnoty pro α > 0,5\alpha \ >\ 0,5 stanoví ze vztahu tα=t1α= tPt_{\alpha }=-t_{1-\alpha }=-\ t_P , což současně platí i pro kvantily tPt_P.

Rozdělení F (Snedecorovo - Fisherovo)

Mějme dvě nezávislé veličiny y1y_1 a y2y_2. Veličina y1y_1 má rozdělení χ2(n1){\chi }^2(n_1') a veličina y2y_2 rozdělení χ2(n2){\chi }^2(n_2'). Potom veličina

F=y1n1y2n2 F=\frac{\frac{y_1}{{n'}_1}}{\frac{y_2}{{n'}_2}}

má Snedecorovo (Fisherovo) FF-rozdělení s hustotou pravděpodobnosti

φn1,n2(F)=Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)n12Fn121(1+n1n2)(n1+n22). {\varphi }_{n'_1,n'_2}\left(F\right)=\frac{\Gamma \left(\frac{n'_1+n'_2}{2}\right)}{\Gamma \left(\frac{n'_1}{2}\right)\Gamma \left(\frac{n'_2}{2}\right)}{\left(\frac{n'_1}{n'_2}\right)}^{\frac{n'_1}{2}}F^{\frac{n'_1}{2}-1}{\left(1+\frac{n'_1}{n'_2}\right)}^{-\left(\frac{n'_1+n'_2}{2}\right)}.

Distribuční funkce bude

Fn1,n2(F)=0Fφn1,n2(F)dF. F_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right){\rm =}\int^F_0{{\varphi }_{n^{{\rm '}}_{{\rm 1}},n^{{\rm '}}_{{\rm 2}}}\left(F\right)dF}.

<a id="obr040404"></a>Snedecorovo - Fisherovo F-rozdělení ;#; Obr. 4 Snedecorovo - Fisherovo FF-rozdělení ;#;

Rozdělení s hustotou pravděpodobnosti φn1,n2(F){\varphi }_{n'_1,n'_2}\left(F\right) se nazývá Snedecorovo FF-rozdělení s n1n_1', n2n_2' stupni volnosti a značí se F(n1,n2)F(n_1',n_2'). Přitom n1n_1' (n2n_2') je počet stupňů volnosti náhodné veličiny χ12{\chi }^2_1, (χ22{\chi }^2_2) v čitateli (jmenovateli) náhodné veličiny FF. Tabelují se:

  • a) kvantily FP(n1,n2)F_P(n_1',n_2') pro argument PP, n1n_1', n2n_2',
  • b) kritické hodnoty Fα(n1,n2)F_{\alpha }(n_1',n_2') pro argument α\alpha , n1n_1',n2n_2'.

V případě tabelace kritických hodnot pouze pro hodnoty α<0,5\alpha <0,5, použijeme pro výpočet hodnot pro α>0,5\alpha >0,5 vztah F1α(n1,n2) = 1/Fα(n2,n1)F_{1-\alpha }(n_1',n_2')\ =\ 1/F_{\alpha }(n_2',n_1'), což znamená, že za 100(1α)100\cdot (1-\alpha ) procentní kritickou hodnotu rozdělení F(n1,n2)F(n_1',n_2') použijeme reciprokou hodnotu 100α100\cdot \alpha procentní kritické hodnoty rozdělení F(n2,n1)F(n_2',n_1'), tedy z rozdělení se zaměněnými počty stupňů volnosti.


« 3. Přesnost měření
» 5. Intervalové odhady

04_teorie_chyb/0404_nektera_rozdeleni_nahodny_velicin.1726558561.txt.gz · Last modified: 2024/09/17 07:36 by admin