Kromě charakteristik náhodných veličin je nejúplnější charakteristikou tzv. rozdělení pravděpodobnosti náhodné veličiny, které je udáno vzorcem, grafem, či tabulkou. Uvedeme zde v naší disciplíně nejpoužívanější rozdělení, jak pro diskrétní, tak pro spojité náhodné proměnné a to binomické rozdělení a normální rozdělení. Dále v řadě matematicko - statistických úloh mají zvláštní význam tři rozdělení, která jsou odvozena z normálního rozdělení. Jsou to rozdělení χ2 (čteme chí-kvadrát), Studentovo t-rozdělení a Snedecorovo - Fischerovo F-rozdělení.
Binomické rozdělení
Pro diskrétní náhodnou proměnnou používáme v grafickém vyjádření nejčastěji sloupcovitý graf, zvaný histogram a typickým rozdělením je tzv. binomické rozdělení použitelné při opakovaném pokusu (či měření téže veličiny) za stejných podmínek. Náhodnou veličinou je zde počet výskytů k určitého jevu x (počet chyb stejného znaménka) při provedení n opakování.
Pravděpodobnost je dána vztahem
Pn(k)=(nk)pkqn−kprok=0…n,
kde jsme označili pravděpodobnost zkoumaného jevu p a opačnou pravděpodobnost (pravděpodobnost, že zkoumaný jev nenastane) q=1−p. Tento vztah se též nazývá frekvenční funkcí a pravděpodobnost, že se náhodná proměnná uskuteční až do konkrétního počtu x je dána distribuční funkcí danou zde vztahem:
F(x)=x=0∑k(nx)pxqn−xprox∈⟨0,k⟩.
Základními charakteristikami binomického rozdělení jsou:
E(x)=n⋅p,
V(x)=σ2=n⋅p⋅q.
Normální rozdělení (Laplace - Gaussovo)
Toto rozdělení je nejdůležitějším rozdělením spojité náhodné veličiny, kterým lze za jistých podmínek aproximovat i některá rozdělení diskrétní. Obecně lze říci, že toto rozdělení je použitelné všude tam, kde kolísání náhodné veličiny je způsobeno součtem velkého počtu nepatrných a vzájemně nezávislých vlivů. Matematickým odvozením normálního rozdělení se nebudeme zabývat, velmi názorně však ilustruje vznik normálního rozdělení případ binomického rozdělení s pravděpodobnostmi p=q=0,5 (pravděpodobnost výskytu kladné a záporné chyby) a s rostoucím n→∞.
Hustota pravděpodobnosti normálního rozdělení je dána frekvenční funkcí, jejíž graf je znám pod názvem „Gaussova křivka“:
φ(x)=σ2π1⋅e−2⋅σ2(x−E(x))2,x∈(−∞,+∞).
Tato frekvenční funkce má dva parametry a to střední hodnotu E(x) (může být libovolná) a varianci V(x)=E{x−E(x)}2=σ2. Normální rozdělení značíme N(E(x),σ2). Frekvenční funkce má vrchol v bodě x=E(x). Distribuční funkce normálního rozdělení bude
F(x)=∫−∞xφ(x)dx.
Z dalších charakteristik uvedeme momenty
μ3(x)=0=μ3(t),
μ4(x)=3⋅σ4,
μ4(t)−3=0.
Uvedeme zde také normovanou veličinu t, která se získá transformací
t=σ(x−E(x)).
Tato veličina má normované normální rozdělení N(0,1), protože platí relace E(t)=0, V(t)=1. Hustota pravděpodobnosti veličiny t bude
Obě funkce se tabelují a tyto tabulky se používají i pro stanovení hodnot hustoty pravděpodobnosti i distribuční funkce nenormovaného normálního rozdělení.
Při praktických aplikacích se při výpočtech vždy nejdříve přechází z náhodné veličiny x na normovanou veličinu t, s výhodou se použijí tabulky φ(t) a F(t) a přejde se zpět na veličinu x. Tabelace obou funkcí se často omezuje na nezáporná t. Hodnoty pro t<0 se odvozují ze vztahů
φ(−t)=φ(t),
F(−t)=1−F(t).
V praxi se často využívá symetrie frekvenční funkce normálního rozdělení a tabeluje se místo distribuční funkce tzv. Laplaceova funkce (pro t≥0)
G(t)=2π1⋅∫0te−2t2dt=F(t)−0,5,
pro kterou platí následující relace: G(0)=0; G(∞)=0,5; G(−t)=−G(t); G(−∞)=−0,5.
Pro stanovení pravděpodobnosti, že náhodná veličina s rozdělením N(E(x);σ2) nabude hodnoty z nějakého intervalu (x1,x2) postupujeme tak, že stanovíme dolní mez normované veličiny t1, stanovíme dolní mez normované veličiny t2:
Parametr n′ se nazývá počet stupňů volnosti a je roven počtu nezávislých prvků (počet všech prvků zmenšený o počet lineárních vztahů mezi nimi) a rozdělení se značí χ2(n′). Funkce Γ (Eulerův integrál) je pro p>0 definována:
Γ(p)=∫0∞xp−1e−xdx.
Pro celá p platí:
Γ(p)=(p−1)!.
Např. platí Γ(21)=π. Střední hodnota bude: E(χ2)=n′ a variance V(χ2)=2⋅n′. Distribuční funkce bude
Fn′(χ2)=22n′Γ(2n′)1∫0χ2e−2χ2(χ2)2n′−1dχ2
a bývá tabelována pro různé počty stupňů volnosti n′ a hodnoty χ2. Místo distribuční funkce jsou často tabelovány:
a) kvantily χP2, tj. hodnoty, které splňují pro dané n′ vztah
P(χ2<χP2)=P,
b) nebo kritické hodnoty χα2, tj. hodnoty, které splňují pro dané n′ vztah
P(χ2>χα2)=α=1−P.
α nazýváme hladinou významnosti či rizikem.
Studentovo t-rozdělení
Mějme dvě nezávislé veličiny U a χ2. Veličina U nechť má rozdělení N(0;1) a veličina χ2 rozdělení χ2(n′). Potom hustota pravděpodobnosti veličiny
t=n′χ2U
bude
φn′(t)=Γ(2n′)πn′Γ(2n′+1)(1+n′t2)−2n′+1, pro t∈(−∞,+∞) a n′=1,2,…
Rozdělení s hustotou pravděpodobnosti φn′(t) se nazývá Studentovo t-rozdělení (autorem odvození byl Gosset, píšící pod pseudonymem Student) o n′ stupních volnosti a označuje se t(n′). Počet stupňů volnosti je dán počtem stupňů volnosti veličiny ve jmenovateli veličiny t.
Rozdělení t je symetrické s jedním vrcholem v bodě t=0. Pro n′>30 lze velmi dobře Studentovo t-rozdělení nahradit normovaným normálním rozdělením N(0;1). Tabelují se:
a) hodnoty distribuční funkce Fn′(t),
b) kvantily tP pro argument P, n′,
c) kritické hodnoty tα pro argument α,n′.
Při tabelaci kritických hodnot pouze pro α<0,5 se kritické hodnoty pro α>0,5 stanoví ze vztahu tα=−t1−α=−tP , což současně platí i pro kvantily tP.
Rozdělení F (Snedecorovo - Fisherovo)
Mějme dvě nezávislé veličiny y1 a y2. Veličina y1 má rozdělení χ2(n1′) a veličina y2 rozdělení χ2(n2′). Potom veličina
F=n′2y2n′1y1
má Snedecorovo (Fisherovo) F-rozdělení s hustotou pravděpodobnosti
Rozdělení s hustotou pravděpodobnosti φn1′,n2′(F) se nazývá Snedecorovo F-rozdělení s n1′, n2′ stupni volnosti a značí se F(n1′,n2′). Přitom n1′ (n2′) je počet stupňů volnosti náhodné veličiny χ12, (χ22) v čitateli (jmenovateli) náhodné veličiny F. Tabelují se:
a) kvantily FP(n1′,n2′) pro argument P, n1′, n2′,
b) kritické hodnoty Fα(n1′,n2′) pro argument α, n1′,n2′.
V případě tabelace kritických hodnot pouze pro hodnoty α<0,5, použijeme pro výpočet hodnot pro α>0,5 vztah F1−α(n1′,n2′)=1/Fα(n2′,n1′), což znamená, že za 100⋅(1−α) procentní kritickou hodnotu rozdělení F(n1′,n2′) použijeme reciprokou hodnotu 100⋅α procentní kritické hodnoty rozdělení F(n2′,n1′), tedy z rozdělení se zaměněnými počty stupňů volnosti.