Teorie chyb

« 5. Intervalové odhady
» 7. Chyby dvojrozměrné

6. Vícerozměrná náhodná veličina

Úvod

Vícerozměrnou, přesněji $n$-rozměrnou náhodnou veličinou budeme nazývat $n$-rozměrný vektor, jehož všechny složky jsou náhodné veličiny. Podrobně si všimneme dvojrozměrné náhodné veličiny - tedy náhodného vektoru ${\left(x,y\right)}^T$.

Její zákon rozdělení může být popsán ve formě tzv. sdružené distribuční funkce $F(x,y)$, která je definována jako pravděpodobnost, že náhodná veličina $x$ nabude hodnoty menší než $x_i$ a současně náhodná veličina $y$ hodnoty menší než $y_j$, tj.

$$} 
F\left(x_i,y_i\right)=P\left(x<x_i,y<y_j\right). 
$$

Sdružená distribuční funkce má tyto vlastnosti:

Její hodnoty leží v intervalu $\left\langle 0,1\right\rangle $, je funkcí neklesající a spojitou zleva vzhledem ke každé z náhodných veličin. Splňuje podmínky:

$$
F\left({\rm -}\infty {\rm ,}y_j\right){\rm =}F\left(x_i{\rm ,-}\infty \right){\rm =}F\left({\rm -}\infty {\rm ,-}\infty \right){\rm =0},   
$$

$$
F\left(\infty {\rm ,}\infty \right){\rm =1}. 
$$

Pravděpodobnost, že náhodná veličina $x$ nabude hodnoty z intervalu $\left\langle x_1,x_2\right\rangle $ a současně náhodná veličina $y$ hodnoty z intervalu $\left\langle y_1,y_2\right\rangle $ bude

$$
P\left(x_1\le x<x_2,y_1\le y<y_2\right)=P\left(x<x_2,y<y_2\right) - P\left(x<x_1,y<y_2\right) - P\left(x<x_2,\ y<y_1\right) + P\left(x<x_1,y<y_1\right)
$$

tedy

$$
P\left(x_1\le x<x_2,y_1\le y<y_2\right)=F\left(x_2,y_2\right) - F\left(x_1,y_2\right) - F\left(x_2,y_1\right) + F(x_1,y_1).
$$

Uvažujeme-li pouze pravděpodobnost, že náhodná veličina $x$ nabude hodnoty menší než $x_i$ bez jakéhokoliv omezení veličiny $y$ (tedy v celém možném rozsahu), potom

$$
P\left(x<x_i,y<\infty \right)=F\left(x_i,\infty \right)=F_1(x_i) 
$$

a pravděpodobnost, že náhodná veličina $y$ nabude hodnoty menší než $y_j$ bez ohledu na hodnotu veličiny $x$, bude

$$ 
P\left(x<\infty ,\ y<y_j\right)=F\left(\infty ,y_j\right)=F_2(y_j).      
$$

Vidíme, že se jedná o jednorozměrné distribuční funkce, které se nazývají marginální (okrajové) distribuční funkce veličiny $x$ (s indexem 1), respektive $y$ (s indexem 2).

Jestliže každá veličina může nabýt pouze spočetného počtu hodnot (obě veličiny jsou diskrétní), vyjadřujeme jejich zákon rozdělení také sdruženými pravděpodobnostmi, že náhodná veličina $x$ nabude hodnoty $x_i$ a současně náhodná veličina $y$ nabude hodnoty $y_j$, tj.

$$
P\left(x=x_i,\ y=y_j\right)=P\left(x_j,y_j\right), 
$$

pro které platí:

$$
\sum_x{\sum_y{P(x,y)}=1}.         
$$

A také platí:

$$
P\left(x_1\le x\le x_2,y_1\le y\le y_2\right)=\sum^{x_2}_{x=x_1}{\sum^{y_2}_{y=y_1}{P(x,y)}}. 
$$

Marginální pravděpodobnosti jsou součtem sdružených pravděpodobností přes všechny hodnoty druhé veličiny a označíme je podobně pomocí indexů 1,2:

$$
P_1\left(x_i\right)=\sum_y{P\left(x_i,y\right)},\ P_2\left(y_j\right)=\sum_x{P\left(x,y_j\right)}.      
$$

U spojitých náhodných veličin $(x,y)$ existuje funkce ${}_2{\varphi }\left(x,y\right)$ taková, že

$$
F\left(x_i,y_j\right)=\int^{y_j}_{-\infty }{\left\{\int^{x_i}_{-\infty }{{\varphi }_2\left(x,y\right)dx}\right\}}dy.      
$$

Indexem 2 u $\varphi $ zdůrazňujeme, že se jedná o funkci dvojrozměrné náhodné veličiny. Funkce ${}_2{\varphi }\left(x,y\right)$ je sdružená hustota pravděpodobnosti náhodných veličin $x,\ y$ v bodě $x_i,\ y_j$, splňující podmínku nerovnosti ${}_2{\varphi }\left(x,y\right)\ge 0$ a podmínky

$$
\int^{\infty }_{{\rm -}\infty }{\left\{\int^{\infty }_{{\rm -}\infty }{{\varphi }_{{\rm 2}}\left(x,y\right)dx}\right\}}dy{\rm =1,\ } 
$$

$$
P\left(x_{{\rm 1}}\le x\le x_{{\rm 2}}{\rm ,\ }y_{{\rm 1}}\le y\le y_{{\rm 2}}\right){\rm =\ }\int^{y_j}_{y_{{\rm 1}}}{\left\{\int^{x_i}_{x_{{\rm 1}}}{{\varphi }_{{\rm 2}}\left(x,y\right)dx}\right\}}dy.    
$$

Charakteristiky vícerozměrné náhodné veličiny

Základními charakteristikami dvojrozměrné náhodné veličiny $(x,y)$ jsou jako u jednorozměrných rozdělení charakteristiky polohy, proměnlivosti, šikmosti a špičatosti, které informují o tvaru marginálního rozdělení veličiny $x$ a marginálního rozdělení veličiny $y$.

Všechny uvedené charakteristiky popisují rozdělení náhodných veličin, neříkají však nic o intenzitě (těsnosti) vztahu mezi oběma veličinami. Těsnost vztahu měří kovariancekovariance $cov(x,y)$, která je definována jako střední hodnota součinu odchylek obou veličin od jejich středních hodnot

$$
cov\left(x,y\right)=E\left\{\left(x-E\left(x\right)\right)\cdot \left(y-E\left(y\right)\right)\right\}\ .\  
$$

Pro její výpočet se prakticky používá tvar

$$
cov\left(x,y\right)=E\left(x,y\right)-E\left(x\right)\cdot E(y).       
$$

Na kovarianci je založen koeficient korelace

$$
\rho \left(x,y\right)=\frac{cov(x,y)}{\sigma (x)\cdot \sigma \left(y\right)},          
$$

který je bezrozměrnou charakteristikou těsnosti lineárního vztahu mezi dvěma veličinami. Koeficient korelace nabývá hodnot z intervalu $\left\langle -1,+1\right\rangle $. Jestliže je koeficient korelace nulový, potom veličiny $(x,\ y)$ se nazývají veličinami nekorelovanými. Tyto hodnoty nemusí být nezávislé, jelikož nulová hodnota korelačního koeficientu je nutnou, ale není podmínkou postačující pro nezávislost veličin. Může existovat velmi těsný, ale nelineární regresní vztah, na který není koeficient korelace citlivý.

Charakteristiky $k$-rozměrné náhodné veličiny ${\mathbf x}={\left(x_1,\ x_2,...,\ x_k\right)}^T$ (náhodného vektoru) jsou střední hodnota $E({\mathbf x})\ =\ {\left(E\left(x_1\right),E\left(x_2\right),...,E\left(x_k\right)\right)}^T$ a kovariance společně s variancemi ve formě kovarianční matice ${\mathbf \Sigma }$ při označení $C_{ii}={\sigma }^2_i$ a $C_{ij}=cov(x_i,x_j)$.

$$
{\mathbf \Sigma }=\left( \begin{array}{cccc}
C_{11} & C_{12} & \cdots  & C_{1k} \\ 
C_{21} & C_{22} & \cdots  & C_{2k} \\ 
\vdots  & \vdots  & \ddots  & \vdots  \\ 
C_{k1} & C_{k2} & \cdots  & C_{kk} \end{array}
\right).        
$$

Matice ${\mathbf \Sigma }$ je symetrická matice, pro kovariance platí $C_{ij}=C_{ji}$, na hlavní úhlopříčce jsou variance jednotlivých veličin. Z prvků kovarianční matice mohou být vypočteny hodnoty korelačních koeficientů

$$
\rho \left(x,y\right)=\frac{C_{ij}}{\sqrt{C_{ii}C_{jj}}},         
$$

které lze sestavit do tzv. korelační matice

$$
{\mathbf \rho }=\left( \begin{array}{cccc}
1 & {\rho }_{12} & \cdots  & {\rho }_{1k} \\ 
{\rho }_{21} & 1 & \cdots  & {\rho }_{2k} \\ 
\vdots  & \vdots  & \ddots  & \vdots  \\ 
{\rho }_{k1} & {\rho }_{k2} & \cdots  & 1 \end{array}
\right),         
$$

která je opět symetrická, protože platí ${\rho }_{ij}={\rho }_{ji}$.

Vícerozměrné normální rozdělení pravděpodobnosti

Z vícerozměrných normálních rozdělení je pro geodézii nejdůležitější dvojrozměrné normální rozdělení, což je rozdělení náhodné veličiny $(x_1,x_2)$ se sdruženou hustotou pravděpodobnosti

$$
{\varphi }_2\left(x_1,x_2\right)=\frac{1}{2\pi {\sigma }_1{\sigma }_2\sqrt{(1-{\rho }^2)}}e^{\frac{1}{2(1-{\rho }^2)}\left\{\frac{{\left(x_1-E\left(x_1\right)\right)}^2}{{\sigma }^2_1}+\frac{{\left(x_2-E\left(x_2\right)\right)}^2}{{\sigma }^2_2}-2\rho \frac{\left(x_1-E\left(x_1\right)\right)\left(x_2-E\left(x_2\right)\right)}{{\sigma }_1{\sigma }_2}\right\}},     
$$

kde $E(x_1)$, $E(x_2)$ jsou střední hodnoty, $\sigma^2_1$ a $\sigma^2_2$ variance a $\rho $ koeficient korelace mezi oběma veličinami. V případě nezávislosti obou veličin je $\rho =0$ a jejich sdružená hustota pravděpodobnosti je

$$
{\varphi }_2\left(x_1,x_2\right)=\frac{1}{2\pi {\sigma }_1{\sigma }_2}e^{-\frac{1}{2}\left\{\frac{{\left(x_1-E\left(x_1\right)\right)}^2}{{\sigma }^2_1}+\frac{{\left(x_2-E\left(x_2\right)\right)}^2}{{\sigma }^2_2}\right\}}.      
$$


« 5. Intervalové odhady
» 7. Chyby dvojrozměrné

Slovník

 
04_teorie_chyb/0406_vicerozmerna_nahodna_velicina.txt · Poslední úprava: 2016/06/01 07:48 (upraveno mimo DokuWiki)
Recent changes RSS feed Creative Commons License Valid XHTML 1.0 Valid CSS Driven by DokuWiki
Drupal Garland Theme for Dokuwiki