Sección : Intervalos de confianza
Previo : Definiciones
Siguiente : Modelo lineal


Muestras gaussianas


Este parrafo está dedicado a la construcción de intervalos de confianza de la esperanza y la varianza para muestras gaussianas, o sea de la ley normal $ {\cal N}(\mu,\sigma^2)$. La ventaja de esta situación es que los estimadores naturales de la esperanza y de la varianza tienen leyes calculables explícitamente. Denotamos $ (X_1,\ldots,X_n)$ una muestra de la ley $ {\cal N}(\mu,\sigma^2)$, $ \overline{X}$ su media empírica y $ S^2$ su varianza empírica:

$\displaystyle \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i$   y$\displaystyle \quad
S^2 = \frac{1}{n}\sum_{i=1}^n (X_i -\overline{X})^2\;.
$


Damos a continuación, y admitiremos, los tres resultados que permiten calcular los intervalos de confianza de $ \mu$ y $ \sigma^2$.

Teorema 3.3   Si $ (X_1,\ldots,X_n)$ es una muestra de la ley $ {\cal N}(\mu,\sigma^2)$, entonces:
  1. $ \displaystyle{\sqrt{\frac{n}{\sigma^2}}\Big(\overline{X}-\mu\Big)}$ sigue la ley normal $ {\cal
N}(0,1)$.
  2. $ \displaystyle{\sqrt{\frac{n\!-\!1}{S^2}}\Big(\overline{X}-\mu\Big)}$ sigue la ley de Student $ {\cal T}(n\!-\!1)$.
  3. $ \displaystyle{\frac{nS^2}{\sigma^2}}$ sigue la ley de chi-cuadrado $ {\cal X}^2(n\!-\!1)$.


Las dos primeras afirmaciones sirven para estimar la esperanza $ \mu$ en el caso en que la varianza $ \sigma^2$ es conocida y en el caso en que es desconocida, respectivamente. Comencemos por suponer que $ \sigma^2$ es conocida. Pongamos $ z_\alpha = Q_{{\cal
N}(0,1)}(1-\alpha/2)$. El intervalo de dispersión optimal de nivel $ 1\!-\!\alpha$ para la ley $ {\cal
N}(0,1)$ es $ [-z_\alpha ,
z_\alpha]$. Hay dos valores de $ z_\alpha$ que son utilizados frecuentemente: para $ 1\!-\!\alpha=0.95$ y $ 0.99$, $ z_\alpha$ vale, respectivamente, $ 1.96$ y $ 2.5758$. De acuerdo con el inciso 1 del teorema 3.3, tenemos:

$\displaystyle \mathbb {P}\left[\,\sqrt{\frac{n}{\sigma^2}}\Big(\overline{X}-\mu\Big)
\in[-z_\alpha,z_\alpha]\,\right] =1-\alpha\;.
$

Pero:
$\displaystyle \sqrt{\frac{n}{\sigma^2}}\Big(\overline{X}-\mu\Big)
\in[-z_\alpha,z_\alpha]$ $\displaystyle \Longleftrightarrow$ $\displaystyle \overline{X}-\mu\in
\left[\,-z_\alpha\sqrt{\frac{\sigma^2}{n}}\,,\,
z_\alpha\sqrt{\frac{\sigma^2}{n}}\,\right]$  
  $\displaystyle \Longleftrightarrow$ $\displaystyle \mu\in
\left[\,\overline{X}-z_\alpha\sqrt{\frac{\sigma^2}{n}}\,,\,
\overline{X}+z_\alpha\sqrt{\frac{\sigma^2}{n}}\,\right]\;.$  

El intervalo:

$\displaystyle \left[\,\overline{X}-z_\alpha\sqrt{\frac{\sigma^2}{n}}\,,\,
\overline{X}+z_\alpha\sqrt{\frac{\sigma^2}{n}}\,\right]\;,
$

es por tanto un intervalo de confianza de nivel $ 1\!-\!\alpha$ para $ \mu$.

El caso en que $ \sigma^2$ es desconocida se trata de la misma forma, reemplazando la ley $ {\cal
N}(0,1)$ por la ley $ {\cal
T}(n-1)$. Sigue siendo una ley simétrica, para la cual el intervalo de dispersión optimal de nivel $ 1\!-\!\alpha$ es de la forma $ [-t_\alpha,t_\alpha]$, donde:

$\displaystyle t_\alpha = Q_{{\cal T}(n-1)}(1-\alpha/2)\;.
$


El mismo razonamiento conduce al siguiente intervalo de confianza para $ \mu$:

$\displaystyle \left[\,\overline{X}-t_\alpha\sqrt{\frac{S^2}{n-1}}\,,\,
\overline{X}+t_\alpha\sqrt{\frac{S^2}{n-1}}\,\right]\;.
$


Pasemos ahora a la estimación de $ \sigma^2$ a partir de $ S^2$. La ley de chi-cuadrado $ {\cal X}^2(n\!-\!1)$ no es simétrica y el intervalo de dispersión simétrico no es optimal. Denotaremos por $ u_\alpha$ y $ v_\alpha$ dos números reales positivos tales que $ [u_\alpha,v_\alpha]$ sea un intervalo de dispersión de nivel $ 1\!-\!\alpha$ para la ley $ {\cal X}^2(n\!-\!1)$. Podremos calcular el intervalo de dispersión optimal por un procedimiento de optimización numérico, o si no tomar el intervalo simétrico:

$\displaystyle u_\alpha =Q_{{\cal X}^2(n-1)}(\alpha/2)$   y$\displaystyle \quad v_\alpha
=Q_{{\cal X}^2(n-1)}(1-\alpha/2)\;.
$


De acuerdo con el inciso 3 del teorema 3.3, tenemos:

$\displaystyle \mathbb {P}\left[\,\frac{nS^2}{\sigma^2} \in [u_\alpha\,,\,v_\alpha] \,\right]
= 1-\alpha\;.
$

Pero:

$\displaystyle \frac{nS^2}{\sigma^2} \in [u_\alpha,v_\alpha]\;\Longleftrightarro...
...igma^2\in \left[\,\frac{nS^2}{v_\alpha}\,,\,\frac{nS^2}{u_\alpha}\,\right]\;.
$


El intervalo $ \left[\,\frac{nS^2}{v_\alpha}\,,\,\frac{nS^2}{u_\alpha}\,\right]$ es por tanto un intervalo de confianza de nivel $ 1\!-\!\alpha$ para $ \sigma^2$.



Sección : Intervalos de confianza
Previo : Definiciones
Siguiente : Modelo lineal