Sección : Estimación puntual
Previo : Cualidades de un estimador
Siguiente : Ejemplos de estimadores

Intervalos de dispersión


El error cuadrático mide la concentración de un estimador alrededor del valor del parámetro. Los intervalos de dispersión son otro medio para medir la mayor o menor concentración de una ley de probabilidad. Ellos se escriben con la ayuda de la función cuantil. Si $ T$ es una variable aleatoria, la función cuantil de su ley es la función $ Q_T$ de $ [0,1]$ en $ \mathbb {R}$ que a $ u\in [0,1]$ asocia:

$\displaystyle Q_T(u) = \inf\{t$ t.q. $\displaystyle \mathbb {P}[T\leq t]\geq u\}\;.
$

Definición 1.9   Sean $ T$ una variable aleatoria y $ \alpha$ un número real entre 0 y $ 1$. Llamamos intervalo de dispersión de nivel $ 1\!-\!\alpha$ a todo intervalo de la forma:

$\displaystyle [\,Q_T(\beta),Q_T(1-\alpha+\beta)\,]\;,$   con $\displaystyle 0\leq
\beta\leq \alpha\;.
$


En estadística, los números reales $ \alpha$ entre 0 y $ 1$ son una tradición. La misma tradición hace que se les asigne prioritariamente los valores $ 0.05$ y $ 0.01$, menos frecuentemente $ 0.02$, $ 0.005$ o $ 0.001$. Debemos ver a $ \alpha$ como ``una proporción débil'', y a $ 1\!-\!\alpha$ como ``una proporción fuerte''. Un intervalo de dispersión de nivel $ 1\!-\!\alpha$ para $ T$ es uno tal que, $ T$ pertenece a ese intervalo con probabilidad $ 1\!-\!\alpha$. Por lo tanto, él contiene una fuerte proporción de los valores que tomará $ T$, aún cuando sea mucho más pequeño que el soporte de la ley.

Según los valores que demos a $ \beta$, diremos que un intervalo de dispersión de nivel $ 1\!-\!\alpha$ es:

$ \bullet$
unilateral inferior si $ \beta=0$,
$ \bullet$
unilateral superior si $ \beta=\alpha$,
$ \bullet$
simétrico si $ \beta=\alpha/2$,
$ \bullet$
optimal si su longitud es la más corta entre las de todos los intervalos de dispersión de nivel $ 1\!-\!\alpha$.

Gráfico 1: Intervalo de dispersión optimal de nivel $ 0.95$ para la ley gamma $ {\cal G}(5,0.5)$ (ley de chi-cuadrado de parámetro $ 10$).


Determinar un intervalo de dispersión optimal requiere en general un cálculo numérico particular, salvo en el caso en que la ley es simétrica, como una la ley normal o una ley de Student. Decimos que la ley de $ T$ es simétrica si para todo $ u\in [0,1]$,

$\displaystyle Q_T(u) - Q_T(0.5) = Q_T(0.5) - Q_T(1-u)\;.
$


Se demuestra que si la ley de $ T$ es simétrica, entonces el intervalo de dispersión simétrico es optimal.

La noción de consistencia se traduce en términos de intervalos de dispersión de la manera siguiente.

Proposición 1.10   Sea $ (T_n)$ un estimador del parámetro $ \theta$. El estimador $ (T_n)$ es consistente si y sólo si para todo $ (\alpha,\beta)$, con $ 0<\beta<\alpha$, y para todo $ \varepsilon >0$, el intervalo de dispersión $ [\,Q_{T_n}(\beta),Q_{T_n}(1-\alpha+\beta)\,]$ está incluido dentro del intervalo $ [\theta-\varepsilon , \theta+\varepsilon]$ a partir de un cierto $ n$.


Demostración: Decir que un estimador $ T_n$ es consistente, es decir que la probabilidad de que $ T_n$ pertenezca al intervalo $ [\theta-\varepsilon , \theta+\varepsilon]$ tiende a $ 1$ cuando el tamaño $ n$ de la muestra tiende a infinito. Si $ \beta$ es diferente de 0, existe un $ n_0$ tal que para $ n$ mayor que $ n_0$, la probabilidad que $ T_n$ sea menor que $ \theta-\varepsilon$, es menor que $ \beta$. Esto equivale a decir que $ \theta-\varepsilon$ es menor que $ Q_{T_n}(\beta)$. Igualmente, si $ \alpha\!-\!\beta$ es diferente de 0, existe un $ n_1$ tal que para $ n$ mayor que $ n_1$, la probabilidad que $ T_n$ sea menor que $ \theta+\varepsilon$, es mayor que $ 1\!-\!\alpha\!+\!\beta$. Esto equivale a decir que $ \theta+\varepsilon$ es mayor que $ Q_{T_n}(1-\alpha+\beta)$. Por lo tanto, para $ n$ mayor que $ n_0$ y $ n_1$, el intervalo de dispersión $ [\,Q_{T_n}(\beta),Q_{T_n}(1-\alpha+\beta)\,]$ está incluido en el intervalo $ [\theta-\varepsilon , \theta+\varepsilon]$.

Recíprocamente, si $ [\,Q_{T_n}(\beta),Q_{T_n}(1-\alpha+\beta)\,]$ está incluido en $ [\theta-\varepsilon , \theta+\varepsilon]$ a partir de un cierto $ n$, entonces la probabilidad que $ T_n$ esté comprendido entre $ \theta-\varepsilon$ y $ \theta+\varepsilon$ es mayor que $ 1-\alpha$. Como esto es cierto para todo $ \alpha>0$, esta probabilidad tiende a $ 1$. $ \square$

Retomemos, como de ejemplo, el estimador $ T''_n$ para la ley uniforme $ {\cal U}(0,\theta)$; es decir el del valor máximo de la muestra. Su función cuantil es la función que a $ u\in [0,1]$ asocia:

$\displaystyle Q_{T''_n}(u) = \theta\,u^{1/n}\;.
$


Para $ \alpha$ y $ \beta\leq \alpha$ fijos, el intervalo de dispersión $ [\,Q_{T''_n}(\beta),Q_{T''_n}(1-\alpha+\beta)\,]$ tiene por longitud:

$\displaystyle \theta(1-\alpha+\beta)^{1/n}-\theta\beta^{1/n}\;.
$


Encontramos que el intervalo de dispersión optimal coincide con el intervalo de dispersión unilateral superior ( $ \beta=\alpha$). El extremo izquierdo es $ \theta \alpha^{1/n}$, el extremo derecho es $ \theta$. Presentamos algunos valores para la cantidad $ \alpha^{1/n}$, la cual tiende a $ 1$ cuando $ n$ tiende a infinito.

$ n\ddots \alpha$
0.05
0.01
0.001
10
0.741
0.631
0.501
100
0.970
0.955
0.933
1000
0.997
0.995
0.993


Cuando la ley de la variable aleatoria $ T$ es discreta, la noción de intervalo de dispersión contiene una cierta ambigüedad. Consideremos por ejemplo, la ley binomial $ {\cal
B}(10,0.6)$. Estos son los valores de su función de distribución.

$ i$
0
1
2
3
4
5
6
7
8
9
10
$ F(i)$
0.000
0.002
0.012
0.055
0.166
0.367
0.618
0.833
0.954
0.994
1

Fijemos $ 1\!-\!\alpha=0.9$. En todo rigor, el valor de la función cuantil en el punto $ 0.9$ es $ 7$. El intervalo $ [0,7]$ debería ser por tanto un intervalo de dispersión de nivel $ 0.9$ para la ley $ {\cal
B}(10,0.6)$. Sin embargo su probabilidad es solamente $ 0.833$. En los cálculos que emplean los intervalos de dispersión, siempre se aplica un principio de precaución, que consiste en garantizar el nivel. Calificaremos de intervalo de dispersión de nivel $ 1\!-\!\alpha$ a los intervalos cuya probabilidad es mayor o igual que $ 1\!-\!\alpha$. Este principio nos lleva a modificar la definición 1.9 para las leyes discretas con valores en $ \mathbb {N}$, reemplazando el extremo derecho $ Q_T(1-\alpha+\beta)$ por $ 1+Q_T(1-\alpha+\beta)$. La tabla siguiente nos da una lista de intervalos de dispersión de nivel $ \geq 0.9$, con sus probabilidades exactas, para la ley $ {\cal
B}(10,0.6)$.

Intervalo
$ [0,8]$
$ [1,8]$
$ [2,8]$
$ [3,8]$
$ [4,9]$
$ [4,10]$
Probabilidad
0.954
0.954
0.952
0.941
0.939
0.945

Hay dos intervalos de amplitud mínima, $ [3,8]$ y $ [4,9]$. Seleccionaremos aquel cuya probabilidad es mayor, es decir $ [3,8]$. La figura 2 representa, en función de $ p$, los intervalos de dispersión optimales, en el sentido que hemos definido, para la ley binomial $ {\cal B}(10,p)$, así como los intervalos de dispersión simétricos.

Gráfico 2: Intervalos de dispersión optimales (trazo continuo) y simétricos (punteados) de nivel $ \geq 0.9$ para la ley binomial $ {\cal B}(10,p)$.



Sección : Estimación puntual
Previo : Cualidades de un estimador
Siguiente : Ejemplos de estimadores