Intervalos de dispersión

El error cuadrático mide la concentración de un estimador alrededor del valor del parámetro. Los intervalos de dispersión son otro medio para medir la mayor o menor concentración de una ley de probabilidad. Ellos se escriben con la ayuda de la función cuantil. Si

es una variable aleatoria, la función cuantil de su ley es la función

en $\mathbb {R}$ que a $u\in [0,1]$ asocia:

$\displaystyle Q_T(u) = \inf\{t$ t.q. $\displaystyle \mathbb {P}[T\leq t]\geq u\}\;.$

Definición 1.9 Sean

una variable aleatoria y $\alpha$ un número real entre 0 y

. Llamamos intervalo de dispersión de nivel $1\!-\!\alpha$ a todo intervalo de la forma:

$\displaystyle [\,Q_T(\beta),Q_T(1-\alpha+\beta)\,]\;,$ con $\displaystyle 0\leq \beta\leq \alpha\;.$

En estadística, los números reales $\alpha$ entre 0 y

son una tradición. La misma tradición hace que se les asigne prioritariamente los valores

, menos frecuentemente

. Debemos ver a $\alpha$ como ``una proporción débil'', y a $1\!-\!\alpha$ como ``una proporción fuerte''. Un intervalo de dispersión de nivel $1\!-\!\alpha$ para

es uno tal que,

pertenece a ese intervalo con probabilidad $1\!-\!\alpha$ . Por lo tanto, él contiene una fuerte proporción de los valores que tomará

, aún cuando sea mucho más pequeño que el soporte de la ley.

Según los valores que demos a $\beta$ , diremos que un intervalo de dispersión de nivel $1\!-\!\alpha$ es:

**Gráfico 1:** Intervalo de dispersión optimal de nivel para la ley gamma ${\cal G}(5,0.5)$ (ley de chi-cuadrado de parámetro ).

Determinar un intervalo de dispersión optimal requiere en general un cálculo numérico particular, salvo en el caso en que la ley es simétrica, como una la ley normal o una ley de Student. Decimos que la ley de

es simétrica si para todo $u\in [0,1]$ ,

Se demuestra que si la ley de

es simétrica, entonces el intervalo de dispersión simétrico es optimal.

La noción de consistencia se traduce en términos de intervalos de dispersión de la manera siguiente.

Proposición 1.10 Sea

un estimador del parámetro $\theta$ . El estimador

es consistente si y sólo si para todo $(\alpha,\beta)$ , con $0<\beta<\alpha$ , y para todo $\varepsilon >0$ , el intervalo de dispersión $[\,Q_{T_n}(\beta),Q_{T_n}(1-\alpha+\beta)\,]$ está incluido dentro del intervalo $[\theta-\varepsilon , \theta+\varepsilon]$ a partir de un cierto

Demostración: Decir que un estimador

es consistente, es decir que la probabilidad de que

pertenezca al intervalo $[\theta-\varepsilon , \theta+\varepsilon]$ tiende a

cuando el tamaño

de la muestra tiende a infinito. Si $\beta$ es diferente de 0, existe un

tal que para

mayor que

, la probabilidad que

sea menor que $\theta-\varepsilon$ , es menor que $\beta$ . Esto equivale a decir que $\theta-\varepsilon$ es menor que $Q_{T_n}(\beta)$ . Igualmente, si $\alpha\!-\!\beta$ es diferente de 0, existe un

tal que para

mayor que

, la probabilidad que

sea menor que $\theta+\varepsilon$ , es mayor que $1\!-\!\alpha\!+\!\beta$ . Esto equivale a decir que $\theta+\varepsilon$ es mayor que $Q_{T_n}(1-\alpha+\beta)$ . Por lo tanto, para

mayor que

, el intervalo de dispersión $[\,Q_{T_n}(\beta),Q_{T_n}(1-\alpha+\beta)\,]$ está incluido en el intervalo $[\theta-\varepsilon , \theta+\varepsilon]$ .

Recíprocamente, si $[\,Q_{T_n}(\beta),Q_{T_n}(1-\alpha+\beta)\,]$ está incluido en $[\theta-\varepsilon , \theta+\varepsilon]$ a partir de un cierto

, entonces la probabilidad que

esté comprendido entre $\theta-\varepsilon$ y $\theta+\varepsilon$ es mayor que $1-\alpha$ . Como esto es cierto para todo $\alpha>0$ , esta probabilidad tiende a

. $\square$

Retomemos, como de ejemplo, el estimador

para la ley uniforme ${\cal U}(0,\theta)$ ; es decir el del valor máximo de la muestra. Su función cuantil es la función que a $u\in [0,1]$ asocia:

Para $\alpha$ y $\beta\leq \alpha$ fijos, el intervalo de dispersión $[\,Q_{T''_n}(\beta),Q_{T''_n}(1-\alpha+\beta)\,]$ tiene por longitud:

Encontramos que el intervalo de dispersión optimal coincide con el intervalo de dispersión unilateral superior ( $\beta=\alpha$ ). El extremo izquierdo es $\theta \alpha^{1/n}$ , el extremo derecho es $\theta$ . Presentamos algunos valores para la cantidad $\alpha^{1/n}$ , la cual tiende a

cuando

tiende a infinito.

$n\ddots \alpha$	0.05	0.01	0.001
10	0.741	0.631	0.501
100	0.970	0.955	0.933
1000	0.997	0.995	0.993

Cuando la ley de la variable aleatoria

es discreta, la noción de intervalo de dispersión contiene una cierta ambigüedad. Consideremos por ejemplo, la ley binomial ${\cal B}(10,0.6)$ . Estos son los valores de su función de distribución.

	0	1	2	3	4	5	6	7	8	9	10
	0.000	0.002	0.012	0.055	0.166	0.367	0.618	0.833	0.954	0.994	1

Fijemos $1\!-\!\alpha=0.9$ . En todo rigor, el valor de la función cuantil en el punto

. El intervalo

debería ser por tanto un intervalo de dispersión de nivel

para la ley ${\cal B}(10,0.6)$ . Sin embargo su probabilidad es solamente

. En los cálculos que emplean los intervalos de dispersión, siempre se aplica un principio de precaución, que consiste en garantizar el nivel. Calificaremos de intervalo de dispersión de nivel $1\!-\!\alpha$ a los intervalos cuya probabilidad es mayor o igual que $1\!-\!\alpha$ . Este principio nos lleva a modificar la definición 1.9 para las leyes discretas con valores en $\mathbb {N}$ , reemplazando el extremo derecho $Q_T(1-\alpha+\beta)$ por $1+Q_T(1-\alpha+\beta)$ . La tabla siguiente nos da una lista de intervalos de dispersión de nivel $\geq 0.9$ , con sus probabilidades exactas, para la ley ${\cal B}(10,0.6)$ .

Hay dos intervalos de amplitud mínima,

. Seleccionaremos aquel cuya probabilidad es mayor, es decir

. La figura 2 representa, en función de

, los intervalos de dispersión optimales, en el sentido que hemos definido, para la ley binomial ${\cal B}(10,p)$ , así como los intervalos de dispersión simétricos.

**Gráfico 2:** Intervalos de dispersión optimales (trazo continuo) y simétricos (punteados) de nivel $\geq 0.9$ para la ley binomial ${\cal B}(10,p)$ .

Intervalo
Probabilidad	0.954	0.954	0.952	0.941	0.939	0.945