El error cuadrático mide la concentración de un estimador alrededor del valor del parámetro. Los intervalos de dispersión son otro medio para medir la mayor o menor concentración de una ley de probabilidad. Ellos se escriben con la ayuda de la función cuantil. Si es una variable aleatoria, la función cuantil de su ley es la función de en que a asocia:
En estadística, los números reales entre 0 y son una
tradición. La misma tradición hace que se les asigne
prioritariamente los valores y , menos frecuentemente
, o . Debemos ver a como
``una proporción débil'', y a
como ``una proporción fuerte''. Un
intervalo de dispersión de nivel
para es uno
tal que, pertenece a ese intervalo con probabilidad
. Por lo tanto, él contiene una fuerte proporción de
los valores que tomará , aún cuando sea mucho más pequeño que
el soporte de la ley.
Según los valores que demos a , diremos que un intervalo de dispersión de nivel es:
Determinar un intervalo de dispersión optimal requiere en general un cálculo numérico particular, salvo en el caso en que la ley es simétrica, como una la ley normal o una ley de Student. Decimos que la ley de es simétrica si para todo ,
Se demuestra que si la ley de es simétrica, entonces el
intervalo de dispersión simétrico es optimal.
La noción de consistencia se traduce en términos de intervalos de dispersión de la manera siguiente.
Demostración:
Decir que un estimador es consistente, es decir que la
probabilidad de que pertenezca al intervalo
tiende a cuando el
tamaño de la muestra tiende a infinito. Si es
diferente de 0, existe un tal que para mayor que
, la probabilidad que sea menor que
, es menor que . Esto equivale a decir
que
es menor que
.
Igualmente, si
es diferente de 0, existe un
tal que para mayor que , la probabilidad que
sea menor que
, es mayor que
. Esto equivale a decir que
es mayor que
. Por
lo tanto, para mayor que y , el intervalo de dispersión
está incluido en el
intervalo
.
Recíprocamente, si
está incluido en
a
partir de un cierto , entonces la probabilidad que esté
comprendido entre
y
es
mayor que . Como esto es cierto para todo ,
esta probabilidad tiende a .
Retomemos, como de ejemplo, el estimador para la ley uniforme ; es decir el del valor máximo de la muestra. Su función cuantil es la función que a asocia:
Para y fijos, el intervalo de dispersión tiene por longitud:
Encontramos que el intervalo de dispersión optimal coincide con el intervalo de dispersión unilateral superior ( ). El extremo izquierdo es , el extremo derecho es . Presentamos algunos valores para la cantidad , la cual tiende a cuando tiende a infinito.
Cuando la ley de la variable aleatoria es discreta, la noción de intervalo de dispersión contiene una cierta ambigüedad. Consideremos por ejemplo, la ley binomial . Estos son los valores de su función de distribución.
Fijemos . En todo rigor, el valor de la función cuantil en el punto es . El intervalo debería ser por tanto un intervalo de dispersión de nivel para la ley . Sin embargo su probabilidad es solamente . En los cálculos que emplean los intervalos de dispersión, siempre se aplica un principio de precaución, que consiste en garantizar el nivel. Calificaremos de intervalo de dispersión de nivel a los intervalos cuya probabilidad es mayor o igual que . Este principio nos lleva a modificar la definición 1.9 para las leyes discretas con valores en , reemplazando el extremo derecho por . La tabla siguiente nos da una lista de intervalos de dispersión de nivel , con sus probabilidades exactas, para la ley .
Hay dos intervalos de amplitud mínima, y . Seleccionaremos aquel cuya probabilidad es mayor, es decir . La figura 2 representa, en función de , los intervalos de dispersión optimales, en el sentido que hemos definido, para la ley binomial , así como los intervalos de dispersión simétricos.