El
error
cuadrático mide la concentración de un
estimador
alrededor del valor del parámetro. Los
intervalos de
dispersión son otro medio para
medir la mayor o menor concentración de una ley de probabilidad.
Ellos se escriben con la ayuda de la
función cuantil. Si es una
variable aleatoria, la
función cuantil de su ley es la
función
de
en
que a
asocia:
En estadística, los números reales entre 0 y
son una
tradición. La misma tradición hace que se les asigne
prioritariamente los valores
y
, menos frecuentemente
,
o
. Debemos ver a
como
``una proporción débil'', y a
como ``una proporción fuerte''. Un
intervalo de dispersión de nivel
para
es uno
tal que,
pertenece a ese intervalo con probabilidad
. Por lo tanto, él contiene una fuerte proporción de
los valores que tomará
, aún cuando sea mucho más pequeño que
el soporte de la ley.
Según los valores que demos a , diremos que un intervalo de
dispersión de nivel
es:
Determinar un intervalo de dispersión optimal requiere en general
un cálculo numérico particular, salvo en el caso en que la ley es
simétrica, como una la ley normal o una ley de Student. Decimos
que la ley de es simétrica si
para todo
,
Se demuestra que si la ley de es simétrica, entonces el
intervalo de dispersión simétrico es optimal.
La noción de consistencia se traduce en términos de intervalos de dispersión de la manera siguiente.
Demostración:
Decir que un estimador es consistente, es decir que la
probabilidad de que
pertenezca al intervalo
tiende a
cuando el
tamaño
de la muestra tiende a infinito. Si
es
diferente de 0, existe un
tal que para
mayor que
, la probabilidad que
sea menor que
, es menor que
. Esto equivale a decir
que
es menor que
.
Igualmente, si
es diferente de 0, existe un
tal que para
mayor que
, la probabilidad que
sea menor que
, es mayor que
. Esto equivale a decir que
es mayor que
. Por
lo tanto, para
mayor que
y
, el intervalo de dispersión
está incluido en el
intervalo
.
Recíprocamente, si
está incluido en
a
partir de un cierto
, entonces la probabilidad que
esté
comprendido entre
y
es
mayor que
. Como esto es cierto para todo
,
esta probabilidad tiende a
.
Retomemos, como de ejemplo, el estimador para la ley
uniforme
; es decir el del valor máximo de la
muestra. Su función cuantil es la función que a
asocia:
Para y
fijos, el intervalo de
dispersión
tiene por longitud:
Encontramos que el intervalo de dispersión optimal coincide con el
intervalo de dispersión unilateral superior (
). El
extremo izquierdo es
, el extremo derecho es
. Presentamos algunos valores para la cantidad
, la cual tiende a
cuando
tiende a infinito.
Cuando la ley de la variable aleatoria es discreta,
la noción de intervalo de dispersión contiene una cierta
ambigüedad. Consideremos por ejemplo, la
ley binomial
. Estos son los valores de su función de distribución.
Fijemos
. En todo rigor, el valor de la función
cuantil en el punto
es
. El intervalo
debería ser
por tanto un intervalo de dispersión de nivel
para la ley
. Sin embargo su probabilidad es solamente
. En los cálculos que emplean los intervalos de dispersión,
siempre se aplica un principio de precaución, que consiste en
garantizar el nivel. Calificaremos de intervalo de dispersión de
nivel
a los intervalos cuya probabilidad es
mayor o igual que
. Este principio nos lleva a
modificar la definición 1.9 para las leyes discretas
con valores en
, reemplazando el extremo derecho
por
. La tabla
siguiente nos da una lista de intervalos de dispersión de nivel
, con sus probabilidades exactas, para la ley
.
Hay dos intervalos de amplitud mínima, y
.
Seleccionaremos aquel cuya probabilidad es mayor, es decir
. La figura 2 representa, en función de
, los
intervalos de dispersión optimales, en el sentido que hemos
definido, para la ley binomial
, así como los
intervalos de dispersión simétricos.