Función cuantil

La función cuantil de una variable aleatoria (o de una ley de probabilidad) es la inversa de su función de distribución. Cuando la función de distribución es estrictamente creciente, su inversa está definida sin ambigüedad. Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición.

Definición 3.8 Sea

una variable aleatoria con valores en $\mathbb {R}$ , y

su función de distribución. Se llama función cuantil de

a la función de

en $\mathbb {R}$ , denotada por

, que a $u\in ]0,1[$ hace corresponder:

$\displaystyle Q_X(u) = \inf\{x\;:\; F_X(x)\geq u\}\;.$

La función cuantil de una variable aleatoria discreta es una función en escalera, al igual que su función de distribución. Si

toma los valores $x_k\,,\;k=1,2\ldots$ , puestos en orden creciente, la función de distribución es igual a:

$\begin{displaymath} Q_X(u)=\left\{ \begin{array}{lcl} x_1&&\mbox{para } u\in ... ...para } u\in ]F_k,F_{k+1}]\\ \vdots&& \end{array} \right. \end{displaymath}$

Vamos a situarnos en el caso más frecuente, en el que la densidad

es estrictamente creciente en un intervalo de $\mathbb {R}$ (su soporte) y nula fuera de él. Si el intervalo es

, la función de distribución se anula antes de

, si

es finito, crece estrictamente de 0 a

entre

y vale

después de

, si

es finito. Todo valor

estrictamente comprendido entre 0 y

se alcanza una vez y una sola por

. El valor de

es el único punto

, comprendido entre

, tal que

Calculemos como ejemplo la función cuantil de la ley exponencial ${\cal E}(\lambda )$ , con función de distribución $(1-e^{-\lambda x})\mathbb {I}_{\mathbb {R}^+}(x)$ . Para todo $u\in ]0,1[$ :

$\displaystyle (1-e^{-\lambda x}) = u\;\Longleftrightarrow x=Q_X(u) = -\frac{1}{\lambda}\log(1-u)\;.$

La función cuantil es un instrumento para describir la dispersión de una ley. Si se realizan un gran número llamadas independientes de la misma ley (obtención de una muestra), se debe esperar que una proporción

de los valores sea inferior a

. Un valor importante es la mediana,

. Los valores de la función cuantil son empleados más frecuentemente en estadística que los valores de la función de distribución. Se utiliza frecuentemente en especial los intervalos de dispersión, entendiendo esto como que deben contener una proporción grande de los datos.

Definición 3.9 Sea

una variable aleatoria y $\alpha$ un número real entre 0 y

. Se llama intervalo de dispersión de nivel $1\!-\!\alpha$ a todo intervalo de la forma:

$\displaystyle [\,Q_X(\beta),Q_X(1-\alpha+\beta)\,]\;,$ donde $\displaystyle 0\leq \beta\leq \alpha\;.$

En estadística emplear números reales $\alpha$ entre 0 y

constituye una tradición. La misma tradición hace que se les asigne prioritariamente los valores

, menos frecuentemente

. Por tanto debemos leer $\alpha$ como ``una proporción débil'', y $1\!-\!\alpha$ como ``una proporción fuerte''. Un intervalo de dispersión de nivel $1\!-\!\alpha$ para

es uno tal que

pertenece a ese intervalo con probabilidad $1\!-\!\alpha$ : el contiene, por tanto, a una fuerte proporción de la densidad, aún si el es, en general, mucho más pequeño que el soporte de la ley. Existen, en general, una infinidad de intervalos de dispersión de un nivel dado.

$\begin{displaymath} \begin{array}{\vert c\vert c\vert c\vert} \hline \beta&Q_... ...089&2.8782\\ 0.01&-2.3263&+\infty\\ \hline \end{array} \end{displaymath}$

Según sean los valores de $\beta$ , decimos que un intervalo de dispersión de nivel $1\!-\!\alpha$ es:

Determinar un intervalo de dispersión optimal requiere, en general, de un cálculo especial salvo en el caso en que la ley es simétrica, como una ley normal o una ley de Student. Decimos que la ley de

es simétrica si para todo $u\in [0,1]$ ,

Se demuestra que si la ley de

es simétrica, entonces el intervalo de dispersión simétrico es optimal. Otra aplicación importante de la función cuantil es el método de inversión, el cual es un método general que consiste en simular una variable aleatoria de cualquier ley, combinando el empleo de la función Random con el de la función cuantil de la variable.

Proposición 3.10 Sea

una función de distribución real,

la función cuantil correspondiente y

una variable aleatoria de ley uniforme en

. La variable aleatoria

tiene a

por función de distribución.

$\displaystyle \mathbb {P}[X\leq x]$	$\displaystyle =$	$\displaystyle \mathbb {P}[Q(U)\leq x]$
	$\displaystyle =$	$\displaystyle \mathbb {P}[\,\inf\,\{y\; :\; F(y)\geq U\}\leq x\,]$
	$\displaystyle =$	$\displaystyle \mathbb {P}[\,U\leq F(x)\,]$
	$\displaystyle =$	$\displaystyle F(x)\;.$

La función cuantil de la ley exponencial ${\cal E}(\lambda )$ hace corresponder a $u\in ]0,1[$ el valor:

No vale la pena calcular $-\log (1\!-\!$ Random $)/\lambda$ porque Random y

Random tienen la misma ley.

El método de inversión no es exacto, a menos que se conozca la expresión explícita de $F^{-1}$ , como es el caso de la ley exponencial. Esto raramente sucede. Si queremos aplicar el método a la ley normal, por ejemplo, será necesario utilizar un algoritmo de aproximación. Además de la imprecisión, el método de inversión será relativamente lento. Aún cuando se conoce explícitamente la expresión de $F^{-1}$ , el método de inversión es raramente el más eficaz para las variables continuas. Sin embargo es aplicable a gran cantidad de leyes discretas.

Supongamos que

toma los valores $x_1, x_2,\ldots$ , ordenados por orden creciente. Denotemos por

el valor de la función de distribución en el intervalo $[x_k,x_{k+1}[$ . El algoritmo de simulación por inversión es el siguiente.

$k\longleftarrow 1$
$U \longleftarrow$ Random
MientrasQue (

)
$k\longleftarrow k+1$
finMientrasQue
$X\longleftarrow x_k$

Modifiquemos ligeramente el algoritmo añadiéndole una interpolación lineal. Cuando

cae en el intervalo $]F_{k-1},F_k]$ , en lugar de dar

, como inicialmente, ahora va a dar el valor:

El resultado es reemplazar la función de distribución en escalera por una función de distribución lineal a trozos que pasa por los puntos

. La distribución de probabilidad correspondiente tiene como densidad a una función en escalera (constante en cada intervalo $]x_{k-1},x_k[$ ). Es un histograma.