Sección : Distribución empírica
Previo : Estadística y probabilidades
Siguiente : Cuantiles

Representaciones gráficas


Representar gráficamente la función de distribución empírica, da una primera idea de la distribución empírica. En general se representan solamente los puntos de coordenadas $ (x_{(i)},i/n)$.

En el caso en que la muestra sea discreta (el número de los valores distintos $ k$ es pequeño en relación con el tamaño de la muestra $ n$), se representará la distribución empírica por un diagrama de barras. Esto consiste en representar los diferentes valores $ c_1,\ldots,c_k$ en la abscisa, y encima una barra vertical de altura igual a su frecuencia empírica $ f(c_h)$. En el caso en que sean muy pocos los valores diferentes (cantidad inferior a $ 10$), y sobre todo para muestras cualitativas, se emplean también representaciones de tipo ''torta'' (pie chart) o en barras. Estas consisten en dividir un disco o un rectángulo de manera proporcional a las diferentes frecuencias.

La representación correspondiente al diagrama de barras para una muestra considerada como continua (cuando casi todos los valores son diferentes), es el histograma. Se selecciona un número de clases $ k$ y un intervalo de representación $ [a_0,a_k]$ que ha sido dividido en $ k$ intervalos $ [a_0,a_1],
]a_1,a_2],\ldots,]a_{k-1}, a_k]$. Se reemplaza entonces la distribución empírica por una nueva ley de probabilidad, la cual para todo $ h=1,\ldots,k$, asocia al intervalo $ ]a_{h-1},a_h]$ su frecuencia empírica $ \widehat{P}(]a_{h-1},a_h])$:

$\displaystyle \widehat{P}(]a_{h-1},a_h]) = \frac{1}{n} \sum_{i=1}^n
\mathbb {I}_{]a_{h-1},a_h]}(x_i)\;.
$


Trazar un histograma consiste en representar las clases en la abscisa y encima de la $ h$-ésima clase dibujar un rectángulo de altura $ f_h/(a_{h-1}-a_h)$, por tanto de área igual a $ f_h$. Esta representación es la de una densidad de probabilidad, constante en cada una de las clases. Representar un histograma implica una consideración a priori sobre las clases. Se decide, en efecto, que la frecuencia de cada una de las clases es precisamente su probabilidad empírica en la muestra, pero que la distribución de los datos en el interior de cada intervalo es aleatoria, con ley uniforme en dicho intervalo.

Gráfico 7: Estaturas de niños de 6 años. Histograma regular y no regular.



Sección : Distribución empírica
Previo : Estadística y probabilidades
Siguiente : Cuantiles