El estadígrafo más evidente que se puede calcular en una muestra numérica, aquella cuya interpretación es más intuitiva, es la media empírica.
Por tanto la media es el centro de gravedad de los datos, dando el mismo peso a todos los individuos. Ella puede ser considerada como un valor central aún si no coincide con una de las modalidades.
La media es asociativa. Si reunimos dos muestras de tamaño y
con medias
y
, respectivamente,
entonces la media de la nueva muestra será
.
Si
es una muestra y si para todo
, escribimos
donde y son dos
constantes, entonces la media empírica de la muestra
es
. En
particular si y
, la nueva muestra tiene
una media nula.
Centrar los datos es
sustraerles su media empírica para así llevarla a 0.
Un caso particular importante es el de
los datos binarios. Frecuentemente debemos construir una muestra
binaria a partir de una muestra numérica, para reagruparla en
clases. Sea un subconjunto de
(un intervalo en el caso
de una clase). Denotemos por
su función
indicatriz que vale si , 0 si no. Si
es una muestra que toma valores reales,
entonces
es una muestra binaria y
su media empírica recibe el nombre de
frecuencia empírica
de . Es simplemente la proporción
de los valores de
que pertenecen a .
Uno de los inconvenientes de la media empírica, vista como valor central de una muestra, es ser sensible a valores extremos. Un valor que es evidentemente muy diferente de los otros es calificado frecuentemente de valor aberrante. Que él sea el resultado de un error en la recolección o en la transcripción, no se le puede considerar como representativo. Supongamos que en una muestra de valores todos sean del orden de , excepto uno, que es de el orden de . La media empírica será del orden de , es decir muy lejana de la mayoría de los valores de la muestra. Para paliar este inconveniente, podemos decidir no tomar en cuenta los valores extremos para el cálculo de la media. Obtenemos entonces una media podada (en inglés ''trimmed mean'').
En estadística los números reales
entre 0 y son una tradición. La misma tradición hace que se
les asigne prioritariamente los valores y , menos
frecuentemente , o . Por tanto debemos ver a
como ''una proporción débil'', y a
como
''una proporción fuerte''.
Como una técnica de primera aproximación en el alisamiento de las series cronológicas, se emplean las medias móviles, que son las medias aritméticas de los valores que se encuentran alrededor de la fecha que se considera.
El inconveniente de las medias móviles es asociar a una fecha dada una media aritmética que no otorga más peso al valor original correspondiente a esa fecha que a los otros. A veces se emplea una ponderación exponencialmente decreciente con respecto al intervalo de tiempo a la fecha que se toma como centro. Se realiza así un alisamiento exponencial.