Dada una muestra observada
y una ley de probabilidad , la verosimilitud cuantifica
la probabilidad de que las observaciones provengan efectivamente, de
una muestra (teórica) de la ley .
Tomemos el ejemplo de lanzar 10 veces una moneda. La muestra binaria observada es, por ejemplo:
Para una muestra de tamaño 10 de la ley de Bernoulli de parámetro , la probabilidad de una tal realización es de . Veamos algunos valores numéricos.
Es natural seleccionar como valor estimado de , aquel para el cual la probabilidad de la muestra observada es más fuerte, en este caso . La figura 3 compara las funciones que a asocian para diferentes valores de . Todas tienen su máximo en . El máximo es más marcado según es más grande.
La interpretación es la siguiente. Consideremos una muestra teórica de la ley . Por definición, las variables aleatorias son independientes y de una misma ley . Por lo tanto la probabilidad que la muestra teórica tenga por realización la muestra observada , es el producto de las probabilidades de que cada tome el valor , es decir:
En el caso de un modelo continuo, la ley tiene una densidad sobre , y la probabilidad que la muestra tome un valor particular es siempre nula. Hay que reemplazar la probabilidad por su densidad en la definición de verosimilitud.
La interpretación es la siguiente. Consideremos una muestra
teórica
de la ley continua . Sea
un número real estrictamente positivo (pequeño). La
probabilidad de que la muestra teórica
tenga una
realización en una ``
vecindad'' de la muestra
observada
puede escribirse como:
y y | |||
Estimar un parámetro por el método de máxima verosimilitud, es proponer como valor del parámetro aquél que da un valor máximo a la verosimilitud, es decir, a la probabilidad de observar los datos como realización de una muestra de la ley .
Retomemos el ejemplo de la ley uniforme sobre el intervalo . Su densidad es:
La verosimilitud es la función que a números reales
y a un valor positivo asigna:
Considerada como función de , la verosimilitud es nula si es menor que el mayor de los valores observados, si no, vale . Por lo tanto ella es máxima para:
Si es una muestra de la ley uniforme , el estimador de máxima verosimilitud de es:
Para la mayoría de las leyes de probabilidad usuales, el estimador de máxima verosimilitud se define de forma única y se calcula explícitamente. En el plano teórico tiene muchas ventajas. Bajo hipótesis que cumplen numerosos modelos de uso corriente, se demuestra que es asintóticamente insesgado y consistente. Se demuestra, además, que su varianza es minimal, por lo tanto el método de máxima verosimilitud es teóricamente el mejor de los métodos de estimación. Cuando una determinación explícita es imposible, hay que recurrir a una determinación numérica, empleando un algoritmo de optimización.