La
tabla de contingencia es un medio
particular de representar simultáneamente dos carácteres
observados en una misma población, si son discretos o continuos
reagrupados en clases. Los dos carácteres son e
, el tamaño
de la muestra es
. Las modalidades o clases de
se
escribirán
, las de
,
. Se
denota:
Cada fila y cada columna corresponden a una submuestra particular.
La fila de índice es la distribución en
, de
los individuos para los cuales el carácter
toma el valor
. La columna de índice
es la distribución sobre
, de los individuos para los cuales el carácter
toma el valor
. Dividiendo las filas y las columnas por
sus sumas, obtenemos en cada una,
distribuciones empíricas
formadas por frecuencias condicionales. Para
y
, las denotaremos:
Estas
distribuciones empíricas condicionales se llaman los
perfiles-fila y perfiles-columna.
La
cuestión es estudiar la dependencia de los dos carácteres. Dos
carácteres son independientes si el valor de uno no influye sobre
la distribución de los valores del otro. Si este es el caso, los
perfiles-fila diferirán muy poco de la distribución empírica de
, y los perfiles-columna de la de
:
Es equivalente a decir que las frecuencias conjuntas deben estar cerca de los productos de las frecuencias marginales:
Las frecuencias conjuntas por un lado, y los productos de las
frecuencias marginales por el otro, constituyen dos distribuciones
de probabilidad sobre el conjunto producto
. Una de las maneras de
cuantificar su proximidad es calcular la
distancia de chi-cuadrado
de una con respecto a la otra. En este caso particular, hablamos
de
chi-cuadrado de contingencia.
![]() |
![]() |
![]() |
|
![]() |
![]() |
Demostración:
La primera expresión es la aplicación directa de la definición
2.7. Para pasar a la segunda, se desarrolla
el cuadrado.
![]() |
![]() |
![]() |
|
![]() |
![]() |
||
![]() |
![]() |
La distancia de chi-cuadrado vale 0 si los dos carácteres
son independientes. Ella es máxima si existe una dependencia
sistemática. Supongamos que y
, para una
cierta función biyectiva
. En cada fila y en cada columna de la
tabla de contingencia una sola casilla es diferente de cero y la
distancia de chi-cuadrado vale
.