Aquí, como en todo el
capítulo, el modelo básico es el de una
muestra de una ley
desconocida . Por lo tanto suponemos que los
datos son
realizaciones de variables aleatorias independientes de una misma
ley
. No se supone que esta ley pertenece a una familia
paramétrica particular (de aquí el nombre de test no
paramétrico). En un primer momento, la
hipótesis
se referirá al valor de un
cuantil de
.
Tomemos el caso de un tratamiento que se supone hace bajar los
niveles de colesterol. Para cada individuo de un grupo de
pacientes, se mide la diferencia
entre los niveles de
colesterol después y antes del tratamiento. Algunas de estas
diferencias son negativas (disminución del nivel de colesterol)
otras positivas (aumento). La hipótesis
es que el
tratamiento no tiene un efecto significativo. Rechazaremos
(decidiremos que el tratamiento es eficaz) si se observa
una cantidad suficiente de disminuciones. El
estadígrafo de
test
es el número de descensos:
La notación
designa a la función indicatriz del
conjunto
, que vale
si
y 0 si no.
Si
es verdadera, la
mediana
de la ley
de las
es nula y
sigue la
ley
binomial
.
Generalizamos esta situación para el valor de un cuantil cualquiera.
El caso particular en el que y
, presentado en el
ejemplo, lleva el nombre especial de
test de
signos. Supongamos que en un grupo de
individuos se observaron
descensos en el nivel de colesterol.
El
p-valor
correspondiente es :
Para una muestra grande, se puede remplazar la ley binomial por su
aproximación normal. Bajo
, el estadígrafo:
Es aconsejable limitar el uso de la
aproximación por la normal únicamente a los casos en los que la
ley no se pueda calcular exactamente.