Es frecuente que varios carácteres sean observados en una misma
población. En una encuesta de opinión, las personas encuestadas
pueden hasta responder decenas de preguntas. Sobre una misma
muestra de sangre, se miden usualmente varias variables
(cantidades de glóbulos, tasas de colesterol, nivel de glucosa,
...). Un estudio descriptivo de cada carácter permite resumir
las carácterísticas de sus distribuciones empíricas. Para
concentrar en un mismo gráfico el conjunto de las distribuciones
empíricas, podemos trazar paralelamente el
diagrama de caja de
cada uno de los carácteres. Pero estudiar los carácteres
separadamente no suministra ninguna indicación sobre las
relaciones eventuales entre ellos: se olvida que las muestras han
sido tomadas de los mismos individuos. El problema consiste en
estudiar simultáneamente los
carácteres sin perder la información
de que han sido observados en los mismos individuos.
Si varios carácteres ,
,
han sido medidos en una
misma población, podemos considerar los datos
,
,
correspondientes a un individuo
como las coordenadas
de un punto en
, donde
es el número de carácteres. El
conjunto de estos puntos constituye una ''
nube de puntos'' en
. Para
o
, podemos
representar gráficamente esta
nube de
puntos
(figura
13). Más allá es imposible hacerlo y estamos obligados a
proyectarla sobre subespacios de dimensión
o
. Las
diferentes técnicas de proyección son el objeto del ''
análisis multidimensional de datos'' (análisis discriminante,
análisis de componentes principales, análisis factorial de
correspondencias, etc...).
En el caso en que se observan 2 carácteres cuantitativos, e
, podemos reagrupar sus valores en clases y
representar en perspectiva un histograma bidimensional: el
conjunto de pares de valores se divide en rectángulos sobre los
cuales se dibuja un paralelepípedo cuyo
volumen es la frecuencia empírica del rectángulo, es decir
el número de pares
que pertenecen al rectángulo,
dividido por el tamaño de la muestra. Si uno de los carácteres es
cualitativo, por ejemplo
, trazar un histograma bidimensional
no tiene sentido. Frecuentemente se prefiere superponer
histogramas unidimensionales de los valores de
, para cada una
de las modalidades de
. Si
es binario e
continuo, por
ejemplo
es el sexo e
es la edad, frecuentemente se
representa el carácter cuantitativo en la ordenada y se trazan dos
histogramas horizontales frente a frente, se obtiene así una
''pirámide de edades''.