Boletines

Boletín Electrónico N° 25
LECTURA DEL DENDOGRAMA
Segunda parte



En el Análisis de Cluster es necesario decidir la cantidad de segmentos que quedan determinados. Para ello, se cuenta con la ayuda del "dendograma", que es un gráfico que muestra las distancias existentes entre los segmentos para los diversos cortes posibles.

Allí se ve si el pasaje de n grupos a n-1 grupos nos obliga a juntar grupos muy diversos o si son lo suficientemente parecidos como para que resulte inconveniente mantenerlos separados.

El procedimiento para armar el Dendograma es el siguiente:

Se comienza con todos los individuos separados. Es decir, en el punto de arranque cada individuo forma un grupo de un solo elemento.

El primer paso consiste en juntar a los dos grupos (individuos en este paso) cuyos vectores de información sean lo más parecidos entre todos los pares posibles, o lo que es lo mismo, aquellos con menor distancia entre sí. En el ejemplo se juntan primero Juan y Pedro.

En el segundo paso tenemos ahora n-1 grupos. Para continuar se debe calcular el vector de información del primer grupo formado y repetir el proceso comparando todos los vectores de información para determinar el segundo par más parecido.

En el ejemplo, los vectores de información más parecidos son el del grupo [Juan;Pedro] con el de Mario. Por esta razón se forma un grupo de tres individuos: Juan, Pedro y Mario.

En el tercer paso, los más parecidos resultan ser Silvia y Noemí, quienes pasan a formar un grupo.

Si detenemos el proceso de agrupamiento en este punto, tendremos 3 grupos: el primero, formado por Mario, Juan y Pedro; el segundo, por Ana y, el último, por Silvia y Noemí.

Si en cambio lo dejamos continuar, en el siguiente paso Ana pasa a formar parte del grupo de Mario, Juan y Pedro. Finalmente, este grupo se unirá con de Silvia y Noemí, concluyendo el proceso.

Veamos ahora las distancias a las que se formó cada grupo. Juan y Pedro se juntaron a una distancia de 2,37, la menor de todas, y por eso se juntaron primero. El grupo de Juan y Pedro se junta con Mario a una distancia de 5,48, y así sucesivamente.

El dendograma permite decidir cuál es la cantidad ideal de grupos, es decir, aquella donde no queden grupos parecidos separados ni se fuerce la unión de grupos muy diferentes. Analizando las ramas o brazos del diagrama de árbol (dendograma) es posible encontrar este punto.

En el ejemplo se podría optar por cortar a la altura de 3 grupos, o también, de 2 grupos. Aquí elegimos 3 grupos porque, sin duda, resulta conceptualmente más interesante, dado que la última rama es en general la más larga y produce una partición trivial.