Escalamiento Multidimensional

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Escalamiento multidimensional

En los últimos años se puede obtener datos de todo y sin mayor dificultad a su acceso.
Hoy en día muchas de las investigaciones analizan grandes conjuntos de datos, utilizando
para ello las técnicas multivariantes. Por ese motivo, hay que importante mencionar que
las técnicas multivariantes cobran cada vez mayor importancia en las investigaciones.
Una de las técnicas multivariantes es el Escalamiento Multidimensional
(Multidimensional Scaling, MDS), una técnica multivariante de interdependencia que
trata de representar en un espacio geométrico de pocas dimensiones las proximidades
existentes entre un conjunto de objetos o de estímulos.
El MDS es una técnica de representación espacial que trata de visualizar sobre un mapa
un conjunto de estímulos (objeto de estudio) cuya posición relativa se desea analizar. El
propósito del MDS es transformar los juicios de similitud o preferencia llevados a cabo
por una serie de individuos sobre un conjunto de objetos o estímulos en distancias
susceptibles de ser representadas en un espacio multidimensional. El MDS está basado
en la comparación de objetos o de estímulos, de forma que si un individuo juzga a los
objetos A y B como los más similares entonces las técnicas de MDS colocarán a los
objetos A y B en el gráfico de forma que la distancia entre ellos sea más pequeña que la
distancia entre cualquier otro par de objetos. (Guerrero & Ramírez, 2011)
El Escalamiento multidimensional puede trabajar con diferentes tipos de datos de entrada
tablas de contingencia, matrices de proximidad, datos de perfil, correlaciones, etc.
El MDS puede ayudar a determinar:
 qué dimensiones utilizan los encuestados a la hora de evaluar a los objetos.
 cuántas dimensiones utilizan.
 la importancia relativa de cada dimensión.
 cómo se relacionan perceptualmente los objetos.
El MDS es una técnica que puede servir como alternativa o complemento a otras técnicas
multivariante como el análisis factorial o análisis clúster ya que tienen objetivos similares.
Modelo general de escalamiento multidimensional
En general, el MDS toma como entrada una matriz de proximidades, Mnxm, donde n es
el número de estímulos. Cada elemento aij de A representa la proximidad entre el estímulo
i y el estímulo j.
𝑎11 ⋯ 𝑎1𝑛
𝐴=( ⋮ ⋱ ⋮ )
𝑎𝑛1 ⋯ 𝑎𝑛𝑛
A partir de la matriz de proximidades el escalamiento multidimensional da como salida
otra matriz Xnxm donde n sigue siendo el número de estímulos y m es el número de
dimensiones. Cada xij representa la coordenada del estímulo i en la dimensión j.
𝑥11 ⋯ 𝑥1𝑚
𝑋=( ⋮ ⋱ ⋮ )
𝑥𝑛1 ⋯ 𝑥𝑛𝑚
De la matriz se puede calcular la distancia existente entre dos estímulos i y j, aplicando
la fórmula general de la distancia de Minkowski:
𝑝 𝑝
𝑑𝑖𝑗 = [∑𝑚
𝑡=1(𝑥𝑖𝑡 − 𝑥𝑗𝑡 ) ] , con p ≥ 1
Con lo cual se obtiene la matriz Dnxn de distancias:

La solución que proporciona el MDS debe ser la máxima correspondencia entre la


matriz de proximidades inicial A y la matriz de distancias D.
Modelos de escalamiento multidimensional
1) Modelo de escalamiento métrico
Considera datos que están medidos en escala de razón o en escala de intervalo.
Todo modelo de escalamiento parte de la idea que la distancia es una función de
las proximidades, 𝑑𝑖𝑗 = 𝑓(𝑑𝑖𝑗 ), para el escalamiento métrico
1. Se asume que la relación entre proximidades y distancias es de tipo
lineal.
2. Transformar la matriz de proximidades Anxn en una matriz de distancias
Dnxn que verifique los tres axiomas de la distancia euclídea:
 No negatividad, (dij ≥ 0 = dii)
 Simetría (dij = dji)
 Desigualdad triangular (dij ≤ dik + dkj)
Cuando el tercer axioma no se cumple, se tiene el problema
conocido como “estimación de la constante aditiva”. El problema se
soluciona estimando el valor mínimo de c que verifica la desigualdad
triangular de la siguiente forma:
cmin = max (i, j,k ){dij −dik − dkj}
De esta forma las distancias se obtienen sumando a las proximidades
la constante c, es decir, dij=dij+c

3. Obtener una matriz Bnxn de productos escalares entre vectores mediante


la siguiente transformación:


4. Transformar la matriz Bnxn en una matriz Xnxm tal que B=X·X’, donde X
es la matriz que nos da las coordenadas de cada uno de los n estímulos en
cada una de las m dimensiones.

2) Modelo de escalamiento no métrico


Considera datos medidos en escala ordinal. El modelo de escalamiento no
métrico establece una relación monótona creciente entre ambas, es decir,
Si dij < dkl ⇒ dij ≤ dkl. El procedimiento a realizar es el siguiente:
1. Transformación de la matriz de proximidades en una matriz de rangos,
desde 1 hasta (n (n - 1))/2.
2. Obtención de una matriz Xnxm de coordenadas aleatorias, que nos da la
distancia entre los estímulos.
3. Comparación de las proximidades con las distancias, obteniéndose las
disparidades (ďij).
4. Definición del Stress.
5. Minimización del Stress.
Tanto para el modelo métrico como para el modelo no métrico es necesario obtener un
coeficiente que nos informe sobre la bondad del modelo. Conocemos que las distancias
son una función de las proximidades, dij=f(δij). Esto no genera ningún margen de error,
sin embargo, en las proximidades empíricas es difícil que se dé la igualdad, con lo que
generalmente ocurre que dij≈f(δij). A las transformaciones de las proximidades por f se
le denomina disparidades. A partir de aquí podemos definir el error cuadrático como:

Como medida para la bondad del modelo generalmente se utiliza el Stress que Kruskal

Mientras mayor sea la diferencia entre las disparidades y las distancias (entre f(δij) y
dij), mayor será el Stress y por tanto peor será el modelo. Entonces, el Stress no es
propiamente una medida de la bondad del ajuste, sino una medida de la no bondad o del
ajuste. Su valor mínimo es 0, mientras que su límite superior para n estímulos es
2
√1 − 𝑛.

Kruskal (1964) sugiere las siguientes interpretaciones del Stress:


 0.2 = Pobre
 0.1 = Aceptable
 0.05 = Bueno
 0.025 = Aceptable
 0.0 = Excelente

Relación entre MDS y otras técnicas


El MDS puede ser utilizado en muchas investigaciones junto a otras técnicas
multivariantes, bien como una alternativa a dichas técnicas o bien como un complemento
a las mismas. La utilización de cada una de ellas va a depender de los objetivos que tenga
en la investigación. Por tanto, no hay una técnica mejor que otra, sino que en algunos
casos será más apropiado utilizar una técnica que en otros. Entre las ventajas de utilizar
el MDS en comparación con otras técnicas multivariantes están:
 Los datos pueden estar medidos en cualquier escala, mientras que en el análisis
factorial deben estar medidos en escala de razón o intervalo.
 Proporciona soluciones para cada individuo, lo cual no es posible con el análisis
factorial ni con el análisis clúster.
 En el MDS el investigador no necesita especificar cuáles son las variables a
emplear en la comparación de objetos, algo que es fundamental en el análisis
factorial y en el análisis clúster, con lo que se evita la influencia del investigador
en el análisis.
 Las soluciones proporcionadas por MDS suelen ser de menor dimensionalidad
que las proporcionadas por el análisis factorial.
 En MDS pueden ser interpretados directamente las distancias entre todos los
puntos, mientras que en el análisis de correspondencias solamente pueden ser
interpretadas directamente las distancias entre filas o bien entre columnas.
Ejemplo:
A modo de ejemplo, supongamos que estuviésemos interesados en obtener un mapa
perceptivo de los deportes y actividades físicas que los ciudadanos pueden practicar en
su tiempo de ocio. Para hacer el ejemplo manejable, elegimos 8 deportes o actividades
físicas y 16 sujetos, a los que les pedimos que nos indiquen sus preferencias marcando
con un 1 el deporte o actividad física más preferida para él/ella, con un 2 el deporte o
actividad física que prefiere en segundo lugar y así sucesivamente hasta marcar el que
prefiere en último lugar, al que le asignaría el número 8. Los deportes o actividades físicas
elegidos en el ejemplo son: fútbol, baloncesto, tenis, atletismo, caminar, nadar, andar en
bicicleta y correr.
Las preferencias indicadas por los sujetos se ofrecen en la siguiente tabla
El mapa perceptivo de los deportes y actividades físicas evaluadas por los sujetos de la muestra
obtenidos a través del programa SPSS. Para interpretar el significado de las dimensiones, nos
fijamos, primero, en las propiedades de los deportes o actividades físicas que ocupan los lugares
más extremos en cada una de las dimensiones. Es probable que tengan alguna propiedad
contrapuesta que nos ayude a interpretar el significado de la dimensión respectiva. Así, se puede
observar que en la dimensión 1 (horizontal) a la derecha están situadas las actividades físicas no
competitivas (caminar, nadar, correr y andar en bicicleta) y a la izquierda los deportes
competitivos (fútbol, atletismo, tenis y baloncesto). Podría interpretarse, por tanto, la
dimensión 2 como la competitividad de los deportes o actividades físicas. De modo semejante,
si observamos el posicionamiento de los deportes y actividades físicas en la dimensión 1,
podemos apreciar que hacia arriba están los deportes o actividades físicas de naturaleza
individual (caminar, nadar) y en la parte superior los deportes colectivos (fútbol, baloncesto).
Podría interpretarse, por tanto, esta segunda dimensión como el tipo de deporte o actividad:
individual versus colectivo.

También podría gustarte