Escalamiento Multidimensional Exposicion

Universidad Nacional Mayor de San Marcos
Facultad de Ciencias Matemáticas

Escuela Profesional de Estadística
ESCALAMIENTO
MULTIDIMENSIONAL
Estudiantes:
Carhuallay Cervantes, Yohn
Espíritu Victorio, Jorge
Paucar Chuco, Claudia
Tamayo Saavedra, Edgar
2022
ESCALAMIENTO MULTIDIMENSIONAL
El escalamiento multidimensional, más conocido como MultiDimensional Scaling (MDS), tiene

sus orígenes a principios de siglo XX en el campo de la Psicología. Surge cuando se pretendía
estudiar la relación que existía entre la intensidad física de ciertos estímulos con su intensidad
subjetiva. Es una técnica de representación espacial que trata de visualizar sobre un mapa un
conjunto de estímulos (firmas, productos, candidatos políticos, ideas u otros artículos) cuya
posición relativa se desea analizar. El propósito del MDS es transformar los juicios de similitud
o preferencia llevados a cabo por una serie de individuos sobre un conjunto de objetos o
estímulos en distancias susceptibles de ser representadas en un espacio multidimensional. El
MDS está basado en la comparación de objetos o de estímulos, de forma que si un individuo
juzga a los objetos A y B como los más similares entonces las técnicas de MDS colocarán a los
objetos A y B en el gráfico de forma que la distancia entre ellos sea más pequeña que la
distancia entre cualquier otro par de objetos.
El MDS puede ser apto para gran cantidad de tipos diferentes de datos de entrada (tablas de
contingencia, matrices de proximidad, datos de perfil, correlaciones, etc.).
El MDS puede ayudar a determinar:
• qué dimensiones utilizan los encuestados a la hora de evaluar a los objetos.

• cuántas dimensiones utilizan.
• la importancia relativa de cada dimensión.
• cómo se relacionan perceptualmente los objetos.
Entonces podemos decir que el MDS es una técnica multivariante que crea un gráfico
aproximado a partir de las similitudes o preferencias de un conjunto de objetos.
2. MODELO GENERAL DE ESCALAMIENTO MULTIDIMENSIONAL.

De modo general podemos decir que el MDS toma como entrada una matriz de proximidades,
∆∈M𝑛𝑥𝑚 , donde n es el número de estímulos. Cada elemento δ𝑖𝑗 de ∆ representa la
proximidad entre el estímulo i y el estímulo j.
A partir de esta matriz de proximidades el MDS nos proporciona como salida una matriz
cuadrada de orden M (X∈M𝑛𝑥𝑚 ) donde n, al igual que antes, es el número de estímulos, y m
es el número de dimensiones. Cada valor x𝑖𝑗 representa la coordenada del estímulo i en la
dimensión j (más adelante veremos el procedimiento para obtener esta matriz).
A partir de esta matriz X se puede calcular la distancia existente entre dos estímulos
cualesquiera i y j, simplemente aplicando la fórmula general de la distancia de Minkowski:
donde p puede ser un valor entre 1 e infinito. A partir de estas distancias podemos obtener
una matriz de distancias que denominamos D∈Mnxn:
La solución proporcionada por el MDS debe ser de tal modo que haya la máxima
correspondencia entre la matriz de proximidades inicial ∆ y la matriz de distancias obtenidas
D. Para que exista la máxima correspondencia MDS proporciona varias medidas
3. MODELOS DE ESCALAMIENTO MULTIDIMENSIONAL.

Existen dos modelos básicos de MDS que son: el modelo de escalamiento métrico (se
fundamenta en variables cuantitativas) y el modelo de escalamiento no métrico ( se
fundamenta en variables cualitativas). En el primero de ellos consideramos que los datos están
medidos en escala de razón o en escala de intervalo y en el segundo consideramos que los
datos están medidos en escala ordinal.
Modelo de escalamiento métrico
El escalamiento multidimensional fue desarrollado por Torgeson en 1952 es un método

utilizado para crear comparaciones entre cosas que son difíciles de comparar. El resultado final
de este proceso es generalmente una tabla de dos dimensiones que muestra un nivel de
similitud entre diferentes elementos, todo con relación a otro.
Entre estos modelos básicos de MDS tenemos: el modelo de escalamiento métrico y el modelo
de escalamiento no métrico.
Modelo de Escalamiento Multidimensional Métrico
Este método parte de una matriz de distancia D={dij} entre objetos. Usando las entradas de D
se construye una nueva matriz Q con entradas qij.
Medidas de bondad del ajuste
Stress
Este indicador de la bondad de ajuste, fue desarrollado por kruskal (1964). El valor del stress
deberá de ser tan pequeño como sea posible. Una mejor representación es aquella en la que el
stress está muy próxima al cero.
Consideremos como un buen ajuste a aquellos valores de stress que sean iguales a 0,1 y más
próximos a 0. Cabe resaltar, que el stress arroja un valor entre 0 y 1
Stress por punto
Se obtiene una gráfica que nos va mostrar que tan mal está representado ese punto medido
en una escala del o al 100%, es decir, con este indicador se puede identificar a los objetos que
están representados en la gráfica.
RSQ coeficiente de determinación
Es otro indicador de la bondad del ajuste de la representación gráfica (mapa perceptual), está
en el rango 0 a 1; cuanto más cerca está a 1, el modelo será considerado como “bueno o
perfecto”, mientras más próximo a cero, el modelo es “malo”.
Numero de estímulos (objetos) recomendados para aplicar EMM

Schiffman(1981) sugiere hasta 12 estímulos para una grafica de 2 dimensiones y hasta 16
estímulos para una gráfica de 3 dimensi9ones .
Kruskal y wish(1978) sugiere hasta 9 estímulos para una grafica de 2 dimensiones; hasta 13
estímulos para graficas de 3 dimensiones y hasta 17 estímulos para graficas de 4 dimensiones.
Si no cumplen con estos criterios, la representación grafica mapa perceptual perderá su

capacidad objetivo (ya no representará en forma efectiva la segmentación o posicionamiento)
EJEMPLO 1
Stress
El modelo presenta buen ajuste entonces es válido para tomar decisiones
Tenemos que identificar los que tiene porcentaje mayor estos son el casco viejo
25,37% y el remanso 26.38% estos son los peores representados, pero igual la gráfica es válida
para tomar decisiones.
RSQ= coeficiente de determinación =0.9702 Muy buen ajuste del modelo ya bque esta muy
cerca al 1
Mapa perceptual
• Segmento 1: Plan 3000, La Colorada, Villa 1° de mayo, Los lotes y El bajío

• Segmento 2: Urbari, Equipetrol
• Segmento 3: El remanso
• Segmento 4: Casco viejo
Modelo de Escalamiento Multidimensional No Métrico:
A diferencia del escalamiento métrico, este modelo no supone una relación lineal entre las
proximidades y las distancias, si no que establece una relación monótona creciente entre
ambas. Shepard (1962) demostró que es posible obtener soluciones métricas asumiendo
únicamente la relación ordinal entre proximidades y distancias; luego Kruskal (1964) mejoró el
modelo. El procedimiento sigue los siguientes apartados:
- Transformación de la matriz de proximidades en una matriz de rangos, desde

1 hasta (n (n - 1))/2
- Obtención de una matriz X ∈ Μnxm de coordenadas aleatorias, que nos da la
distancia entre los estímulos.
- Comparación de las proximidades con las distancias, obteniéndose las
disparidades (ďij).
- Definición del Stress.
- Minimización del Stress.
Como medida que nos informa de la bondad del modelo podemos utilizar el Stress que Kruskal
define como:
Kruskal sugiere las siguientes interpretaciones:
- 0.2: Pobre
- 0.1: Aceptable
- 0.05: Bueno
- 0.025: Aceptable
- 0.0: Excelente
También se puede utilizar otra medida que es el coeficiente de correlación al cuadrado (RSQ)
que brinda información de la proporción de variabilidad de los datos de partida que es
explicada por el modelo.
Los valores que toma oscilan entre 0 y 1, siendo que los valores cercanos a 1 indican que el
modelo es bueno y los valores cercanos a 0 indican que el modelo es malo.
EJEMPLO 2
Se tiene una serie de datos constituida por 251 personas, entre hombres y mujeres, en edades
comprendidas entre 24 y 44 años residentes en la ciudad de Riobamba, la variable procede de
la valoración que las personas han asignado a cada atributo, de acuerdo con cada uno de los
ítems de la Tabla sobre “atributos que influyen en la decisión de compra de productos
lácteos”. Las respuestas se establecen con una escala de Likert de 5 puntos (desde 1: “NO ES
IMPORTANTE”, hasta 5: “MUY IMPORTANTE”).
Ítem Atributo
1 Precio
2 Marca
3 Calidad
4 Sabor
5 Valor
nutricional
Se crea una de tabla con los datos aplicados en la encuesta, donde las filas representan el
número de encuestados con el valor de la escala de Likert que cada uno ha seleccionado y las
columnas representan las variables de estudio, como se muestra en la tabla, una parte de los
datos.
Lo primero que se realiza es instalar el paquete SMACOF de R, y se proporciona la matriz de

distancias.
#MATRIZ DE DISTANCIAS EUCLIDEAS
MDS no métrico por medio de la función smacof, se obtiene la salida del escalamiento
multidimensional no métrico ordinal en dos dimensiones, ya que en este caso se trabaja con
datos ordinales.
Se observa las coordenadas de cada atributo en ambas dimensiones, coordenadas cuya

representación gráfica se da en el gráfico siguiente.
> plot(modelo)
En la gráfica, se aprecia que los atributos calidad y sabor se encuentran cerca entre si y a su vez
ambos atributos se encuentran lejos de marca, del mismo modo que precio se encuentra
alejado de valor nutricional.
0.8266888, resulta de tomar las distancias euclídeas, para la distancia entre marca y precio.
Se observa que el punto peor representado será la marca, por considerar el .50% del total del
stress.
La proporción de variabilidad de los datos de partida que es explicada por el modelo es

99.99899%. El ajuste es bueno ya que se puede observar el RSQ> 0.6, siendo casi cercano al 1.
En la figura del diagrama de Shepard muestra las disimilaridades frente a las distancias
transformadas (disparidades).
Como el stress = 0.001 se encuentra entre 0.00 y 0.01, siendo que se acerca a 0, se puede decir
que presenta un ajuste perfecto.
SINTAXIS DEL EJERCICIO 1
#cargando base de datos
datos<-read.delim("clipboard")
datos
#Normalizando
datos_ch<-scale(datos[2:6],center=T,scale=T)
datos_ch<-as.data.frame(datos_ch)
#Matriz de distancias euclideanas
distancia_euc<-dist(datos_ch,method="euclidian",diag = T,upper = T)
#Asignar nombre a los objetos
m<-as.matrix(distancia_euc)
rownames(m)<-paste(datos$ZONA)#cambiar nombres a filas
colnames(m)<-paste(datos$ZONA)#cambiar nombre a columnas
euclideas<-as.dist(m)
#algoritmo escalamiento multi
install.packages("smacof")
library(smacof)
aemm<-mds(delta=euclideas,ndim=2,type="ratio")
#stress
print(aemm$stress)
#stress por punto
print(aemm$spp)
#RSQ
dist<-cbind(c(aemm$dhat))
dism<-cbind(c(aemm$confdist))
summary(lm(dist~dism))
#Mapa perceptual
plot(aemm$conf,pch=7,xlim=range(aemm$conf),repel=T)
#Dar nombres para que aparezca la grafica
ZONAS<-c("Plan 3000","villa1 de mayo","Los lotes","La colorada",
"El Remanso","El Bajio","Casco viejo","Equipetrol","Urbari")
text(aemm$conf,pos=1,labels = ZONAS)
SINTAXIS DEL EJERCICIO 2
library(smacof)
# Introducción de la matriz de datos
datos <- matrix(c(0.00, 19.24, 23.11, 25.83, 26.21,
19.24, 0.00, 24.00, 26.10, 25.51,
23.11, 24.00, 0.00, 14.25, 17.46,
25.83, 26.10, 14.25, 0.00, 17.44,
26.21, 25.51, 17.46, 17.44, 0.00),
ncol=5, byrow=T,
dimnames =list(c("precio","marca","calidad","sabor","valor_nutricional")))
modelo<-mds(delta=datos, ndim=3,type="ordinal")
# coordenadas
print(modelo$conf)
plot(modelo)
# Disparidades
print (modelo$dhat)
# Distancias entre configuraciones
print(modelo$confdist)
# Stress por punto

print(modelo$spp)
# RSQ
print (1-modelo$rss)
# Gráfico de Shepard
plot(modelo, plot.type="Shepard",
plot.dim=c(1,3))
# medida de Streess
print(modelo$stress)

Escalamiento Multidimensional Exposicion

Cargado por

Copyright:

Formatos disponibles

Escalamiento Multidimensional Exposicion

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Escalamiento Multidimensional Exposicion

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional Mayor de San Marcos

Facultad de Ciencias Matemáticas

Carhuallay Cervantes, Yohn

Espíritu Victorio, Jorge

Paucar Chuco, Claudia

Tamayo Saavedra, Edgar

El escalamiento multidimensional, más conocido como MultiDimensional Scaling (MDS), tiene

El MDS puede ayudar a determinar:

• qué dimensiones utilizan los encuestados a la hora de evaluar a los objetos.

2. MODELO GENERAL DE ESCALAMIENTO MULTIDIMENSIONAL.

3. MODELOS DE ESCALAMIENTO MULTIDIMENSIONAL.

El escalamiento multidimensional fue desarrollado por Torgeson en 1952 es un método

Modelo de Escalamiento Multidimensional Métrico

Medidas de bondad del ajuste

Stress por punto

RSQ coeficiente de determinación

Numero de estímulos (objetos) recomendados para aplicar EMM

Si no cumplen con estos criterios, la representación grafica mapa perceptual perderá su

El modelo presenta buen ajuste entonces es válido para tomar decisiones

• Segmento 1: Plan 3000, La Colorada, Villa 1° de mayo, Los lotes y El bajío

- Transformación de la matriz de proximidades en una matriz de rangos, desde

Kruskal sugiere las siguientes interpretaciones:

Lo primero que se realiza es instalar el paquete SMACOF de R, y se proporciona la matriz de

Se observa las coordenadas de cada atributo en ambas dimensiones, coordenadas cuya

La proporción de variabilidad de los datos de partida que es explicada por el modelo es

#cargando base de datos

#Matriz de distancias euclideanas

#Asignar nombre a los objetos

rownames(m)<-paste(datos$ZONA)#cambiar nombres a filas

colnames(m)<-paste(datos$ZONA)#cambiar nombre a columnas

#algoritmo escalamiento multi

#stress por punto

ZONAS<-c("Plan 3000","villa1 de mayo","Los lotes","La colorada",

"El Remanso","El Bajio","Casco viejo","Equipetrol","Urbari")

SINTAXIS DEL EJERCICIO 2

# Stress por punto

También podría gustarte