Escalamiento Multidimensional Exposicion
Escalamiento Multidimensional Exposicion
Escalamiento Multidimensional Exposicion
ESCALAMIENTO
MULTIDIMENSIONAL
Estudiantes:
2022
ESCALAMIENTO MULTIDIMENSIONAL
El MDS puede ser apto para gran cantidad de tipos diferentes de datos de entrada (tablas de
contingencia, matrices de proximidad, datos de perfil, correlaciones, etc.).
Entonces podemos decir que el MDS es una técnica multivariante que crea un gráfico
aproximado a partir de las similitudes o preferencias de un conjunto de objetos.
A partir de esta matriz X se puede calcular la distancia existente entre dos estímulos
cualesquiera i y j, simplemente aplicando la fórmula general de la distancia de Minkowski:
donde p puede ser un valor entre 1 e infinito. A partir de estas distancias podemos obtener
una matriz de distancias que denominamos D∈Mnxn:
La solución proporcionada por el MDS debe ser de tal modo que haya la máxima
correspondencia entre la matriz de proximidades inicial ∆ y la matriz de distancias obtenidas
D. Para que exista la máxima correspondencia MDS proporciona varias medidas
Entre estos modelos básicos de MDS tenemos: el modelo de escalamiento métrico y el modelo
de escalamiento no métrico.
Este método parte de una matriz de distancia D={dij} entre objetos. Usando las entradas de D
se construye una nueva matriz Q con entradas qij.
Stress
Este indicador de la bondad de ajuste, fue desarrollado por kruskal (1964). El valor del stress
deberá de ser tan pequeño como sea posible. Una mejor representación es aquella en la que el
stress está muy próxima al cero.
Consideremos como un buen ajuste a aquellos valores de stress que sean iguales a 0,1 y más
próximos a 0. Cabe resaltar, que el stress arroja un valor entre 0 y 1
Se obtiene una gráfica que nos va mostrar que tan mal está representado ese punto medido
en una escala del o al 100%, es decir, con este indicador se puede identificar a los objetos que
están representados en la gráfica.
Es otro indicador de la bondad del ajuste de la representación gráfica (mapa perceptual), está
en el rango 0 a 1; cuanto más cerca está a 1, el modelo será considerado como “bueno o
perfecto”, mientras más próximo a cero, el modelo es “malo”.
Kruskal y wish(1978) sugiere hasta 9 estímulos para una grafica de 2 dimensiones; hasta 13
estímulos para graficas de 3 dimensiones y hasta 17 estímulos para graficas de 4 dimensiones.
EJEMPLO 1
Stress
Tenemos que identificar los que tiene porcentaje mayor estos son el casco viejo
25,37% y el remanso 26.38% estos son los peores representados, pero igual la gráfica es válida
para tomar decisiones.
RSQ= coeficiente de determinación =0.9702 Muy buen ajuste del modelo ya bque esta muy
cerca al 1
Mapa perceptual
A diferencia del escalamiento métrico, este modelo no supone una relación lineal entre las
proximidades y las distancias, si no que establece una relación monótona creciente entre
ambas. Shepard (1962) demostró que es posible obtener soluciones métricas asumiendo
únicamente la relación ordinal entre proximidades y distancias; luego Kruskal (1964) mejoró el
modelo. El procedimiento sigue los siguientes apartados:
Como medida que nos informa de la bondad del modelo podemos utilizar el Stress que Kruskal
define como:
- 0.2: Pobre
- 0.1: Aceptable
- 0.05: Bueno
- 0.025: Aceptable
- 0.0: Excelente
También se puede utilizar otra medida que es el coeficiente de correlación al cuadrado (RSQ)
que brinda información de la proporción de variabilidad de los datos de partida que es
explicada por el modelo.
Los valores que toma oscilan entre 0 y 1, siendo que los valores cercanos a 1 indican que el
modelo es bueno y los valores cercanos a 0 indican que el modelo es malo.
EJEMPLO 2
Se tiene una serie de datos constituida por 251 personas, entre hombres y mujeres, en edades
comprendidas entre 24 y 44 años residentes en la ciudad de Riobamba, la variable procede de
la valoración que las personas han asignado a cada atributo, de acuerdo con cada uno de los
ítems de la Tabla sobre “atributos que influyen en la decisión de compra de productos
lácteos”. Las respuestas se establecen con una escala de Likert de 5 puntos (desde 1: “NO ES
IMPORTANTE”, hasta 5: “MUY IMPORTANTE”).
Ítem Atributo
1 Precio
2 Marca
3 Calidad
4 Sabor
5 Valor
nutricional
Se crea una de tabla con los datos aplicados en la encuesta, donde las filas representan el
número de encuestados con el valor de la escala de Likert que cada uno ha seleccionado y las
columnas representan las variables de estudio, como se muestra en la tabla, una parte de los
datos.
MDS no métrico por medio de la función smacof, se obtiene la salida del escalamiento
multidimensional no métrico ordinal en dos dimensiones, ya que en este caso se trabaja con
datos ordinales.
> plot(modelo)
En la gráfica, se aprecia que los atributos calidad y sabor se encuentran cerca entre si y a su vez
ambos atributos se encuentran lejos de marca, del mismo modo que precio se encuentra
alejado de valor nutricional.
0.8266888, resulta de tomar las distancias euclídeas, para la distancia entre marca y precio.
Se observa que el punto peor representado será la marca, por considerar el .50% del total del
stress.
En la figura del diagrama de Shepard muestra las disimilaridades frente a las distancias
transformadas (disparidades).
Como el stress = 0.001 se encuentra entre 0.00 y 0.01, siendo que se acerca a 0, se puede decir
que presenta un ajuste perfecto.
SINTAXIS DEL EJERCICIO 1
datos<-read.delim("clipboard")
datos
#Normalizando
datos_ch<-scale(datos[2:6],center=T,scale=T)
datos_ch<-as.data.frame(datos_ch)
distancia_euc<-dist(datos_ch,method="euclidian",diag = T,upper = T)
m<-as.matrix(distancia_euc)
euclideas<-as.dist(m)
install.packages("smacof")
library(smacof)
aemm<-mds(delta=euclideas,ndim=2,type="ratio")
#stress
print(aemm$stress)
print(aemm$spp)
#RSQ
dist<-cbind(c(aemm$dhat))
dism<-cbind(c(aemm$confdist))
summary(lm(dist~dism))
#Mapa perceptual
plot(aemm$conf,pch=7,xlim=range(aemm$conf),repel=T)
#Dar nombres para que aparezca la grafica
text(aemm$conf,pos=1,labels = ZONAS)
library(smacof)
# Introducción de la matriz de datos
datos <- matrix(c(0.00, 19.24, 23.11, 25.83, 26.21,
19.24, 0.00, 24.00, 26.10, 25.51,
23.11, 24.00, 0.00, 14.25, 17.46,
25.83, 26.10, 14.25, 0.00, 17.44,
26.21, 25.51, 17.46, 17.44, 0.00),
ncol=5, byrow=T,
dimnames =list(c("precio","marca","calidad","sabor","valor_nutricional")))
modelo<-mds(delta=datos, ndim=3,type="ordinal")
# coordenadas
print(modelo$conf)
plot(modelo)
# Disparidades
print (modelo$dhat)
# Distancias entre configuraciones
print(modelo$confdist)
# RSQ
print (1-modelo$rss)
# Gráfico de Shepard
plot(modelo, plot.type="Shepard",
plot.dim=c(1,3))
# medida de Streess
print(modelo$stress)