¡Te damos la bienvenida a Scribd!

0% encontró este documento útil (0 votos)

75 vistas

Metodos No Jerarquicos PDF

Cargado por

Este resumen describe los pasos principales del algoritmo K-means para agrupar datos en clusters no jerárquicos. 1) Los datos se escalan y normalizan. 2) Se aplica el algoritmo K-means para dividir los datos en 4 grupos inicialmente seleccionados. 3) Se explora la inercia entre grupos para diferentes números de clusters con el objetivo de determinar el número óptimo de clusters.

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Metodos No Jerarquicos PDF

Cargado por

camila andrea infante burgos

0% encontró este documento útil (0 votos)

75 vistas3 páginas

Título original

METODOS NO JERARQUICOS.pdf

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

0% encontró este documento útil (0 votos)

75 vistas3 páginas

Metodos No Jerarquicos PDF

Cargado por

camila andrea infante burgos

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Descargar como pdf o txt

Saltar a página

Está en la página 1de 3

Buscar dentro del documento

METODOS NO JERARQUICOS

ALGORITMO K-MEANS

Preparamos el set de datos

Lo primero que se hace es escalar o normalizar los datos,para que ninguna variable tenga mas peso que otras

library(readxl)
datos <- read_excel("datos.xlsx")

insurance.scale <- as.data.frame(scale(datos[,5:9])) # escalar los datos

Creamos los clusters

1. Se debe fijar la semilla, ya que permite reproducir este mismo ejercicio, obteniendo siempre el mismo
resultado;si no se realiza este proceso, nos daria un resultado diferente ya que k-means tiene un componente
aleatorio, que al iniciarlo selecciona aleatoriamente las primeras observaciones, una para cada una de los clusters
que se hayan elegido

2. Luego se aplica k-means al juego de datos una vez escalados y le indicamos que queremos 4 clusters

se puede acceder a informacion como la asignacion de las observaciones a los clusters o a las distintas inercias

set.seed(80) # fijar semilla

insurance.km <- kmeans(insurance.scale, centers = 4) # Realizamos clustering

names(insurance.km) # contenido del objeto

## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"

## [6] "betweenss" "size" "iter" "ifault"

head(insurance.km$cluster) # asignación observaciones a clusters

## [1] 1 1 2 2 1 2

insurance.km$totss # inercia total

## [1] 90035

insurance.km$betweenss # inercia ínter grupos

## [1] 37343.34

insurance.km$withinss # inercia intra grupos

## [1] 13923.212 18128.295 11557.281 9082.873

insurance.km$tot.withinss # inercia intra grupos (total)

## [1] 52691.66

Determinar un número de clusters óptimo

No se puede determinar a primera medida un numero de clusters optimo, ya que depende de lo que se este
buscando, pero si hay una medida en la que nos podemos apoyar, la INERCIA INTERGRUPOS, para ello se
puede hacer una exploracion de los distintyos valores de esta inercia probando con un cluster, con dos, con tres y
asi sucesivamente hasta el numero que consideremos

sumbt<-kmeans(insurance.scale, centers = 1)$betweenss

for(i in 2:10) sumbt[i] <- kmeans(insurance.scale, centers = i)$betweenss
plot(1:10, sumbt, type = "b", xlab = "número de clusters", ylab = "suma de cuadrados ínter grupo
s")

Inspeccionando los resultados

Se va a presentar graficamente las dos variables iniciales antes de escalar como son la antiguedad en la
compañia y la antiguedad del permiso de conducir y le vamos a decir que pinte las observaciones en funcion del
cluster al que han sido asignadas Se introduce una etiqueta para las X “fidelidad de la persona a la compañia”
y una etiqueta para las Y “experiencia” de esta persona como conductor
plot(datos$ant_comp,datos$ant_perm, col=insurance.km$cluster ,xlab = "Fidelidad a la compañía",
ylab = "Experiencia" )

aggregate(datos[,5:9] ,by = list(insurance.km$cluster), mean)

## Group.1 siniestros ant_comp ant_perm edad ant_veh

## 1 1 0.07860090 5.107880 6.929652 26.18137 6.378267
## 2 2 0.12324723 3.351476 21.577491 49.34668 3.238561
## 3 3 0.05050768 13.761260 24.135381 47.18068 8.844832
## 4 4 0.03608529 4.038546 21.062603 47.30508 13.349645

Analisis

Cluster 2: Tienen el indice de siniestralidad mas alto corresponde a personas con una media de 49 años Tienen
la antiguedad del vehiculo en 3.2 años usan los vehiculos mas nuevos con las personas mayores de la muestra
de datos

También podría gustarte

115 Ejercicios resueltos de programación C++
De Everand
115 Ejercicios resueltos de programación C++
Jorge Fernando Betancourt Uscátegui
Calificación: 3.5 de 5 estrellas
3.5/5 (7)
JARG - Taller 6 - Weka
Documento13 páginas
JARG - Taller 6 - Weka
Johny Alejandro Rojas Gonzalez
Aún no hay calificaciones
Examen PCA y Clustering
Documento6 páginas
Examen PCA y Clustering
4txnwtm4tz
Aún no hay calificaciones
Tarea de Multivariado Caso Iris
Documento7 páginas
Tarea de Multivariado Caso Iris
Marilen Zenteno Garcia
Aún no hay calificaciones
Clu
Documento8 páginas
Clu
Edwin Johny Asnate Salazar
Aún no hay calificaciones
Análisis de Cluster, Un Ejemplo Sencillo
Documento9 páginas
Análisis de Cluster, Un Ejemplo Sencillo
justorfc
Aún no hay calificaciones
Introduccion A K Vecinos Mas Cercanos
Documento13 páginas
Introduccion A K Vecinos Mas Cercanos
Rafael Jiménez
Aún no hay calificaciones
Practica - Calificada - 3.ipynb - Colaboratory
Documento8 páginas
Practica - Calificada - 3.ipynb - Colaboratory
Jardel Huarancay Huaranga
Aún no hay calificaciones
Aprendizaje Supervisado
Documento6 páginas
Aprendizaje Supervisado
esuarezserrano
Aún no hay calificaciones
Clustering en R
Documento13 páginas
Clustering en R
roly
Aún no hay calificaciones
Kmeans
Documento9 páginas
Kmeans
Luis Alfred López
Aún no hay calificaciones
Localización de Varios Almacenes
Documento4 páginas
Localización de Varios Almacenes
Eduardo Antonio Coreas Romero
Aún no hay calificaciones
Lab1nn
Documento4 páginas
Lab1nn
wilson.lombardo42
Aún no hay calificaciones
Calcule La Prueba de Kruskal
Documento35 páginas
Calcule La Prueba de Kruskal
Juan Carlos Arellan Manrique
Aún no hay calificaciones
Casos-ML-Unsupervised - Eysen Perez
Documento1 página
Casos-ML-Unsupervised - Eysen Perez
EYSEN CHRISTOPHER PEREZ BAZAN
Aún no hay calificaciones
Modelos de Efectos Aleatorios
Documento10 páginas
Modelos de Efectos Aleatorios
pesquivias
Aún no hay calificaciones
Logistic Regressor p4
Documento18 páginas
Logistic Regressor p4
ricekoihan
Aún no hay calificaciones
Redes Neuronales Con Iris - Clasificacion
Documento31 páginas
Redes Neuronales Con Iris - Clasificacion
Cesar Andre Cherres Ramírez
Aún no hay calificaciones
Taller 1 Ia
Documento10 páginas
Taller 1 Ia
mauricionavas1972
Aún no hay calificaciones
Iris Naiye Bayes
Documento4 páginas
Iris Naiye Bayes
Erwin Wolf
Aún no hay calificaciones
Programacion Paralela
Documento7 páginas
Programacion Paralela
Cristian Martinez
Aún no hay calificaciones
Kmeans-Cluster-Bidimensional - Eysen Perez
Documento1 página
Kmeans-Cluster-Bidimensional - Eysen Perez
EYSEN CHRISTOPHER PEREZ BAZAN
Aún no hay calificaciones
Clase4 2
Documento4 páginas
Clase4 2
Rafexo Mamani
Aún no hay calificaciones
Reporte de Máquina de Aprendizaje No Supervisado
Documento27 páginas
Reporte de Máquina de Aprendizaje No Supervisado
luis tellez
Aún no hay calificaciones
Laboratorio 7 - Agrupamiento o Clustering (Autónocvcmo)
Documento11 páginas
Laboratorio 7 - Agrupamiento o Clustering (Autónocvcmo)
daefelizcum
Aún no hay calificaciones
Ejercicio Agrupaciones Electiva
Documento4 páginas
Ejercicio Agrupaciones Electiva
Alonso Acosta
Aún no hay calificaciones
Produto Final
Documento13 páginas
Produto Final
8232200110
Aún no hay calificaciones
3.2 Practica
Documento11 páginas
3.2 Practica
Jairo Leonardo Ortiz Fontalvo
Aún no hay calificaciones
Iris data visualization and KNN classification
Documento10 páginas
Iris data visualization and KNN classification
chatborg
Aún no hay calificaciones
Laboratory 3 Numerical and Data Intensive Computing Dr. Carlos Snatacruz JLCM CANH
Documento9 páginas
Laboratory 3 Numerical and Data Intensive Computing Dr. Carlos Snatacruz JLCM CANH
Jose Luis Carrillo Medina
Aún no hay calificaciones
AMV02 Análisis Cluster
Documento25 páginas
AMV02 Análisis Cluster
Uriel Garcia
Aún no hay calificaciones
Ejemplos Adicionales CRISP-DM
Documento10 páginas
Ejemplos Adicionales CRISP-DM
Sam Smith
Aún no hay calificaciones
Minería de Datos de Informes Comerciales
Documento20 páginas
Minería de Datos de Informes Comerciales
ScribdTranslations
Aún no hay calificaciones
Práctica 3 - Estimacion de Parámetros
Documento11 páginas
Práctica 3 - Estimacion de Parámetros
José Luis Fernández Vázquez
Aún no hay calificaciones
ExamenSustitutorio CC421
Documento11 páginas
ExamenSustitutorio CC421
RONALDO LOPEZ CAMPOMANES
Aún no hay calificaciones
Pronostico de Agua Potable Aplicando Ia
Documento7 páginas
Pronostico de Agua Potable Aplicando Ia
MarleneFacundoNeyra
Aún no hay calificaciones
Caso de Estudio 2 Conglomerados
Documento5 páginas
Caso de Estudio 2 Conglomerados
andresjojoa2004
Aún no hay calificaciones
Análisis de Cluster
Documento13 páginas
Análisis de Cluster
hopumental
Aún no hay calificaciones
Práctica 1: Mario Fernández González
Documento4 páginas
Práctica 1: Mario Fernández González
Mario Fernandez
Aún no hay calificaciones
Tarea 4
Documento12 páginas
Tarea 4
Arnau Monzo Ferragut
Aún no hay calificaciones
Ejercicio de TreeDecision - KMeans
Documento4 páginas
Ejercicio de TreeDecision - KMeans
ALEJANDRO
Aún no hay calificaciones
02 CalderonBermudo Maquinas Con Vectores de SoporteEjercicio Propuesto - Jupyter Notebook
Documento10 páginas
02 CalderonBermudo Maquinas Con Vectores de SoporteEjercicio Propuesto - Jupyter Notebook
PAULO CESAR CALDERON BERMUDO
Aún no hay calificaciones
Regresión Lineal Múltiple Con Python
Documento6 páginas
Regresión Lineal Múltiple Con Python
Leonardo Andres Garrido
Aún no hay calificaciones
Cap 8
Documento15 páginas
Cap 8
Yosef GUEVARA SALAMANCA
Aún no hay calificaciones
ISRAEL2
Documento3 páginas
ISRAEL2
eduardgue811
Aún no hay calificaciones
Monitoria No.2
Documento8 páginas
Monitoria No.2
Juan Serrato
Aún no hay calificaciones
(P2-1) Estadistica Descriptiva
Documento24 páginas
(P2-1) Estadistica Descriptiva
David Ayala
Aún no hay calificaciones
CD Tarea3 Antonio Marino
Documento6 páginas
CD Tarea3 Antonio Marino
German Galdamez Ovando
Aún no hay calificaciones
Segmentación Con R
Documento6 páginas
Segmentación Con R
jose
Aún no hay calificaciones
4ta Práctica Calificada Parte 01
Documento14 páginas
4ta Práctica Calificada Parte 01
Cristian Orbegoso
Aún no hay calificaciones
Regresión Logistica
Documento12 páginas
Regresión Logistica
semestre888
Aún no hay calificaciones
Clasificadores
Documento9 páginas
Clasificadores
semestre888
Aún no hay calificaciones
Practica 5
Documento8 páginas
Practica 5
Victor Jose Castro Pin
Aún no hay calificaciones
L-CDM 23 001063 01
Documento8 páginas
L-CDM 23 001063 01
erickliguista2
Aún no hay calificaciones
Estad U2 T2
Documento10 páginas
Estad U2 T2
Amy Aguaguiña
Aún no hay calificaciones
t5 Introduccion Al Aprendizaje Automatico
Documento3 páginas
t5 Introduccion Al Aprendizaje Automatico
Marina Villanueva Pelayo
Aún no hay calificaciones
Consenso de muestra aleatoria: Estimación robusta en visión por computadora
De Everand
Consenso de muestra aleatoria: Estimación robusta en visión por computadora
Fouad Sabry
Aún no hay calificaciones
Ejercicios de Inferencia Estadística
De Everand
Ejercicios de Inferencia Estadística
Simone Malacrida
Aún no hay calificaciones
Ajedrez Java Algoritmos
De Everand
Ajedrez Java Algoritmos
Abel Gallart Bonome
Aún no hay calificaciones
Modelado y simulación de redes. Aplicación de QoS con opnet modeler
De Everand
Modelado y simulación de redes. Aplicación de QoS con opnet modeler
José Márquez Díaz
Aún no hay calificaciones
EVALUACIÓN de ENTRADA - Revisión de Intentos - Distancia Arq. Antezana Biv
Documento7 páginas
EVALUACIÓN de ENTRADA - Revisión de Intentos - Distancia Arq. Antezana Biv
lino
Aún no hay calificaciones
Foro Medicina Tradicional Andina
Documento3 páginas
Foro Medicina Tradicional Andina
Angel Ugarte
Aún no hay calificaciones
Grilletes G-2130 Kinglift
Documento1 página
Grilletes G-2130 Kinglift
karina.briones
100% (1)
Ciclo Vital, Estilos de Vida y Salud
Documento102 páginas
Ciclo Vital, Estilos de Vida y Salud
Dianna N Sánchez
Aún no hay calificaciones
Grado Fisioterapia Edurne Urzain
Documento43 páginas
Grado Fisioterapia Edurne Urzain
Anonymous PoaioEkYJ
Aún no hay calificaciones
Modernismo Madrileño
Documento15 páginas
Modernismo Madrileño
jorge
Aún no hay calificaciones
COM - Organizamos Nuestras Actividades
Documento6 páginas
COM - Organizamos Nuestras Actividades
Karla Vasquez Valdivia
Aún no hay calificaciones
SSP 170 Tratamiento de Los Gases de Escape en Motores Gasolina
Documento36 páginas
SSP 170 Tratamiento de Los Gases de Escape en Motores Gasolina
Angel Fusalba
100% (1)
Ensayo Tiempos Muertos
Documento13 páginas
Ensayo Tiempos Muertos
Saul Percy Chircca Perez
Aún no hay calificaciones
Descripción de Publicaciones Seriadas. Apuntes de Catalogación - Bibliopos - Biblioteca de Recursos para Bibliotecarios y Opositores
Documento11 páginas
Descripción de Publicaciones Seriadas. Apuntes de Catalogación - Bibliopos - Biblioteca de Recursos para Bibliotecarios y Opositores
Iveth Lucia Caro Pinto
Aún no hay calificaciones
Mathcad - Memoria de Cálculo
Documento9 páginas
Mathcad - Memoria de Cálculo
vbarreto52
Aún no hay calificaciones
Mujer Verdadera 101 - Diseño Divino - Guía para Líderes - Artículos - Aviva Nuestros Corazones
Documento22 páginas
Mujer Verdadera 101 - Diseño Divino - Guía para Líderes - Artículos - Aviva Nuestros Corazones
Andrea Maldonado
100% (1)
3 - Tecnologías Limpias en La Industria de La Cerveza PDF
Documento41 páginas
3 - Tecnologías Limpias en La Industria de La Cerveza PDF
Yoel TC
Aún no hay calificaciones
Grupo 5, Laboratorio 3
Documento17 páginas
Grupo 5, Laboratorio 3
John Palomino
Aún no hay calificaciones
1 - Catalogo de Filtros Originales Importados.
Documento9 páginas
1 - Catalogo de Filtros Originales Importados.
Gean Marco Carrion Ccoicca
Aún no hay calificaciones
Lácteos Conclusiones Del Analisis Del Caso Diseño de Un Plan Haccp para El Proceso de Elaboración de Queso Tipo Gouda en Una Empresa de Productos
Documento2 páginas
Lácteos Conclusiones Del Analisis Del Caso Diseño de Un Plan Haccp para El Proceso de Elaboración de Queso Tipo Gouda en Una Empresa de Productos
Yanella Malpartida
Aún no hay calificaciones
Cti Durmientes
Documento7 páginas
Cti Durmientes
Elizabeth Andrade
Aún no hay calificaciones
Guia 11 - Lectura Veloz
Documento5 páginas
Guia 11 - Lectura Veloz
Juan Hv
Aún no hay calificaciones
Gramática Inglés - Modales Perfectos - Bluebloc Notes (Aprender Inglés)
Documento3 páginas
Gramática Inglés - Modales Perfectos - Bluebloc Notes (Aprender Inglés)
Johann Zabaleta
Aún no hay calificaciones
Tarea 4
Documento4 páginas
Tarea 4
Paul Bravo
Aún no hay calificaciones
Charlas TED - Storytelling y Oratoria
Documento13 páginas
Charlas TED - Storytelling y Oratoria
Facundo Rojas
Aún no hay calificaciones
Mega Guia para La Gestión Del Riesgo en Los Laboratorios PDF
Documento18 páginas
Mega Guia para La Gestión Del Riesgo en Los Laboratorios PDF
Raul Osinaga
Aún no hay calificaciones
Guia1 AyT - Mod.A
Documento2 páginas
Guia1 AyT - Mod.A
Julio Tranamil Tranamil
Aún no hay calificaciones
Proyecto InduccionMAT
Documento20 páginas
Proyecto InduccionMAT
pablo 2
Aún no hay calificaciones
Taller Resolución de Problemas T2 Grupo 2
Documento20 páginas
Taller Resolución de Problemas T2 Grupo 2
n00360902
Aún no hay calificaciones
Guia Lengua Decimo Ano
Documento48 páginas
Guia Lengua Decimo Ano
Adri Naranjo
Aún no hay calificaciones
Documental Las 5 Leyes Biológicas
Documento3 páginas
Documental Las 5 Leyes Biológicas
chusju
Aún no hay calificaciones
Folleto Epson PowerLite S39
Documento2 páginas
Folleto Epson PowerLite S39
Jorge Fabián De La Vega Estrada
Aún no hay calificaciones
Triptico Quema de Basura
Documento2 páginas
Triptico Quema de Basura
Benjamin Estrella
Aún no hay calificaciones
Control de Calidad de La Madera
Documento4 páginas
Control de Calidad de La Madera
NataliaSanchez
Aún no hay calificaciones