0% found this document useful (0 votes)

27 views1 page

Numpy NP Sklearn - Cluster Sklearn Sklearn - Datasets Sklearn - Preprocessing

This document performs DBSCAN clustering on sample data containing 3 clusters to identify the optimal number of clusters. It generates sample data of 750 points centered around 3 clusters, standardizes the data, runs DBSCAN with epsilon=0.3 and min_samples=10, and evaluates the clustering results with various metrics. It estimates 3 clusters and 18 noise points, and the clustering has high homogeneity, completeness, V-measure, Adjusted Rand Index, and Adjusted Mutual Information according to the metric evaluations.

Uploaded by

Swappy Boi

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

0% found this document useful (0 votes)

27 views1 page

Numpy NP Sklearn - Cluster Sklearn Sklearn - Datasets Sklearn - Preprocessing

Uploaded by

Swappy Boi

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

You are on page 1/ 1

In [3]: # DATA MINING ASSIGNMENT

# SONIYA NAYAK
# ADMISSION NUMBER - 17JE002726
import numpy as np

from sklearn.cluster import DBSCAN

from sklearn import metrics
from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler

# #############################################################################
# Generate sample data
centers = [[1, 1], [-1, -1], [1, -1]]
X, labels_true = make_blobs(n_samples=750, centers=centers, cluster_std=0.4,
random_state=0)

X = StandardScaler().fit_transform(X)

# #############################################################################
# Compute DBSCAN
db = DBSCAN(eps=0.3, min_samples=10).fit(X)
core_samples_mask = np.zeros_like(db.labels_, dtype=bool)
core_samples_mask[db.core_sample_indices_] = True
labels = db.labels_

# Number of clusters in labels, ignoring noise if present.

n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
n_noise_ = list(labels).count(-1)

print('Estimated number of clusters: %d' % n_clusters_)

print('Estimated number of noise points: %d' % n_noise_)
print("Homogeneity: %0.3f" % metrics.homogeneity_score(labels_true, labels))
print("Completeness: %0.3f" % metrics.completeness_score(labels_true, labels))
print("V-measure: %0.3f" % metrics.v_measure_score(labels_true, labels))
print("Adjusted Rand Index: %0.3f"
% metrics.adjusted_rand_score(labels_true, labels))
print("Adjusted Mutual Information: %0.3f"
% metrics.adjusted_mutual_info_score(labels_true, labels))
print("Silhouette Coefficient: %0.3f"
% metrics.silhouette_score(X, labels))

# #############################################################################
# Plot result
import matplotlib.pyplot as plt

# Black removed and is used for noise instead.

unique_labels = set(labels)
colors = [plt.cm.Spectral(each)
for each in np.linspace(0, 1, len(unique_labels))]
for k, col in zip(unique_labels, colors):
if k == -1:
# Black used for noise.
col = [0, 0, 0, 1]

class_member_mask = (labels == k)

xy = X[class_member_mask & core_samples_mask]

plt.plot(xy[:, 0], xy[:, 1], 'o', markerfacecolor=tuple(col),
markeredgecolor='k', markersize=14)

xy = X[class_member_mask & ~core_samples_mask]

plt.plot(xy[:, 0], xy[:, 1], 'o', markerfacecolor=tuple(col),
markeredgecolor='k', markersize=6)

plt.title('Estimated number of clusters: %d' % n_clusters_)

plt.show()

Estimated number of clusters: 3

Estimated number of noise points: 18
Homogeneity: 0.953
Completeness: 0.883
V-measure: 0.917
Adjusted Rand Index: 0.952
Adjusted Mutual Information: 0.916
Silhouette Coefficient: 0.626

In [ ]:

Intro Cluster Problem Python
No ratings yet
Intro Cluster Problem Python
13 pages
From Import Import As Import As From Import From Import From Import From Import
No ratings yet
From Import Import As Import As From Import From Import From Import From Import
9 pages
Clustering
No ratings yet
Clustering
1 page
ML
No ratings yet
ML
7 pages
DM ML Practical
No ratings yet
DM ML Practical
13 pages
ML Python Exercises UOM BDS Cluster Analysis
No ratings yet
ML Python Exercises UOM BDS Cluster Analysis
8 pages
Ass6(DMDS)
No ratings yet
Ass6(DMDS)
7 pages
Dbscan
No ratings yet
Dbscan
5 pages
Spectral Clustering
No ratings yet
Spectral Clustering
5 pages
AdaBoost
No ratings yet
AdaBoost
2 pages
ML2 Practical List
No ratings yet
ML2 Practical List
80 pages
Simple Case Study of Implementing K Means Clustering On The IRIS Dataset
No ratings yet
Simple Case Study of Implementing K Means Clustering On The IRIS Dataset
4 pages
DL_0801CS223D04_Assignment5.ipynb - Colab
No ratings yet
DL_0801CS223D04_Assignment5.ipynb - Colab
15 pages
Advance AI and ML LAB
No ratings yet
Advance AI and ML LAB
16 pages
Bilal Ahmad Ai & DSS Assign # 03
No ratings yet
Bilal Ahmad Ai & DSS Assign # 03
7 pages
Central Limit Theory
No ratings yet
Central Limit Theory
10 pages
TP_KmEANS
No ratings yet
TP_KmEANS
2 pages
EE 559 HW2Code PDF
No ratings yet
EE 559 HW2Code PDF
7 pages
DP prog
No ratings yet
DP prog
10 pages
Lab-5 Report
No ratings yet
Lab-5 Report
11 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
NguyenTrungThinh BT3.3
No ratings yet
NguyenTrungThinh BT3.3
5 pages
Import As Import From Import As: 'L.webm' 'R.webm'
No ratings yet
Import As Import From Import As: 'L.webm' 'R.webm'
4 pages
DVP 1
No ratings yet
DVP 1
24 pages
DATA MINING EX1
No ratings yet
DATA MINING EX1
10 pages
Programs
No ratings yet
Programs
8 pages
AML - LAB (1-6)
No ratings yet
AML - LAB (1-6)
15 pages
DM Slip Solutions
100% (1)
DM Slip Solutions
24 pages
Cran.r2021-Linear Regression and Logistic Regression With Missing Covariates
No ratings yet
Cran.r2021-Linear Regression and Logistic Regression With Missing Covariates
10 pages
Machine Learning Code Explanation
No ratings yet
Machine Learning Code Explanation
33 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Prac7 8 9 10
No ratings yet
Prac7 8 9 10
12 pages
2.3 Aiml Rishit
No ratings yet
2.3 Aiml Rishit
7 pages
ML Lab Programs For Exam
No ratings yet
ML Lab Programs For Exam
10 pages
assignment 3 solution
No ratings yet
assignment 3 solution
3 pages
Digits Recognition Dataset
No ratings yet
Digits Recognition Dataset
4 pages
Visualisation All
0% (1)
Visualisation All
70 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
Minor_lab
No ratings yet
Minor_lab
4 pages
Document
No ratings yet
Document
91 pages
DEEP LEARNING MANUAL Final
No ratings yet
DEEP LEARNING MANUAL Final
14 pages
42341102_BScMathSc_ProblemSolvingUsingComputers_So_241028_164636
No ratings yet
42341102_BScMathSc_ProblemSolvingUsingComputers_So_241028_164636
7 pages
assg 3
No ratings yet
assg 3
31 pages
CS2610 Final Exam: If Is - Nan Print
No ratings yet
CS2610 Final Exam: If Is - Nan Print
5 pages
Lecture 12 K-Nearest Neighbors
No ratings yet
Lecture 12 K-Nearest Neighbors
24 pages
Is Lab Aman Agarwal PDF
No ratings yet
Is Lab Aman Agarwal PDF
8 pages
Code
No ratings yet
Code
11 pages
Prob13: 1 EE16A Homework 13
No ratings yet
Prob13: 1 EE16A Homework 13
23 pages
KNN Model Find Optimanl K
No ratings yet
KNN Model Find Optimanl K
3 pages
kmeans
No ratings yet
kmeans
2 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
43 pages
PROBIN
No ratings yet
PROBIN
8 pages
DWDM Lab All
No ratings yet
DWDM Lab All
20 pages
perceptron-numpy
No ratings yet
perceptron-numpy
3 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Is Lab 7
No ratings yet
Is Lab 7
7 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
NewsISMDFD (17JE003386)
No ratings yet
NewsISMDFD (17JE003386)
1 page
Head Subcategory Item
No ratings yet
Head Subcategory Item
3 pages
Projection Samit
No ratings yet
Projection Samit
21 pages
Clipping Samit
No ratings yet
Clipping Samit
18 pages
Convex Hull - Graham Scan Algorithm: Point
No ratings yet
Convex Hull - Graham Scan Algorithm: Point
3 pages
Computational Complexity Theory
No ratings yet
Computational Complexity Theory
6 pages
Multi Depot Vehicle Routing Problem With Roaming Delivery 2024 Expert System
No ratings yet
Multi Depot Vehicle Routing Problem With Roaming Delivery 2024 Expert System
14 pages
Assignment 1: CS21003 Algorithms 1
No ratings yet
Assignment 1: CS21003 Algorithms 1
1 page
Final Exam - Decision Analytics
No ratings yet
Final Exam - Decision Analytics
10 pages
Lecture 2
No ratings yet
Lecture 2
35 pages
Lab Num
0% (1)
Lab Num
29 pages
Graph Theory
No ratings yet
Graph Theory
41 pages
0-1knapsack-Branch and Bound
No ratings yet
0-1knapsack-Branch and Bound
21 pages
Complete Introduction To Recursive Programming 1st Edition Manuel Rubio-Sanchez PDF For All Chapters
100% (3)
Complete Introduction To Recursive Programming 1st Edition Manuel Rubio-Sanchez PDF For All Chapters
52 pages
Question Paper
No ratings yet
Question Paper
3 pages
Click To Add Title: Efficient Code Writing For FSM in Verilog
No ratings yet
Click To Add Title: Efficient Code Writing For FSM in Verilog
25 pages
10 CE131P - INFLUENCE LINES (Robles)
No ratings yet
10 CE131P - INFLUENCE LINES (Robles)
10 pages
GTlecture 2
No ratings yet
GTlecture 2
53 pages
U4 - Functions Rules Tables Graphs Mapping1
No ratings yet
U4 - Functions Rules Tables Graphs Mapping1
4 pages
Lab 7
No ratings yet
Lab 7
3 pages
Chapter 2 Accuracy Ws 13
No ratings yet
Chapter 2 Accuracy Ws 13
3 pages
Digital System Experiment-2
No ratings yet
Digital System Experiment-2
9 pages
Lab Manual
No ratings yet
Lab Manual
64 pages
Þ 3.4 Hermite Interpolation: Find The) F (X), P' (X) F ' (X),, P (X) F (X) For All I 0, 1,, N
No ratings yet
Þ 3.4 Hermite Interpolation: Find The) F (X), P' (X) F ' (X),, P (X) F (X) For All I 0, 1,, N
8 pages
Solutions For QUIZ 1 - 15 Mins, All Questions Are 1 Point Each. Name: Score
No ratings yet
Solutions For QUIZ 1 - 15 Mins, All Questions Are 1 Point Each. Name: Score
2 pages
Lab Report 5 DSP
No ratings yet
Lab Report 5 DSP
8 pages
Increasing Decreasing Functions Worksheet
No ratings yet
Increasing Decreasing Functions Worksheet
6 pages
Numerical Analysis and Computer Programming PDF
No ratings yet
Numerical Analysis and Computer Programming PDF
39 pages
Linear Discriminant Analysis
No ratings yet
Linear Discriminant Analysis
33 pages
DSA 16
No ratings yet
DSA 16
32 pages
11 What Is Hashing in DBMS
No ratings yet
11 What Is Hashing in DBMS
20 pages
Carlos Hilado Memorial State Colleg1
No ratings yet
Carlos Hilado Memorial State Colleg1
3 pages
OTA Project (A1-G4)
No ratings yet
OTA Project (A1-G4)
12 pages
AI Assignment
No ratings yet
AI Assignment
29 pages
Algorithms by Jeff
No ratings yet
Algorithms by Jeff
8 pages

Numpy NP Sklearn - Cluster Sklearn Sklearn - Datasets Sklearn - Preprocessing

Uploaded by

Numpy NP Sklearn - Cluster Sklearn Sklearn - Datasets Sklearn - Preprocessing

Uploaded by

In [3]: # DATA MINING ASSIGNMENT

from sklearn.cluster import DBSCAN

# Number of clusters in labels, ignoring noise if present.

print('Estimated number of clusters: %d' % n_clusters_)

# Black removed and is used for noise instead.

xy = X[class_member_mask & core_samples_mask]

xy = X[class_member_mask & ~core_samples_mask]

plt.title('Estimated number of clusters: %d' % n_clusters_)

Estimated number of clusters: 3

You might also like