0% found this document useful (0 votes)

134 views3 pages

Salesforce PD1

The Python code performs K-Means clustering on a customer dataset to determine the optimal number of clusters. It loads customer data, checks for null values, creates a scatter plot of Age vs Spending Score, uses the elbow method to find the best k between 1-10, and plots the clustered data points. It also shows an alternative sub-optimal approach that manually selects k=6.

Uploaded by

Vigneshwaran Ganapathi

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

0% found this document useful (0 votes)

134 views3 pages

Salesforce PD1

Uploaded by

Vigneshwaran Ganapathi

Available Formats

Download as PDF, TXT or read online on Scribd

Download as pdf or txt

You are on page 1/ 3

Que : You work in XYZ Company as a Python Developer.

The company officials want you to

write code for a clustering problem. Dataset: customers.csv Tasks to be performed: 1. K-
Means Clustering: - Load customer data. - Check the number of cells in each column with
null values. - Create a scatter plot with Age as X and Spending Score as Y. - Find out the best
number for clusters between 1 and 10 (inclusive) using the elbowmethod. - Draw a scatter
plot displaying data points colored on the basis of clusters

For Optimal:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from yellowbrick.cluster import KElbowVisualizer

# Load customer data

data = pd.read_csv('customers.csv')

# Check for null values

print(data.isnull().sum())

# Create a scatter plot with Age as X and Spending Score as Y

plt.scatter(data['Age'], data['Spending Score (1-100)'])
plt.xlabel('Age')
plt.ylabel('Spending Score (1-100)')
plt.show()

# Use the optimal k-means clustering algorithm to determine the number of clusters
model = KMeans()
visualizer = KElbowVisualizer(model, k=(1,10))
visualizer.fit(data[['Age', 'Spending Score (1-100)']])
visualizer.show()

# Draw a scatter plot displaying data points colored on the basis of clusters
optimal_k = visualizer.elbow_value_
kmeans = KMeans(n_clusters=optimal_k, init='k-means++', max_iter=300, n_init=10,
random_state=0)
clusters = kmeans.fit_predict(data[['Age', 'Spending Score (1-100)']])
data['Cluster'] = clusters
plt.scatter(data['Age'], data['Spending Score (1-100)'], c=data['Cluster'], cmap='viridis')
plt.xlabel('Age')
plt.ylabel('Spending Score (1-100)')
plt.show()

For Sub-Optimal:
import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

# Load customer data

data = pd.read_csv('customers.csv')

# Check for null values

print(data.isnull().sum())

# Create a scatter plot with Age as X and Spending Score as Y

plt.scatter(data['Age'], data['Spending Score (1-100)'])

plt.xlabel('Age')
plt.ylabel('Spending Score (1-100)')

plt.show()

# Use the suboptimal k-means clustering algorithm to determine the number of clusters

sum_of_squared_distances = []

K = range(1,11)

for k in K:

km = KMeans(n_clusters=k, init='k-means++', max_iter=300, n_init=10, random_state=0)

km = km.fit(data[['Age', 'Spending Score (1-100)']])

sum_of_squared_distances.append(km.inertia_)

plt.plot(K, sum_of_squared_distances, 'bx-')

plt.xlabel('Number of Clusters')

plt.ylabel('Sum of Squared Distances')

plt.title('Elbow Method For Optimal k')

plt.show()

# Draw a scatter plot displaying data points colored on the basis of clusters

suboptimal_k = 6 # a value selected as an example

kmeans = KMeans(n_clusters=suboptimal_k, init='k-means++', max_iter=300, n_init=10,

random_state=0)

clusters = kmeans.fit_predict(data[['Age', 'Spending Score (1-100)']])

data['Cluster'] = clusters

plt.scatter(data['Age'], data['Spending Score (1-100)'], c=data['Cluster'], cmap='viridis')

plt.xlabel('Age')

plt.ylabel('Spending Score (1-100)')

plt.show()

Salesforce Developer I Certification by Konstantin Kapitanov
No ratings yet
Salesforce Developer I Certification by Konstantin Kapitanov
265 pages
Sales Cloud 2
100% (1)
Sales Cloud 2
16 pages
DEV 402 Salesforce Certified Platform App Builder
No ratings yet
DEV 402 Salesforce Certified Platform App Builder
7 pages
Salesforce Developer Certification PD1 PD2
No ratings yet
Salesforce Developer Certification PD1 PD2
11 pages
Sharing and Visibility Designer
No ratings yet
Sharing and Visibility Designer
5 pages
25 Aug - PD1 - SET5
No ratings yet
25 Aug - PD1 - SET5
61 pages
SET3
No ratings yet
SET3
62 pages
PD1 Set2
No ratings yet
PD1 Set2
9 pages
3
No ratings yet
3
15 pages
Salesforce Test-Inside Platform-App-Builder PDF Exam 2023-Nov-27 by Upton 183q Vce
No ratings yet
Salesforce Test-Inside Platform-App-Builder PDF Exam 2023-Nov-27 by Upton 183q Vce
8 pages
SET3
No ratings yet
SET3
62 pages
SFDC PD1
100% (1)
SFDC PD1
3 pages
Platform Developer Exam
No ratings yet
Platform Developer Exam
57 pages
Salesforce PDI v2022-08-28 q103 PDF
No ratings yet
Salesforce PDI v2022-08-28 q103 PDF
31 pages
Sample Questions
100% (1)
Sample Questions
13 pages
WI23 Pd1 SET1
100% (1)
WI23 Pd1 SET1
29 pages
PD2
No ratings yet
PD2
66 pages
Integration-Architect-demo
No ratings yet
Integration-Architect-demo
4 pages
Pd2 - Sp24 PDF
No ratings yet
Pd2 - Sp24 PDF
74 pages
Salesforce ADX-271 Exam Test Questions
No ratings yet
Salesforce ADX-271 Exam Test Questions
7 pages
Set 3
No ratings yet
Set 3
67 pages
Industry CPQ
No ratings yet
Industry CPQ
96 pages
PD1 Set4 Su23
No ratings yet
PD1 Set4 Su23
21 pages
Set 3
No ratings yet
Set 3
32 pages
App Builder Wi23 Set1
No ratings yet
App Builder Wi23 Set1
34 pages
PD1 Set2 Su23
No ratings yet
PD1 Set2 Su23
30 pages
File2 AdvAdminWI23
No ratings yet
File2 AdvAdminWI23
62 pages
vceexamstest-salesforce-certified-data-cloud-consultant-questions-by-bernard-29-01-2024-8qa
No ratings yet
vceexamstest-salesforce-certified-data-cloud-consultant-questions-by-bernard-29-01-2024-8qa
11 pages
Set 1
No ratings yet
Set 1
65 pages
App Builder SP21 - 2
No ratings yet
App Builder SP21 - 2
66 pages
WI23 SET2 Pd1
No ratings yet
WI23 SET2 Pd1
22 pages
Salesforce Dumps
No ratings yet
Salesforce Dumps
4 pages
SFDC MCQ2 Ad
No ratings yet
SFDC MCQ2 Ad
81 pages
Service Cloud Consultant New Sets Verified
No ratings yet
Service Cloud Consultant New Sets Verified
78 pages
Exam Dumps - 3 - UH-1
No ratings yet
Exam Dumps - 3 - UH-1
32 pages
Set 5
No ratings yet
Set 5
44 pages
Experience Cloud Consultant
No ratings yet
Experience Cloud Consultant
4 pages
Wa0006.
No ratings yet
Wa0006.
67 pages
Guide For Salesforce DeveloperSuperSet
No ratings yet
Guide For Salesforce DeveloperSuperSet
20 pages
Programming Lightning Components - Students Guide PDF
No ratings yet
Programming Lightning Components - Students Guide PDF
444 pages
Platform App Builder
No ratings yet
Platform App Builder
5 pages
AdvanceAdminSet - 87
No ratings yet
AdvanceAdminSet - 87
32 pages
Aindump2go Platform-App-Builder Exam Question 2023-Nov-10 by Paul 138q Vce
No ratings yet
Aindump2go Platform-App-Builder Exam Question 2023-Nov-10 by Paul 138q Vce
9 pages
Screenshot 2022-05-12 at 11.50.27 AM
No ratings yet
Screenshot 2022-05-12 at 11.50.27 AM
28 pages
Salesforce WI23 - PD1 - SET3
100% (1)
Salesforce WI23 - PD1 - SET3
20 pages
Salesforce Certified Ai Associate Dumps by Cline 04 10 2023 9qa Certsdeals
No ratings yet
Salesforce Certified Ai Associate Dumps by Cline 04 10 2023 9qa Certsdeals
13 pages
CME_Digital_Commerce_PDF-en
No ratings yet
CME_Digital_Commerce_PDF-en
283 pages
⛔Another failed interview—this time at Honeywell?
No ratings yet
⛔Another failed interview—this time at Honeywell?
7 pages
Mastering Triggers for Interviews
No ratings yet
Mastering Triggers for Interviews
36 pages
Event Management (MAX FIT)
No ratings yet
Event Management (MAX FIT)
12 pages
Field-Service-Lightning-Consultant Dumps Salesforce Certified Field Service Lightning Consultant (SP19)
No ratings yet
Field-Service-Lightning-Consultant Dumps Salesforce Certified Field Service Lightning Consultant (SP19)
20 pages
App Builder 4
No ratings yet
App Builder 4
38 pages
Salesforce Platform Developer I Dumps by Puckett 24 05 2024 12qa Vceexamstest
No ratings yet
Salesforce Platform Developer I Dumps by Puckett 24 05 2024 12qa Vceexamstest
16 pages
PD1 Set1 Su23
100% (1)
PD1 Set1 Su23
30 pages
Loyalty Management Accredited Professional
No ratings yet
Loyalty Management Accredited Professional
9 pages
PD2 (4) Done
No ratings yet
PD2 (4) Done
39 pages
identity-and-access-management-designer_5
No ratings yet
identity-and-access-management-designer_5
14 pages
Platform Developer-2 SU18
No ratings yet
Platform Developer-2 SU18
42 pages
CPQ sp21 Set 1
No ratings yet
CPQ sp21 Set 1
73 pages
Clustering Mall Data Students
No ratings yet
Clustering Mall Data Students
11 pages
Updated Womens Hostel
No ratings yet
Updated Womens Hostel
2 pages
Ht2333i006810332 3
No ratings yet
Ht2333i006810332 3
1 page
Bill HT2333I006185131 PDF
No ratings yet
Bill HT2333I006185131 PDF
1 page
Linear Regression
No ratings yet
Linear Regression
1 page
Data Clustering Seminar
No ratings yet
Data Clustering Seminar
34 pages
Kmeans
No ratings yet
Kmeans
6 pages
Machine Learning Methods For Solar Radiation Forecasting. A Review
No ratings yet
Machine Learning Methods For Solar Radiation Forecasting. A Review
33 pages
Lec 05 - K-Means
No ratings yet
Lec 05 - K-Means
4 pages
Gautam A. Kudale
No ratings yet
Gautam A. Kudale
6 pages
Clustering and Sentiment Analysis On Twitter Data
No ratings yet
Clustering and Sentiment Analysis On Twitter Data
5 pages
Lab10 KMeans SPSS
No ratings yet
Lab10 KMeans SPSS
5 pages
Summer Internship Report
No ratings yet
Summer Internship Report
27 pages
Introduction To Data Classification and Prediction
No ratings yet
Introduction To Data Classification and Prediction
9 pages
Tugas Pak Nov3
No ratings yet
Tugas Pak Nov3
11 pages
DWM Musa
No ratings yet
DWM Musa
4 pages
Unit 3
No ratings yet
Unit 3
41 pages
CA - 605 - MJP Machine Learning Practical Slips
No ratings yet
CA - 605 - MJP Machine Learning Practical Slips
25 pages
Hierarchical Cluster Analysis
No ratings yet
Hierarchical Cluster Analysis
4 pages
Lec18 Segregclust
No ratings yet
Lec18 Segregclust
48 pages
Advanced Machine Learning and Artificial Intelligence
No ratings yet
Advanced Machine Learning and Artificial Intelligence
9 pages
Information Sciences: M. Zarinbal, M.H. Fazel Zarandi, I.B. Turksen
No ratings yet
Information Sciences: M. Zarinbal, M.H. Fazel Zarandi, I.B. Turksen
24 pages
Chapter 2 - Texture Analysis
No ratings yet
Chapter 2 - Texture Analysis
18 pages
Practical-8: Vishwakarma Govt. Engg. College
No ratings yet
Practical-8: Vishwakarma Govt. Engg. College
3 pages
Distance Functions
No ratings yet
Distance Functions
7 pages
Raymond - Kassy - 202105 - MSC - EDA Signal Processing
No ratings yet
Raymond - Kassy - 202105 - MSC - EDA Signal Processing
141 pages
Module 5_Mahout
No ratings yet
Module 5_Mahout
20 pages
AI Model Paper Answers
No ratings yet
AI Model Paper Answers
14 pages
Machine Learning Lab Assessment 5: 18BCE2301 Devangshu Mazumder
No ratings yet
Machine Learning Lab Assessment 5: 18BCE2301 Devangshu Mazumder
10 pages
Batch B DWM Experiments
No ratings yet
Batch B DWM Experiments
90 pages
[Ebooks PDF] download Data Analytics for Social Microblogging Platforms 1st Edition Soumi Dutta full chapters
100% (3)
[Ebooks PDF] download Data Analytics for Social Microblogging Platforms 1st Edition Soumi Dutta full chapters
41 pages
DWDM Online Bits
No ratings yet
DWDM Online Bits
3 pages
CH 5
No ratings yet
CH 5
108 pages
Clustering
No ratings yet
Clustering
75 pages
AIML LAB Final
No ratings yet
AIML LAB Final
13 pages

Salesforce PD1

Uploaded by

Salesforce PD1

Uploaded by

Que : You work in XYZ Company as a Python Developer.

The company officials want you to

# Load customer data

# Check for null values

# Create a scatter plot with Age as X and Spending Score as Y

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

# Load customer data

# Check for null values

# Create a scatter plot with Age as X and Spending Score as Y

plt.scatter(data['Age'], data['Spending Score (1-100)'])

km = KMeans(n_clusters=k, init='k-means++', max_iter=300, n_init=10, random_state=0)

km = km.fit(data[['Age', 'Spending Score (1-100)']])

plt.plot(K, sum_of_squared_distances, 'bx-')

plt.ylabel('Sum of Squared Distances')

plt.title('Elbow Method For Optimal k')

suboptimal_k = 6 # a value selected as an example

kmeans = KMeans(n_clusters=suboptimal_k, init='k-means++', max_iter=300, n_init=10,

clusters = kmeans.fit_predict(data[['Age', 'Spending Score (1-100)']])

plt.scatter(data['Age'], data['Spending Score (1-100)'], c=data['Cluster'], cmap='viridis')

plt.ylabel('Spending Score (1-100)')

You might also like