0% found this document useful (0 votes)

43 views

Naïve Bayes Classifier: Ke Chen

The document provides an overview of Naive Bayes classifiers. It explains that Naive Bayes is a probabilistic classifier that applies Bayes' theorem with a strong (naive) independence assumption. It makes predictions by calculating the probabilities of possible outcomes given the feature values. The document outlines the learning and classification process, including estimating probabilities from training data and making predictions by selecting the class with the highest posterior probability. It also discusses some of the advantages of Naive Bayes, such as fast training and testing, as well as limitations like its independence assumption.

Uploaded by

prabumn

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

43 views

Naïve Bayes Classifier: Ke Chen

Uploaded by

prabumn

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

You are on page 1/ 18

Nave Bayes Classifier

Ke Chen
http://intranet.cs.man.ac.uk/mlo/comp20411
/
Extended by Longin Jan Latecki
[email protected]
COMP20411 Machine Learning

Outline
Background
Probability Basics
Probabilistic Classification
Nave Bayes
Example: Play Tennis
Relevant Issues
Conclusions
COMP20411 Machine Learning

Background
There are three methods to establish a classifier
a) Model a classification rule directly
Examples: k-NN, decision trees, perceptron, SVM

b) Model the probability of class memberships given input data

Example: multi-layered perceptron with the cross-entropy cost

c) Make a probabilistic model of data within each class

Examples: naive Bayes, model based classifiers

a) and b) are examples of discriminative classification

c) is an example of generative classification
b) and c) are both examples of probabilistic classification

COMP20411 Machine Learning

Probability Basics
Prior, conditional and joint probability

P(X )
Prior probability:

Conditional probability:
P( X1 |X2 ), P(X2 |X1 )

Joint probability:X ( X1 , X2 ), P( X ) P(X1 ,X2 )

P(X1 ,X2 ) P( X2 |X1 )P( X1 ) P( X1 |X2 )P( X2 )

Relationship:

Independence:
P( X2 |X1 ) P( X2 ), P( X1 |X2 ) P( X1 ), P(X1 ,X2 ) P( X1 )P( X2 )

Bayesian Rule

Likelihood Prior
P( X |C )P(C )
P(C |X )
Posterior
P( X )
Evidence
COMP20411 Machine Learning

Example by Dieter Fox

Probabilistic Classification
Establishing a probabilistic model for classification

Discriminative model

P(C |X ) C c1 , , c L , X (X1 , , Xn )

Generative model

P( X |C ) C c1 , , c L , X (X1 , , Xn )

MAP classification rule

MAP: Maximum A Posterior

Assign x to c* ifP(C c * |X x ) P(C c |X x) c c * , c c1 , , c L

Generative classification with the MAP rule

P( X |C )P(C )
Apply Bayesian rule to convert:
P(C |X )
P( X |C )P(C )
P( X )
COMP20411 Machine Learning

Feature Histograms

P(x)
C1

Slide by Stephen Marsland

Posterior Probability
P(C|x)

0
Slide by Stephen Marsland

Nave Bayes
Bayes classification
P(C |X ) P( X |C )P(C ) P( X1 , , Xn |C )P(C )
Difficulty: learning the joint probability
P( X1 , , Xn |C )

Nave Bayes classification

Making the assumption that all input attributes are

independent
P( X , X , , X |C ) P( X |X , , X ; C )P( X , , X |C )
1

Nave Bayes
Nave Bayes Algorithm (for discrete input attributes)

Learning Phase: Given a training set S,

For each target value of ci (ci c1 , , c L )

P (C ci ) estimate P(C ci ) with examples in S;

For every attribute value a jk of each attribute x j ( j 1, , n; k 1, , N j )

P ( X j a jk |C ci ) estimate P( X j a jk |C ci ) with examples in S;

Output: conditional probability tables;x j ,for

Nj L
elements

X ( a1 , , an )

Test Phase: Given an unknown instance

*
*
( a |c * up
( a |c * )]to
( cassign
( a the
( a |cc*
to
tables
label
X
if
[ PLook
)

P
P
)

[
P
|
c
)

P
)]
P
(
c
),
c

c
, c c1 , , c L
1
n
1
n

COMP20411 Machine Learning

Example
Example: Play Tennis

COMP20411 Machine Learning

Example
Learning Phase
Outlook

Play=Yes Play=No

Temperature

Play=Yes

Play=No

Sunny

2/9

3/5

Hot

2/9

2/5

Overcast

4/9

0/5

Mild

4/9

2/5

Rain

3/9

2/5

Cool

3/9

1/5

Humidity

Play=Yes Play=No

Wind

Play=Yes

Play=No

High

3/9

4/5

Strong

3/9

3/5

Normal

6/9

1/5

Weak

6/9

2/5

P(Play=Yes) = 9/14

P(Play=No) = 5/14

COMP20411 Machine Learning

Example
Test Phase

Given a new instance,

x=(Outlook=Sunny, Temperature=Cool, Humidity=High, Wind=Strong)
Look up tables
P(Outlook=Sunny|Play=Yes) = 2/9

P(Outlook=Sunny|Play=No) = 3/5

P(Wind=Strong|Play=Yes) = 3/9

P(Wind=Strong|Play=No) = 3/5

P(Temperature=Cool|Play=Yes) = 3/9 P(Temperature=Cool|Play==No) = 1/5

P(Huminity=High|Play=No) = 4/5
P(Huminity=High|Play=Yes) = 3/9
P(Play=Yes) = 9/14

P(Play=No) = 5/14

MAP rule

Given the fact P(Yes|x) < P(No|x), we label x to be No.

COMP20411 Machine Learning

Relevant Issues
Violation of Independence Assumption

For many real world tasks,

P( X1 , , Xn |C ) P( X1 |C ) P( Xn |C )

Nevertheless, nave Bayes works surprisingly well

anyway!

Zero conditional probability Problem

X j a jk , P ( X j a jk |C ci ) 0

If no example contains
attribute
( xvalue
P ( x1 |cthe
)

P
(
a
|
c
)

P
n |ci ) 0
i
jk i
In this circumstance,

n mp
For a remedy, Pconditional
estimated with
( X a |C c probabilities
) c
j

during test

nm
nc : number of training examples for which X j a jk and C ci
n : number of training examples for which C ci

p : prior estimate (usually, p 1 /t for t possible values of X j )

m : weight to prior (number of " virtual" examples, m 1)

COMP20411 Machine Learning

Relevant Issues
Continuous-valued Input Attributes

Numberless values for an attribute

Conditional probability modeled with the normal

distribution
( X )2
1
P ( X j |C ci )

j
ji

exp
2

2 ji
2 ji

ji : mean (avearage) of attribute values X j of examples for which C ci

ji : standard deviation of attribute values X j of examples for which C ci

for X ( X1 , , Xn ), C c1 , , c L
LearningnPhase:
L
P(C ci ) i 1, , L
Output:
and
fornormal
X ( X1distributions
, , Xn )
Test Phase:
Calculate conditional probabilities with all the normal distributions
Apply the MAP rule to make a decision
COMP20411 Machine Learning

Conclusions
Nave Bayes based on the independence assumption

Training is very easy and fast; just requiring considering

each attribute in each class separately

Test is straightforward; just looking up tables or calculating

conditional probabilities with normal distributions

A popular generative model

Performance competitive to most of state-of-the-art

classifiers even in presence of violating independence
assumption

Many successful applications, e.g., spam mail filtering

Apart from classification, nave Bayes can do more

COMP20411 Machine Learning

MAST90083 2021 S2 Exam Paper
No ratings yet
MAST90083 2021 S2 Exam Paper
4 pages
Week 8 - Conditional Probability
100% (7)
Week 8 - Conditional Probability
9 pages
To Show Whether or Not Colours Are Evenly Distributed in A Bag of Gummi Bears
No ratings yet
To Show Whether or Not Colours Are Evenly Distributed in A Bag of Gummi Bears
6 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
20 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
18 pages
Naive Bayes
No ratings yet
Naive Bayes
18 pages
Naive Bayes Classifier
No ratings yet
Naive Bayes Classifier
24 pages
Naive Bayes Classifier PDF
No ratings yet
Naive Bayes Classifier PDF
17 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
20 pages
Naïve Bayes Classifier
No ratings yet
Naïve Bayes Classifier
17 pages
Naïve Bayes Classifier: Adopted From Slides by Ke Chen From University of Manchester and Yangqiu Song From Msra
No ratings yet
Naïve Bayes Classifier: Adopted From Slides by Ke Chen From University of Manchester and Yangqiu Song From Msra
25 pages
Naïve Bayes Classifier: Ke Chen
No ratings yet
Naïve Bayes Classifier: Ke Chen
19 pages
Naive-Bayes
No ratings yet
Naive-Bayes
25 pages
Naïve Bayes Classifier: Dr. Hussain Dawood
No ratings yet
Naïve Bayes Classifier: Dr. Hussain Dawood
20 pages
Classification - Naive Bayes
No ratings yet
Classification - Naive Bayes
17 pages
Lecture 7
No ratings yet
Lecture 7
15 pages
Lec04 Classifiers NBC
No ratings yet
Lec04 Classifiers NBC
24 pages
Machine Learning - Unit 2
No ratings yet
Machine Learning - Unit 2
104 pages
Naive Bayes Classifier
No ratings yet
Naive Bayes Classifier
10 pages
Lect-7-DM
No ratings yet
Lect-7-DM
65 pages
ML Lecture#5
No ratings yet
ML Lecture#5
65 pages
Data Mining - Module 7
No ratings yet
Data Mining - Module 7
8 pages
K-Means Algorithm: Clustering Methods: Part 2a
No ratings yet
K-Means Algorithm: Clustering Methods: Part 2a
10 pages
BayesianNetworks Reduced
No ratings yet
BayesianNetworks Reduced
14 pages
Bayesian Learning: Berrin Yanikoglu
No ratings yet
Bayesian Learning: Berrin Yanikoglu
64 pages
Lecture 5-Naïve Bayes
No ratings yet
Lecture 5-Naïve Bayes
26 pages
MCMC Brief
No ratings yet
MCMC Brief
69 pages
L05-NaiveBayes
No ratings yet
L05-NaiveBayes
21 pages
BayesianNetworks Reduced
No ratings yet
BayesianNetworks Reduced
14 pages
3 - Classification - Naive Bayes
No ratings yet
3 - Classification - Naive Bayes
30 pages
BR 2
No ratings yet
BR 2
36 pages
20210913115710D3708 - Session 09-12 Bayes Classifier
No ratings yet
20210913115710D3708 - Session 09-12 Bayes Classifier
30 pages
6 Naive-Bayes
No ratings yet
6 Naive-Bayes
18 pages
8 ML
No ratings yet
8 ML
22 pages
Binomial Distribution Powerpoint 1
100% (2)
Binomial Distribution Powerpoint 1
17 pages
L1 - Naïve Bayes Classifier
No ratings yet
L1 - Naïve Bayes Classifier
10 pages
07 - Bayesian Learning
No ratings yet
07 - Bayesian Learning
55 pages
K - Nearest Neighbours Classifier / Regressor
No ratings yet
K - Nearest Neighbours Classifier / Regressor
35 pages
Naive Bayes
No ratings yet
Naive Bayes
9 pages
DIP WISC 13 Recognition
No ratings yet
DIP WISC 13 Recognition
18 pages
ml-20240315
No ratings yet
ml-20240315
8 pages
Bayesian Estimation Example Using Pymc: Scipy 2010 Lightning Talk
No ratings yet
Bayesian Estimation Example Using Pymc: Scipy 2010 Lightning Talk
12 pages
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Data Mining
No ratings yet
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Data Mining
16 pages
CENG 222 Statistical Methods For Computer Engineering
No ratings yet
CENG 222 Statistical Methods For Computer Engineering
31 pages
Introduction To Bayesian Learning: Aaron Hertzmann University of Toronto SIGGRAPH 2004 Tutorial
No ratings yet
Introduction To Bayesian Learning: Aaron Hertzmann University of Toronto SIGGRAPH 2004 Tutorial
141 pages
CPSC 531 Systems Modeling and Simulation: Review
No ratings yet
CPSC 531 Systems Modeling and Simulation: Review
50 pages
Introduction To Predictive Learning
No ratings yet
Introduction To Predictive Learning
101 pages
Lec 2
No ratings yet
Lec 2
23 pages
Lecture 4
No ratings yet
Lecture 4
51 pages
STA302 Week12 Full
No ratings yet
STA302 Week12 Full
30 pages
Stats 1 Week 8 GA
No ratings yet
Stats 1 Week 8 GA
8 pages
Region Segmentation Readings: Chapter 10: 10.1 Additional Materials Provided
No ratings yet
Region Segmentation Readings: Chapter 10: 10.1 Additional Materials Provided
47 pages
Bayesian Classification- problem (1)
No ratings yet
Bayesian Classification- problem (1)
4 pages
Tema5 Teoria-2830
No ratings yet
Tema5 Teoria-2830
57 pages
CSIS0270/COMP3270: 12b. Statistical Learning - Bayes Classifier
No ratings yet
CSIS0270/COMP3270: 12b. Statistical Learning - Bayes Classifier
15 pages
Classification With NaiveBayes
No ratings yet
Classification With NaiveBayes
19 pages
An Introduction To Objective Bayesian Statistics PDF
No ratings yet
An Introduction To Objective Bayesian Statistics PDF
69 pages
Cheat ML
No ratings yet
Cheat ML
1 page
Bayesian Decision Theory and Learning: Jayanta Mukhopadhyay Dept. of Computer Science and Engg
No ratings yet
Bayesian Decision Theory and Learning: Jayanta Mukhopadhyay Dept. of Computer Science and Engg
56 pages
Numerical Analysis II Essentials
From Everand
Numerical Analysis II Essentials
The Editors of REA
No ratings yet
10+2 Level Mathematics For All Exams GMAT, GRE, CAT, SAT, ACT, IIT JEE, WBJEE, ISI, CMI, RMO, INMO, KVPY Etc.
From Everand
10+2 Level Mathematics For All Exams GMAT, GRE, CAT, SAT, ACT, IIT JEE, WBJEE, ISI, CMI, RMO, INMO, KVPY Etc.
Shubhankar Paul
No ratings yet
Revised Eligibility Creteria After 86th GCM AUG 2
No ratings yet
Revised Eligibility Creteria After 86th GCM AUG 2
5 pages
Brochure Performance
No ratings yet
Brochure Performance
11 pages
Exp Cert. Format
No ratings yet
Exp Cert. Format
1 page
Mechanical Engineer - Tire Engineering (M/F)
No ratings yet
Mechanical Engineer - Tire Engineering (M/F)
2 pages
Book Review: Journal of Engineering For Gas Turbines and Power
No ratings yet
Book Review: Journal of Engineering For Gas Turbines and Power
1 page
Project FORCE English
No ratings yet
Project FORCE English
15 pages
Job Description International Student Marketing - India
No ratings yet
Job Description International Student Marketing - India
1 page
Automated Behaviour Monitoring (ABM)
No ratings yet
Automated Behaviour Monitoring (ABM)
2 pages
en
No ratings yet
en
2 pages
Wheel Bolt Failure
No ratings yet
Wheel Bolt Failure
2 pages
NAPA References
No ratings yet
NAPA References
8 pages
JobAdvertisement 135599
No ratings yet
JobAdvertisement 135599
3 pages
Introduction to Statistics and Data Analysis: With Exercises, Solutions and Applications in R, 2nd Edition Christian Heumann All Chapters Instant Download
100% (3)
Introduction to Statistics and Data Analysis: With Exercises, Solutions and Applications in R, 2nd Edition Christian Heumann All Chapters Instant Download
50 pages
ML-UNIT-IV - Complete
No ratings yet
ML-UNIT-IV - Complete
42 pages
Answer 14
No ratings yet
Answer 14
28 pages
SM FF M Further Pure Maths
No ratings yet
SM FF M Further Pure Maths
23 pages
Grade 9 Data Analysis
No ratings yet
Grade 9 Data Analysis
124 pages
Dietary Pattern Analysis: Provide A Results That
No ratings yet
Dietary Pattern Analysis: Provide A Results That
13 pages
Souza e Junqueira 2005 PDF
No ratings yet
Souza e Junqueira 2005 PDF
11 pages
Aditya Surya Pratama 36B - Tugas Statistik
No ratings yet
Aditya Surya Pratama 36B - Tugas Statistik
22 pages
Butohan, Wilfredo Jr. - Reflection
No ratings yet
Butohan, Wilfredo Jr. - Reflection
9 pages
Factor Analysis (DR See) : I I I Ik K I
No ratings yet
Factor Analysis (DR See) : I I I Ik K I
6 pages
2022 Stat6089 Lgda TP2-W3-S3-R0 2401967132
No ratings yet
2022 Stat6089 Lgda TP2-W3-S3-R0 2401967132
5 pages
1 PB
No ratings yet
1 PB
7 pages
Hawkins Et Al 2003
No ratings yet
Hawkins Et Al 2003
8 pages
Kohesyong Gramatikal
No ratings yet
Kohesyong Gramatikal
2 pages
Unit-IV-Standard-scores-and-the-normal-curve
No ratings yet
Unit-IV-Standard-scores-and-the-normal-curve
5 pages
Burnham and Anderson 2004 Multimodel Inference
No ratings yet
Burnham and Anderson 2004 Multimodel Inference
44 pages
423 - ShreyaKumari - TSA - 2 - Shreya Kumari
No ratings yet
423 - ShreyaKumari - TSA - 2 - Shreya Kumari
5 pages
Section 6 - Projection Pursuit Regression
No ratings yet
Section 6 - Projection Pursuit Regression
23 pages
Radioactive Decay
No ratings yet
Radioactive Decay
11 pages
Akaike 1974
No ratings yet
Akaike 1974
8 pages
Completely Randomized Designs: Gary W. Oehlert
No ratings yet
Completely Randomized Designs: Gary W. Oehlert
33 pages
Charlie Pft2
No ratings yet
Charlie Pft2
10 pages
ANOVA (Analysis of Variance)
No ratings yet
ANOVA (Analysis of Variance)
5 pages
Effect of Technology Strategy On Organizational Performance
No ratings yet
Effect of Technology Strategy On Organizational Performance
18 pages
Wpiea2023045 Print PDF
No ratings yet
Wpiea2023045 Print PDF
38 pages
Session - 16 - Part C - MSST - 2019-21
No ratings yet
Session - 16 - Part C - MSST - 2019-21
35 pages
ML, DL Questions: Downloaded From
No ratings yet
ML, DL Questions: Downloaded From
4 pages
The Effect of Multicollinearity in Nonlinear Regression Models
No ratings yet
The Effect of Multicollinearity in Nonlinear Regression Models
4 pages
Time Series and Forecasting: Mcgraw-Hill/Irwin
No ratings yet
Time Series and Forecasting: Mcgraw-Hill/Irwin
23 pages