STK211 03

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 44

Metode Statistika (STK211)

Statistika Deskriptif (2)

Dr. Ir. Kusman Sadik


Dept. Statistika IPB, 2015

1
Pertanyaan

Jika kita punya data mengenai daya


hidup dari baterai Laptop merk “XXX”

• Dimana “lokasi” atau “pusat” dari data? 


ukuran pemusatan (measures of center)
• Seberapa besar variasi dari data  ukuran
penyebaran (measures of variation)

2
Ukuran Pemusatan Data

• Modus (Mode): Nilai pengamatan yang


paling sering muncul
• Median: Pengamatan yang ada di tengah-
tengah dari data terurut
• Quartil: Nilai-nilai yang membagi data
terurut menjadi 4 bagian yang sama
• Mean / Rata-rata: merupakan pusat
massa (centroid) sehingga simpangan kiri
dan simpangan kanan sama besar

3
Modus (Mode)

• Merupakan nilai pengamatan yang paling


sering muncul
• Dalam satu gugus data dapat mengandung
lebih dari satu modus
• Dapat digunakan untuk semua jenis data, tapi
paling banyak digunakan untuk data kategorik
atau data diskret dengan hanya sedikit nilai
yang mungkin muncul

Modus

4
Median

• Pengamatan yang ditengah-tengah dari data


terurut
• Nama lain dari percentil ke-50
• Nama lain dari kuartil 2 (Q2)
• Digunakan untuk menggambarkan lokasi dari
data numerik
• Kekar (robust) terhadap adanya pencilan

5
Cara menghitung median contoh

Urutkan data terlebih dahulu dari


terkecil sampai terbesar
Jika jumlah data ganjil, nilai median
merupakan nilai di tengah
Data I: 2 8 3 4 1

Data terurut: 1 2 3 4 8

Median 6
Cara menghitung median contoh

Urutkan data dari terkecil sampai


terbesar
Jika jumlah data genap, nilai median
merupakan rataan dari dua nilai di tengah
Data II: 2 8 3 4 1 8
Data terurut: 1 2 3 4 8 8

Median=(3+4)/2 = 3.5 7
Perhatikan data I dan data III

Data I terurut: 1 2 3 4 8

Median
Data III terurut: 1 2 3 4 100

Median
Median bersifat lebih kekar (robust) terhadap
pencilan (data ekstrim) dibandingkan dengan nilai
rata-rata. Coba Anda hitung nilai rata-rata untuk
kedua data di atas.
8
Kuartil
• Nilai-nilai yang membagi data terurut menjadi 4 bagian
yang sama
• Q0 (dibaca kuartil 0) merupakan nilai minimum dari data
• Q1(dibaca kuartil 1) merupakan nilai yang membagi data
25% data di kiri dan 75% data di kanan
• Q2 (dibaca kuartil 2) merupakan median, membagi data
menjadi 50%
• Q3 (dibaca kuartil 3) merupakan nilai yang membagi data
75% data di kiri dan 25% data di sebelah kanan
• Q4 (dibaca kuartil 4) merupakan nilai maksimum dari
data
• Nilai Q1, Q2, dan Q3 kekar (robust) terhadap pencilan

9
Cara Memperoleh Kuartil (Quartile)
Metode Interpolasi
 Urutkan data dari kecil ke besar

 Cari posisi kuartil


• nq1=(1/4)(n+1)
• nq2=(2/4)(n+1)
• nq3=(3/4)(n+1)

 Nilai kuartil dihitung sebagai berikut:


• Xqi=Xa,i + hi (Xb,i-Xa,i)
• Xa,i = pengamatan sebelum posisi kuartil
ke-i, Xb,i = pengamatan setelah posisi
kuartil ke-i dan
• hi adalah nilai pecahan dari posisi kuartil
10
Perhatikan ilustrasi data I

• Posisi Q2 = nQ2 = (5+1) / 2 =3


• Posisi Q1 = ¼(5+1) = 1.5
• Posisi Q3 = ¾(5+1) = 4.5

Data terurut: 1 2 3 4 8

Median

Q1= 1 + 0.5(2-1) = 1.5


Q3=4+ 0.5(8-4)=6
11
Perhatikan ilustrasi data II

• Posisi Q2 = nQ2 = (6+1) / 2 =3.5


• Posisi Q1 = ¼(6+1) = 1.75
• Posisi Q3 = ¾(6+1) = 5.25
Data terurut: 1 2 4 7 8 10

Median = 4 + 0.5(7-4) = 5.5

Q1= 1 + 0.75(2-1) = 1.75

Q3=8+ 0.25(10-8)=8.50
12
Statistik 5 serangkai
Q2
Q1 Q3
Q0 Q4

Berdasarkan metode Interpolasi

Data I Data II

3 3.5

1.5 6 1.75 5.5

1 8 1 10

13
Mean (rataan)

• Merupakan pusat massa (centroid)


• Jika menggambarkan populasi di tuliskan
sebagai , huruf yunani “mu”
• Jika menggambarkan contoh dituliskan
sebagai x , disebut “xbar”
• Digunakan untuk tipe data numerik
• Tidak bisa digunakan untuk tipe data
kategorik dan diskret
• Sangat resisten (sensitif) terhadap pencilan

14
Langkah Teknis memperoleh mean

• Rata-rata (Mean)
N

x i

 Populasi:   i 1
N

x i
 Sampel: x  i 1
n

Data I (merupakan data contoh)


: 2 8 3 4 1

2  8  3  4 1
x  3.6 Jangan dibulatkan!!!!
5
15
Perhatikan data I dan data III

Data I terurut: 1 2 3 4 8

1 2  3  4  8 Median
x  3.6
5

Data III terurut: 1 2 3 4 100

Median
1  2  3  4  100
x  22
5 16
Kaitan antar bentuk sebaran dengan
ukuran pemusatan

skewed to the right skewed to the left


(mean > median) (mean < median)

Catatan : nilai mean (rata-rata)


mengikuti arah ekor, sedangkan
modus dan median tetap
symmetric

Mean = Median = Mode 17


Ukuran Penyebaran
• Menggambarkan suatu UKURAN KUANTITATIF tingkat
penyebaran atau pengelompokan dari data
• Keragaman biasanya didefinisikan dalam bentuk jarak :
• Seberapa jauh jarak antar titik-titik tersebut satu sama
lain
• Seberapa jauh jarak antara titik-titik tersebut terhadap
rataannya
• Bagaimana tingkat keterwakilan nilai tersebut terhadap
kondisi data keseluruhan

18
Wilayah (Range)
• Merupakan selisih dari nilai terbesar – nilai
terkecil
R=Xmax – Xmin
• Hanya memperhitungkan nilai terkecil dan
terbesar, sedangkan sebaran nilai antara dua
nilai tersebut tidak diperhitungkan
• Resisten terhadap nilai yang ekstrim

Data I terurut: 1 2 3 4 8
R = 8-1 = 7
Data III terurut: 1 2 3 4 100
R = 100-1 = 99
19
Jangkauan antar Kuartil
(Interquartile Range)

• Merupakan selisih antara kuartil 3


dengan kuartil 1, IQR = Q3 - Q1
• Memperhitungkan sebaran antara nilai
minimum dan nilai maksimum
• Kekar terhadap adanya nilai-nilai yang
ekstrim (pencilan)

20
Simpangan/Deviasi
• Ukuran penyebaran yang lebih kompleks adalah
bagaimana data tersebut mengelompok di sekitar
rataannya
• Deviasi merupakan selisih dari data terhadap
rataannya.
• Ukuran keragaman dari deviasi adalah rataan deviasi =
 (x - ) / n Contoh Data
•  (x - ) / n  0 Data Deviasi

1 -2.6

2 -1.6

3 -0.6

4 0.4

8 4.4

Rataan 3.6 0.000000000000000178


21
Ragam
Data 1

Data (X-) (X-)2 • Untuk menghilangan +/- maka


1 -2.6 6.76 deviasi dikuadratkan terlebih
2 -1.6 2.56
dahulu sebelum dirata-
ratakan.
3 -0.6 0.36
4 0.4 0.16 • Ukuran semacam ini disebut
8 4.4 19.36
ragam =  (x - )2 / n
Rataan 3.6 •  (x - )2 merupakan jumlah
kuadrat dari deviasi disekitar
rataannya

22
Menghitung Ragam

• Ragam (Variance)
N

 x   
2
i

 Populasi 2  i 1
N
n

 ix  x 2

 Contoh s2  i 1
n 1 (n-1) disebut derajat bebas = db

Untuk menghitung ragam contoh maka perlu dihitung


rataan contoh, maka data terakhir tergantung dari data-
data sebelumnya. Hanya 1 yang tidak bebas, sedangkan
n-1 data lainnya bebas variasinya
n

Data 1

 ix  x 2

29.2
s 
2 i 1
  7.3
n 1 4 23
Simpangan baku (standard deviation)

 Ragam merupakan ukuran jarak


kuadrat, sehingga untuk mendapatkan
jarak yang sebenarnya adalah dengan
mengakarkan ragam  simpangan
baku

  simpangan baku populasi dan


s simpangan baku sampel

24
Notasi Penulisan

Lihat : Mendenhall (Example 2.5), hal. 63


25
Ilustrasi tentang derajat bebas (db)

Banu mengajak Anda main tebak-tebakan. Banu


mempunyai tiga kaleng. Salah satu dari kaleng
tersebut berisi bola. Yang manakah yang berisi
bola?
Jika bola tersebut
dianggap sebagai
rataan sampel
maka ada
sebanyak 3-1 = 2
kaleng yang
ditebak bebas 
db = n-1

Jika kaleng I dan II Anda angkat namun tidak


terdapat bola maka sudah pasti kaleng ke-3
yang berisi bola
26
Latihan :

a. 3 9 7 4 10 3
b. 4 9 3 8 6

Tentukan nilai :
Mean, Median, Q1, Q3, Ragam, Simpangan
Baku, Range, dan IQR
untuk kedua gugus data di atas

27
Demo MINITAB

28
Ilustrasi Data
No Sex Tinggi Berat Agama
1 1 167 63 Islam
2 1 172 74 Islam
3 0 161 53 Kristen
4 0 157 47 Hindu
5 1 165 58 Islam
6 0 167 60 Islam
7 1 162 52 Budha
8 0 151 45 Katholik
9 0 158 54 Kristen
10 1 162 63 Islam
11 1 176 82 Islam
12 1 167 69 Islam
13 0 163 57 Kristen
14 0 158 60 Islam
15 1 164 58 Katholik
16 0 161 50 Islam
17 1 159 61 Kristen
18 1 163 65 Islam
19 1 165 62 Islam
20 0 169 59 Islam
21 1 173 70 Islam 29
Data pada ilustrasi tersebut diolah menggunakan
MINITAB

Descriptive Statistics: Tinggi, Berat

Variable N Mean StDev Variance Minimum Q1 Median Q3 Maximum


Tinggi 21 163.81 5.85 34.26 151.00 160.00 163.00 167.00 176.00
Berat 21 60.10 8.86 78.49 45.00 53.50 60.00 64.00 82.00

Variable Range IQR


Tinggi 25.00 7.00
Berat 37.00 10.50

30
Diagram Kotak Garis (boxplot)

31
Informasi yang diperoleh dari
diagram kotak garis

 Melihat ukuran penyebaran dan ukuran


pemusatan data
 Melihat adanya data pencilan
 Sebagai alat pembandingan sebaran dua
kelompok data atau lebih

32
Penyajian Dengan Box-plot(1)

Boxplot of data 1

Q1 Q2 Q3

Min Max

Interquartli Range

40 45 50 55 60
data 1
33
Cara Membuat Box-plot

• Hitung Statistik lima serangkai : Nilai terkecil, Q1, Median, Q3, Nilai
terbesar
• Hitung Pagar Dalam Atas (PAD) / Upper Fence : Q3 +1.5(Q3-Q1)
• Hitung Pagar Dalam Bawah (PBD) / Lower Fence: Q1-1.5(Q3-Q1)
• Identifikasi data. Jika data < PBD atau data > PAD maka data
dikatakan outlier
• Gambar kotak dengan batas Q1 dan Q3
• Jika tidak ada pencilan : Tarik garis dari Q1 sampai data terkecil dan
• tarik garis dari Q3 sampai data terbesar
• Jika ada pencilan : Tarik garis Q1 dan atau Q3 sampai data sebelum
pencilan
• Pencilan digambarkan dengan asterik

34
Cara Membuat Box-plot (Mendenhall)

35
Cara membuat Box-plot dan
interpretasinya

• Lihat : Mendenhall (Example 2.14), hal. 81

36
Ilustrasi (1)
• Statistik 5 serangkai dari data sbb:

Me 48
Q1 Q3 43 55
Min Max 40 59

• PDA = 55 + 1.5 (55 – 43) = 73


• PDB = 43 – 1.5 (55 - 43) = 25
• Tidak ada pencilan (mengapa?)

37
Boxplot of data 1

40 45 50 55 60
data 1

Sebaran data tidak simetrik, karena nilai median


lebih dekat ke Q1  miring ke kanan
Tidak ada pencilan
38
Ilustrasi (4)

Stem-and-leaf of data 1 N = 23
Leaf Unit = 1.0 Me 48
Q1 Q3 43 55
9 4 002233344 Min Max 40 80
(5) 4 68899
9 5 02
PDA = 55 + 1.5 (55 – 43) = 73
7 5 556788 PDB = 43 – 1.5 (55 - 43) = 25
1 6
1 6
Pencilan : 80
1 7
1 7
1 8 0

39
Boxplot of data 1

40 50 60 70 80
data 1

Sebaran data tidak simetrik, karena nilai median


lebih dekat ke Q1  miring ke kanan
Terdpat nilai pencilan (80)
40
Jawa Barat Jawa Tengah
Contoh data: No. Kota/Kab Pert. Pend. No. Kota/Kab Pert. Pend.
1 Pandenglang 2.15 1 Cilacap 1.28
2 Lebak 2.48 2 Banyumas 1.78
3 Bogor 4.52 3 Prubalingga 1.42
4 Sukabumi 2.51 4 Banjarnegara 1.49
5 Cianjur 2.33 5 Kebumen 1.09
6 Bandung 3.31 6 Purworejo 0.62
7 Garut 2.35 7 Wonosobo 1.64
8 Tasikmalaya 2.15 8 Magelang 1.31
9 Ciamis 1.21 9 Boyolali 1.08
10 Kuningan 1.97 10 Klaten 1.19
11 Cirebon 2.73 11 Sukoharjo 2.10
12 Majalengka 2.01 12 Wonogiri 0.51
13 Sumedang 1.41 13 Karanganyar 2.07
14 Indramayu 2.53 14 Sragen 1.85
15 Subang 1.89 15 Grobogan 1.52
16 Purwakarta 2.32 16 Blora 1.27
17 Karawang 2.31 17 Rembang 2.08
18 Bekasi 3.57 18 Pati 1.62
19 Tangerang 4.04 19 Kudus 2.03
20 Serang 2.85 20 Jepara 1.87
21 Kota Bogor 2.60 21 Demak 1.38
22 Kota Sukabumi 1.48 22 Semarang 0.46
23 Kota Bandung 2.20 23 Temanggung 1.83
24 Kota Cirebon 2.51 24 Kendal 0.83
25 Batang 1.70
Rata-Rata: 26 Pekalongan 1.80
Jabar 2.48 27 Pemalang 1.79
Jateng 1.68 28 Tegal 2.67
Minimum : 29 Brebes 2.09
Jabar 1.00 30 Kota Magelang 1.25
Jateng 1.00 31 Kota Surakarta 1.39
Maksimum: 32 Kota Slatiga 2.30
Jabar 23.00 33 Kota Semarang 5.21
Jateng 34.00 34 Kota Pekalongan 1.95
35 Kota Tegal 41
2.44
Boxplot of pertumbuhan pendd vs prop

Kota Semarang
5
Bogor

4 Tangerang

pertumbuhan pendd
3

0
Jawa Barat Jawa Tengah
prop

Pertumbuhan penduduk di Jawa Barat relatif lebih tinggi


dibandingkan dengan pertumbuhan penduduk di Jawa
Tengah. Secara umum, tingkat keragaman pertumbuhan
penduduk antar kabupaten, di Jawa Tengah sedikit lebih
besar dibanding dengan Jawa Barat. Kab Bogor dan
Tangerang merupakan daerah yang tingkat pertumbuhan
pendudukya cukup tinggi. Di Jawa Tengah Kota Semarang
yang pertumbuhan penduduknya paling tinggi.
42
PR/Tugas (1)
Dikumpulkan di Dept Statistika, pada hari Selasa
minggu depan sebelum jam 10.00
Perhatian : m adalah dua digit terakhir dari NIM
Anda

1. Mendenhall (Exercise 2.42), hal. 84  terlebih


dahulu setiap data pada soal tersebut ditambah
dengan 0.m
2. Mendenhall (Exercise 2.45), hal. 84  terlebih
dahulu setiap data pada soal tersebut ditambah
dengan 0.m
3. Mendenhall (Exercise 2.47), hal. 84  terlebih
dahulu setiap data pada soal tersebut ditambah
dengan 0.m
43
Terima Kasih

Materi ini bisa di-download di:


kusmans.staff.ipb.ac.id

44

Anda mungkin juga menyukai