WEEK 5 Descriptive Statistics

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 12

LECTURE NOTES

STAT6174 - Probability Theory and


Applied Statistics

Week 5
Descriptive Statistics

STAT6174 – Probability Theory and Applied Statistics


LEARNING OUTCOMES

1. Peserta diharapkan mampu menggunakan metode statistik yang tepat untuk pengambilan
keputusan statistik
2. Peserta diharapkan bisa menggunakan MINITAB untuk melakukan analisis
3. Peserta dapat Menginterpretasikan hasil perhitungan statistic dan output MINITAB

OUTLINE MATERI (Sub-Topic):

1. Ukuran pemusatan

2. Ukuran penyebaran

STAT6174 – Probability Theory and Applied Statistics


ISI MATERI

Ukuran Statistik, Parameter, dan Statistik


Ukuran statistik adalah bilangan yang diperoleh dari sekumpulan data statistik
melalui proses sritmatik tertentu. Dalam analisis data, ukuran statistik ini mengisyaratkan
gejala spesifik, misalnya Gejala Letak Pusat Pengelompokkan Data, Gejala
Penyebaran/Variasi/ Keseragaman Data, atau gejala lainnya yang dikandung oleh data
yang sedang dianalisis.
Apabila ukuran statistik ini diperolehnya atas dasar perhitungan yang menyeluruh
(complete enumeration) atau sensus, maka namanya parameter, sedangkan jik
adiperolehnya atas dasar perhitungan terhadap data statistik yang ada dalam sampel,
ukuran statistik ini disebut statistik.

Ukuran Gejala Pusat


Ukuran ini mengisyaratkan letak pemusatan pengelompokkan data. Oleh karena
itu ukuran-ukuran statistik ini disebut juga Ukuran Letak (Measures of Location).
1. Rata-Rata Hitung (Average atau Mean)
Terdapat dua rata-rata hitung yaitu rata-rata hitung untuk populasi yang
berukuran N dan rata-rata hitung untuk sampel berukuran n. Jika yang dicari adalah
rata-rata hitung untuk populasi, maka dapat diperoleh dengan menggunakan rumus:

x i
= i =1

N
Contoh 1. Diperoleh data tentang nilai yang diperoleh 5 mahasiswa pada mata kuliah
statistika, yaitu; 30, 50, 60, 40, dan 60. Jika data berasal dari populasi, hitunglah
berapa nilai rata-rata nilai statistika untuk 5 orang di atas.
Jawab: Karena data berasal dari populasi, maka rata-rata dapat dihitung sebagai
berikut:

30 + 50 + 60 + 40 + 60
= = 48
5

STAT6174 – Probability Theory and Applied Statistics


Jika yang dicari adalah rata-rata sample, maka rata-rata dapat diperoleh dengan
menggunakan rumus:
n

x i
x= i =1
n
Contoh 2. Seorang pengamat makanan mengambil secara random sebanyak 7 kaleng
terhadap makanan kaleng yang bertujuan untuk mengetahui kadar zat beracun (dalam
prosen) yang terdapat dalam kaleng tersebut. Data yang dikumpulkan dari 7 buah
kaleng tersebut adalah: 1,8 , 2,1 , 1,7 , 1,6 , 0,9 , 2,7 , dan 1,8. Hitunglah rata-rata
sampel?
Jawab: karena data berasal dari sampel, maka dapat dihitung:

1,8 + 21, + 1,7 + 0,9 + 2,7 + 1,8


x= = 1,8%
7

Rumus yang dipergunakan untuk menghitung rata-rata dari data bergolong adalah:

X=
f x i i

f i

Adapun yang menjadi sifat dan penggunaan rata-rata hitung adalah:


a. Nilai numerik rata-rata hitung ditentukan secara ketat oleh bilangan-bilangan yang
menyusunnya.
b. Nilai numerik rata-rata hitung adalah unik.
c. Nilai Numerik rata-rata hitung sangat dipengaruhi oleh nilai ekstrim.
d. Rata-rata hitung hanya boleh dihitung (valid sebagai ukuran gejala pusat) untuk
variabel yang memenuhi tingkat pengukuran sekurang-kurangnya interval,
e. Apabila dalam rentetan data yang dihadapi terdapat bilangan ekstrim, tidak
disarankan untuk menggunakan rata-rata hitung sebagai ukuran gejala pusat,
sebab bisa memberikan kesimpukan yang keliru.
f. Tidak disarankan untuk mengambil kesimpulan yang hanya didasarkan kepada
rata-rata hitung.

STAT6174 – Probability Theory and Applied Statistics


2. Median
Median merupakan suatu harga yang merupakan titik tengah dari keseluruhan
harga pada suatu satuan data. Oleh karena itu terdapat 50% data yang berada di bawah
atau sama dengan nilai tersebut dan terdapat 50% lagi data yang berada di atas atau
sama dengan data tersebut.
Contoh 3. Dari 5 orang mahasiswa yang mengikuti ujian statistik diperoleh angka; 82,
93, 86, dan 79. Tentukan median jika data tersebut berasal dari populasi.
Jawab: angka yang diperoleh harus disusun terlebih dahulu dari kecil ke besar,
sehingga diperoleh:
79 82 86 92 93
Jadi median dari data tersebut adalah : Me = 86
Contoh 4. Untuk mengetahui kadar nikotin yang terkandung di dalam rokok, diambil
sampel berukuran 6 (rokok) yang diperoleh data (dalam miligram) sebagai berikut:
2,3 , 2,7 , 2,5 , 2,9 , 3,1 , dan 1,9. Tentukan mediannya!
Jawab: Data diurutkan dari kecil ke besar, sehingga diperoleh:
1,9 2,3 2,5 2,7 2,9 3,1
Median terletak antara angka 2,5 dan 2,7, oleh karena itu median ditentukan dengan
cara:

2,5 + 2,7
Me = = 2,6 mi ligram
2
Untuk menghitung Median dari data bergolong, dipergunakan rumus:

 12 n - F 
Me = b + p  
 f 
b = batas bawah, di mana median akan terletak
p = panjang kelas interval
F = jumlah semua frekuansi sebelum kelas interval
f = frekuensi kelas median

Adapun yang menjadi sifat-sifat dari penggunaan median adalah sebagai berikut:
a. Nilai numerik median tidak ditentukan secara ketat oleh bilangan-bilangan yang
menyusunnya. Oleh karena itu, jika dalam rentetan bilangan ada yang berubah
nilai numeriknya, median belum tentu berubah.

STAT6174 – Probability Theory and Applied Statistics


b. Median tidak dipengaruhi oleh nilai ekstrim, dan nilai median adalah unik.
c. Median boleh dihitung (valid sebagai ukuran gejala pusat) untuk variabel yang
memenuhi skala pengukuran sekurang-kurangnya ordinal.

Apabila dalam rentetan bilangan terdapat nilai ekstrim, disarankan untuk


menggunakan median sebagai pengganti rata-rata hitung.
3. Modus
Modus didefinisikan sebagai bilangan yang paling banyak muncul atau bilangan
yang frekuensi kemunculannya paling besar dari sutau satuan data. Modus tidak selalu
dengan mudah diperoleh. Hal ini akan terjadi jika dihadapkan pada suatu harga yang
mempunyai frekuensi kemunculan yang sama dengan yang lainnya.
Contoh 5. Jika diperoleh data tentang besarnya sumbangan yang diberikan oleh tiap
propinsi untuk pengungsian di Aceh yang dinyatakan dalam juta, diperoleh data: 9,
10, 5, 9, 9, 7, 8, 6, 10, dan 11 juta, maka modus dalam hal ini adalah 9 juta.
Contoh 6. Dikumpulkan data terhadap 12 sekolah menengah umum yang diambil
secara acak untuk mengetahui banyaknya siswa di sekolah tersebut yang diterima di
PTN. Diperoleh data; 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1, dan 4. Pada kasus ini terjadi dua
bilangan yang frkeuensi kemunculannya paling banyak yaitu 2 dan 4, dan kedua
bilangan tersebut adalah modus untuk data yang kita peroleh ini. Jika terjadi pada
suatu satuan data bermodus seperti ini disebut bimodal.
Contoh 7. Tidak terdapat modus pada satuan data yang diperoleh pada contoh 3.
Untuk menghitung modus pada data bergolong dipergunakan rumus:
 b1 
Mo = b + p  
b +
 1 2b
b = batas kelas interval dengan frekuensi terbanyak
p = panjang kelas interval
b1 = frekuensi pada kelas modus dikurangi frekwensi kelas terdekat
sebelumnya
b2 = frkuensi kelas modus dikurangi frekuensi kelas interval berikutnya.

STAT6174 – Probability Theory and Applied Statistics


Adapun yang menjadi sifat-sifat dan penggunaan modus adalah sebagai berikut:
a. Nilai numerik modus tidak unik (dalam sebuah rentetan data bisa terdapat lebih
dari sebuah modus).
b. Modus digunakan sebagai ukuran gejala pusat untuk variabel dengan tingkat
pengukuran sekurang-kurangnya nominal.

Dari sifat-sifat penggunaan ukuran gejala pusat berdasarkan skala pengukuran,


maka dapat digambArkan secara sederhana seperti pada tabel 2.1. di bawah ini
TABEL 2.1.
PENGGUNAAN UKURAN GEJALA PUSAT
BERDASARKAN SKALA PENGUKURAN DATA

Skala Ukuran Gejala Pusat


Pengukuran Mean Median Modus
Nominal V
Ordinal V V
Interval/Rasio V V V

1. Ukuran Dispersi atau Ukuran Variasi


Selain ukuran gejala pusat, terdapat ukuran lain yaitu ukuran dispersi atau ukuran
vasiasi yang mengisyaratkan keseragaman data. Nilai numerik ukuran ini tidak pernah
negatif (selalu positif). Apabila nilai ukuran ini diperoleh sama dengan nol (0), hal ini
menunjukkan bahwa data yang kita miliki keadaannya seragam sempurna (tidak ada
variasi, atau semua bilangan nilai numeriknya sama). Oleh karena itu makin jauh nilai
numerik ukuran ini dari nol (0), makin tidak seragam keadaan data tersebut. Terdapat
bebeapa ukuran variasi yang biasa digunakan, yang juga akan diuraikan di sini, adalah;
rentang (range), varians (variance), simpangan baku (standar deviation), koefisien variasi
(koeficient of variation), rentang antar kuartil (interquartiles ranges), dan indeks dispersi
(index of dispersion).
1. Rentang
Rentang pada suatu satuan data adalah selisih terbesar dan terkecil dari suatu
satuan data tersebut.
Contoh 8. IQ lima orang anggota keluarga adalah; 108, 112, 127, 118, dan 113.
Tentukan rentangnya!

STAT6174 – Probability Theory and Applied Statistics


Jawab: Rentang dari 5 IQ tersebut adalah 127 – 108 = 19.
2. Varians (variance)
Rumus yang dipergunakan untuk menghitung varians, jika data berasal dari populasi
adalah:

2
 N 
  xi 
2  i =1 
N

 x1 -
N
 2 = i =1
N
Sedangkan varians yang dihitung berdasarkan sampel dihitung dengan rumus:
2
 n 
  xi 
2  i =1 
n

 x1 -
n
s 2 = i =1
n -1

3. Simpangan Baku (Standar Deviation)


Simpangan baku didefinisikan sebagai akar dari Varians. Oleh karena itu rumus
simpangan baku adalah:

 = 2
Untuk sampel adalah;

s = s2
Varians dan simpangan bau hanya boleh digunakan sebagai alat pembanding
keseragaman data, apabila data yang dibandingkan keseragamannya itu berasal dari
variabel yang sama dengan satuan pengukuran (unit of measurement) yang sama pula.
Varians dan Simpangan Baku hanya valid digunakan sebagai ukuran variasi untuk
variabel yang memenuhi tingkat pengukuran sekurang-kurangnya interval.
4. Indeks Dispersi atau Indeks Variasi Kualitatif (Index of Dispersion or Index of
Qualitative Variation)
Untuk mengukur keseragaman (variasi) data yang mempunyai tingkat pengukuran
nominal, digunakan Indeks dispersi dengan rumus:
2
 C  C 2
C.   f i  -  f i
ID =  i =1 2 i =1
 C 
  f i  (c - 1)
 i =1 
STAT6174 – Probability Theory and Applied Statistics
Nilai numerik ID terbatas: 0  ID  1
ID = 0 menunjukkan bahwa data seragam sempurna. Keadaan ini terjadi apabila
semua frekuensi terdapat pada satu kategri dan kategori lainnya frekuensinya sama
dengan nol (0). ID=1 mengisyaratkan variasi maksimal. Fenomenon ini terjadi jika
frekuensi terbagi rata untuk semua kategori.
Contoh:
Hasil penelitian Mahasiswa di Desa X tentang jenis pekerjaan penduduk disajikan
dalam data sebagai berikut:
No. Kategori Pekerjaan Banyaknya
1. PNS 75
2. ABRI 9
3. Pedagang 38
4. Petani 142
5. Buruh 208
6 Pelajar/Mahasiswa 196
7. Lain-lain 81
Jumlah penduduk 15 tahun lebih 749

Untuk menghitung Indeks Dispersi diperlukan data:


No. Kategori Pekerjaan fi fi2
1. PNS 75 5625
2. ABRI 9 81
3. Pedagang 38 1444
4. Petani 142 20164
5. Buruh 208 43264
6 Pelajar/Mahasiswa 196 38416
7. Lain-lain 81 6561
Jumlah 749 115555

(7) (749 2 - 115555)


ID = = 0,92635663 7
(749 2 ) (7 - 1)
Jika dijadikan persen, maka ID = 92,6356637%, dibulatkan ID = 92,6%.
5. Ukuran Kemiringan
Ukuran statistik ini mengisyaratkan keadaan bentuk kurva distribusi data nilai-nilai
sebuah variabel, apakah Simetri atau Miring (kurvanya landai ke kiri atau ke kanan).

STAT6174 – Probability Theory and Applied Statistics


Salah satu rumus yang menyatakan kurva distribusi data adalah koefisien kemiringan
yang didasarkan kepada kuartil.

Q(1) + Q(3) - 2M
KK = ; - 1  KK  + 1
Q (3) - Q(1)
KK > 0; kurva miring positif (kurva landai ke kanan)
KK = 0; kurva simetri
KK < 0; kurva miring negatif

STAT6174 – Probability Theory and Applied Statistics


SIMPULAN
Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah
dipahami. Penyajian data dapat dilakukan melalui Tabel, Gambar (histogram, plot, stem-leaf,
box-plot). Peringkasan data dinyatakan dalam dua ukuran yaitu Pemusatan (Median, Modus,
Kuartil, Mean, dll). Penyebaran (Range, Interquartile Range, Ragam) .
Tujuan Mendeskripsikan data :
• Mengetahui karakteristik data sesederhana mungkin tetapi memiliki pengertian yang
dapat menjelaskan data secara keseluruhan
• Data Numerik memiliki pusat dan keragaman: Ukuran pemusatan, Ukuran
penyebaran

STAT6174 – Probability Theory and Applied Statistics


DAFTAR PUSTAKA

1. Hayter, Anthony.J, (2012), Probability and Statistics for Engineers and Scientist 4th
edition,Cengage Learning, Chapter 6
2. https://www.stat.ipb.ac.id/en/uploads/AMS/STK211/2016/Materi%202%20Statistik%
20Deskriptif.pdf

STAT6174 – Probability Theory and Applied Statistics

Anda mungkin juga menyukai