Distribusi Chi-Square
Distribusi Chi-Square
Distribusi Chi-Square
I. PENDAHULUAN
Ketiga macam aplikasi distribusi 2 akan dijelaskan satu persatu pada bab ini.
Pembicaraan akan diawali dengan memberi penjelasan tentang distribusi 2.
II. DISTRIBUSI 2
Definisi
Jika X1, X2, … Xv adalah variabel random independen yang memiliki distribusi normal,
sementara Z1, Z2, … Zv merupakan variabel random standarnya atau Zx N (maka
∑ Z 21 akan memiliki distribusi 2 dengan derajat bebas v. jika terdapat v variabel
random, tetapi hanya v – k variabel yang independen maka derajat bebasnya v – k.
Jika v variabel random adalah independen, maka distribusi 2 memiliki rata-rata dan
varians
E(2) = v
σ 2 = 2v
Ternyata nilai derajat bebas merupakan parameter dalam suatu distribusi 2, di mana
rata-rata dari setiap distribusi 2 sama dengan nilai derajat bebasnya. Seperti distribusi
probabilitas binomial, t dan F yang telah kita pelajari, distribusi 2 , yang bentuknya
ditentukan oleh derajat bebasnya. Untuk distribusi 2 dengan derajat bebas v, modus
dan puncak kurva akan terletak pada nilai 2 = v – 2. Sehingga modus untuk distribusi
2 dengan derajat bebas 7 akan terletak pada nilai 2 = 5, begitu seterusnya seperti
terlihat pada Gambar 1.
1
Gambar 1.
Karena nilai merupakan penjumlahan kuadrat dari variabel normal standar Z, maka
2
nilainya selalu bertanda positif. Sehingga distribusi 2 dimulai dari titik nol, condong ke
kanan dan mempunyai ekor yang panjang tak terhingga ke kanan. Jika derajat bebas
menjadi sangat besar maka distribusi 2 akan mendekati distribusi normal.
Di samping itu, jika kita menghitung varians sampel s2 dengan observasi sebanyak n
yang diambil dari populasi normal dengan varians 2, maka telah dibuktikan oleh
statistik bahwa :
(n−1)σ 2
akan memiliki distribusi 2 dengan derajat bebas n – 1.
σ2
Untuk membantu penggunaan tabel distribusi 2, (Tabel IX pada lampiran) ikutilah
contoh seperti berikut :
Jika derajat bebas = 10, nilai 2 untuk 10% wilayah yang diarsir pada sisi kanan
dituliskan
Gambar 2.
semua pengujian hipotesis pada bab ini merupakan pengujian searah atas dengan nilai
kritis ❑2, v yang berarti nilai 2 dari distribusi itu dengan derajat bebas v dan memiliki
wilayah sisi kanan sebesar tingkat signifikansi .
Sebagai contoh :
2
III. UJI SIGNIFIKANSI OBSERVASI BERBEDA DENGAN FREKUENSI
TEORITIS
4. Memutuskan apakah menolak atau tidak menolak H0, setelah membandingkan nilai
2
test statistik dengan nilai kritis yang dapat dilihat dalam tabel. Jika 2 > ❑, v maka
H0 ditolak.
Contoh :
Tabel 1.
Jenis Penyakit
A B C D Jumlah
f0 3 5 6 3 17
f1 6 6 3 2 17
Karena untuk penyakit C dan D memiliki fe < 5 maka lazimnya dalam pengujian ini, fe
kedua kelompok itu digabung menjadi seperti pada Tabel 2.
3
Tabel 2.
A B C dan D Jumlah
f0 3 5 9 17
f1 6 6 5 17
Karena hanya terdapat 3 kategori dan tak ada parameter populasi yang akan diduga,
maka derajat bebas distribusi 2 adalah v = 3 – 0 – 1 = 2. Sehingga nilai kritisnya
❑20,1 ;2 = 4,61
Karena nilai 2 lebih besar dari nilai kritis maka H0 ditolak, berarti ada perbedaan yang
signifikan antara frekuensi ekspektasi dan observasi dari penyakit-penyakit di daerah
tersebut.
Koreksi Yates adalah analogi dari koreksi kontinuitas yang diterapkan pada pendekatan
normal terhadap distribusi binomial. dalam pengujian dengan distribusi 2, nilai tabel
2dihitung dari distribusi teoritis asli yang kontinyu, sementara perkiraan yang sedang
kita gunakan adalah diskrit.
Ada kecenderungan menduga terlalu tinggi nilai 2 yang berarti akan meningkatkan
kemungkinan menolak H0. Sehingga perlu mengoreksi 2 ke bawah. Yates
menunjukkan bahwa jika :
2
=∑
2 (|f 0 −f e|−1/2) , digunakan
fe
Maka perkiraan 2 telah diperbaiki. Penyesuaian ini hanya digunakan jika derajat bebas
= 1. Jika derajat bebas lebih dari 1, penyesuaian ini tak digunakan.
Contoh :
Dalam pelemparan sebuah mata uang logam sebanyak 50 kali diperoleh hasil seperti
pada Tabel 3. Apakah pelemparan itu jujur?
Tabel 3.
4
f0 22 28 50
fe 25 25 50
Jawab :
( 22−25 )2 ( 28−25 )2
2 = + = 0,72
25 25
(|22−25|−1/2 )2 (|28−25|−1 /2 )2
2 = + = 0,5
25 25
2
Misalkan tingkat signifikan 5%, maka nilai kritis ❑(0,05 ;1)= 3,84. Kebetulan, nilai test
statistik yang diperoleh melalui pendekatan Pearson dan koreksi Yates keduanya lebih
kecil dari nilai kritis, berarti H0 diterima. Sehingga pelemparan uang logam dikatakan
jujur. Jika kedua cara menghasilkan kesimpulan yang berbeda maka ukuran sampel
diperbesar.
Dari contoh terlihat bahwa penggunaan koreksi Yates menunjukkan nilai 2 dari 0,72
menjadi 0,5. Jika f0 besar, koreksi Yates hanya berpengaruh kecil tetapi pengaruhnya
menjadi besar jika f0 kecil. Akhirnya jika selisih f0 dengan fe kurang dari 1/2, koreksi
Yates tak perlu dipakai.
Pada Tabel 1. Sebelum sub bab ini, frekuensi observasi menempati satu baris saja,
sehingga tabel itu dinamakan Tabel Klasifikasi Satu Arah. Karena banyaknya kolom
adalah 4, tabel ini juga dinamakan Tabel 1 x 4. Bila frekuensi observasi menempati r
baris dan c kolom ( di mana r dan c 1) maka dinamakan Tabel Klasifikasi Dua Arah
atau Tabel r x c atau Tabel Contingency.
Tabel Contingency berisi data yang diperolah dari sampel random sederhana. Data-data
aktual itu dinamakan frekuensi observasi yang diberi simbol f0. Bersamaan dengan
masing-masing frekuensi observasi terdapat frekuensi ekspektasi atau teoritis yang
dihitung menurut hukum probabilitas (independen).
Frekuensi observasi dan ekspektasi digunakan untuk menghitung statistik sampel untuk
menguki hipotesis apakah kelompok baris dan kolom independen. Nilai 2 nilai
statistiknya dirumuskan :
2
( f 0−f e )
2 =
fe
Jika kelompok baris dan kolom independen maka fe dicari sebagai berikut :
5
Jumlah menurut baris X Jumlahmenurut kolom
fe = Jumlah seluruh baris dan kolom
Distribusi sampel 2 yang dihitung dari Tabel Contingency akan didekati dengan
distribusi 2 dengan derajat bebas v = (r – 1). Pendekatan ini akan memuaskan jika fe
minimum 5. Jika fe kurang dari 5, kita akan menggabungkan baris atau kolom dalam
Tabel Contingency untuk memperoleh fe sekurang-kurangnya 5 sebelum menghitung
nilai 2. Derajat bebas juga dihitung setelah penggabungan baris atau kolom ini.
Contoh :
Sebuah dealer mobil telah mengumpulkan data seperti yang ditunjukkan pada Tabel 4.
Ujilah pada tingkat signifikan 5%. Apakah jenis mobil yang dibeli independen dengan
umur pembeli.
Tabel 4.
Jenis Mobil
Umur Impor Produksi Dalam Negeri Jumlah
Di bawah 30 10 10 20
30 atau lebih 20 10 30
Jumlah 30 20 50
Jawab :
1) H0 : Jenis mobil independen dengan umur pembeli
H1 : Jenis mobil tak independen dengan umur pembeli
2) Tabel 5. Berisi frekuensi observasi dan frekuensi ekspektasinya. Dari ini kita dapat
menghitung derajat bebas dan nilai test statistik.
Tabel 5.
Tabel Contingency Untuk Pembeli Mobil
Jenis Mobil
Umur Impor Produksi Dalam Negeri Jumlah
Di bawah 30 10(12) 10(8) 20
30 atau lebih 20(18) 10(12) 30
Jumlah 30 20 50
Karena setiap nilai fe lebih besar dari 5 maka tidak perlu dilakukan penggabungan.
Tabel itu memiliki r = 2 dan c = 2 sehingga derajat bebasnya v = (2 – 1)(2 – 1) = 1, jadi
butuh koreksi Yates untuk menghitung test statistik. Dengan tingkat signifikan 5%
diperoleh nilai kritis 2 = 3,84.
6
3) Nilai test statistik
4) Karena 2 lebih kecil dari nilai kritis maka H0 tak ditolak, berarti umur independen
(bukan faktor) terhadap jenis mobil yang dibeli atau tak dapat dikatakan bahwa anak
muda lebih senang terhadap mobil impor.
Coefficient of Contingency
❑2
C=
√ ❑2+ n
Semakin besar nilai C, makin besar tingkat hubungannya. Jumlah baris dan kolom
dalam tabel Contingency menentukan nilai maksimum yang dapat dicapai C, yang tak
pernah lebih dari satu. Jika jumlah baris atau kolom dalam tabel Contingency sama
besar, misalnya sebesar g, maka nilai C tak akan melebihi √ g – 1/g. Untuk lebih
memahami ikuti penjelasan berikut.
Nilai C akan maksimum jika antar kategori dalam tabel Contigency berhubungan secara
sempurna. Keadaan seperti itu dapat ditunjukkan melalui tabel Contigency seperti
berikut.
Tabel 6.
Tabel Contingency Untuk Pembeli Mobil
Jenis Mobil
Umur Impor Produksi Dalam Negeri Jumlah
Di bawah 30 20(8) 0(12) 20
30 atau lebih 0(12) 30(18) 30
Jumlah 20 30 50
Karena diasumsikan terdapat hubungan yang sempurna, maka salah satu diagonal harus
memiliki nilai f0 = 0. Misalkan semua anak muda memilih mobil impor dan semua
orang tia memilih produksi dalam negeri. Sementara nilai fe yang sesuai dengan
masing-masing f0 dituliskan dalam tanda kurang. Karena derajat bebas 1, maka nilai uji
2 dihitung dengan koreksi Yates.
45,95
Sehingga nilai C =
√ (45,95+50)
= 0,6920
7
Ujian Signifikansi Coefficient of Contingency
Jika kita mengamati hubungan antara dua himpunan atribut (kategori), kita tentu ingin
menentukan apakah dapat disimpulkan bahwa antar kategori berhubungan dalam
populasi. Untuk menguji Coefficient of Contingency, kita tidak menggunakan distribusi
sampling C karena kerumitan matematika banyak ditemui. Sebagai gantinya digunakan
distribusi sampling 2 dengan derajat bebas v = (r – 1) (c – 1).
Gambar 3.
Test goodness of fit menggunakan data sampel sebagai dasar untuk menerima atau
menolak tentang bentuk distribusi populasi. Asumsi ini dinyatakan sebagai H0.
Contoh :
Setelah menetapkan H0, test ini dilakukan dengan urut-urutan yang tak berbeda dengan
test yang lain. Setelah frekuensi ekspektasi diperoleh, giliran berikutnya adalah
menghitung nilai test statistika yang rumusnya juga tak berbeda yaitu
8
2
( f 0−f e )
=
2
fe
Akhirnya, nilai test statistik dibandingkan dengan nilai kritis ❑2, v sebagai dasar untuk
memutuskan apakah H0 harus ditolak atau tak ditolak.
Test goodness of fit berbeda dengan test independensi baik dalam metode perhitungan
frekuensi ekspektasi maupun dalam aturan untuk menentukan derajat bebas. Dalam test
goodness of fit, metode menghitung frekuensi ekspektasi bergantung pada asumsi yang
dibuat mengenai populasinya, dan derajat bebas dalam test ini adalah v = n – k – 1,
dimana
Rumus proses Poisson yang telah kita bicarakan menjawab probabilitas banyaknya
kedatangan dalam suatu interval waktu. Rumusnya adalah
x
e−¿
P(x) = ¿ , di mana
x!
Rumus itu digunakan untuk menentukan frekuensi ekspektasi dalam pengujian apakah
suatu distribusi adalah distribusi Poisson dengan nilai tertentu. Untuk lebih
memahami, ikuti ilustrasi berikut.
Tabel 7.
Langkah pertama yang harus dilakukan sebelum melakukan prosedur pengujian adalah
menduga dari data sampel.
^ = ( 0 x 47 ) +¿ ¿ = 1
9
Tahap selanjutnya adalah menghitung frekuensi ekspektasi yang merupakan perkalian
antara probabilitas Poisson dengan banyaknya satuan waktu yang diperlukan dalam
sampel.
Tabel 8.
Sebelum menghitung 2, periksa nilai fe yang kurang dari 5. Jika ada, gabungkan
sehingga setiap nilai fe > 5. Frekuensi ekspektasi yang telah digabungkan dan
perhitungan 2 ditunjukkan pada Tabel 9.
Tabel 9.
2
Banyak f0 fe f0 - fe ( f 0−f e )
Langganan fe
0 47 55,185 -8,185 66,994
1 61 55,185 5,815 33,814
2 37 27,585 9,415 88,642
3 atau lebih 5 12,045 -7,045 49,632
= 239,082
2
10
Test Goodness of Fit Terhadap Distribusi Binomial
Suatu perusahaan membungkus kue dalam kotak yang berisi 20 potong. Semua kue dari
suatu sampel sebanyak 100 bungkus diteliti dan jumlah kue yang cacat pada masing-
masing bungkus dicatat. Data sampel diberikan pada tabel berikut.
Dengan tingkat signifikan 5% ujilah apakah jumlah kue yang cacat dalam setiap
bungkus mengikuti distribusi binomial.
Jawab :
Tabel 10.
11
Tabel 11.
Probabilitas Binomial n = 20, p = 0,1 dan Frekuensi Ekspektasi
0 0,1216 12,16
1 0,2702 27,02
2 0,2852 28,52
3 0,1901 19,01
4 0,0898 8,89
5 0,0319 3,19
6 atau lebih 0,0113 1,3
Tabel 12.
2
Banyak f0 fe f0 - fe ( f 0−f e )
Langganan fe
0 5 12,16 -7,16 4,2159
1 36 27,02 8,98 2,9845
2 28 28,52 -0,52 0,0095
3 19 19,01 -0,01 0,0000
4 atau lebih 12 13,29 -1,29 0,1252
2 = 7,3351
12
REFERENSI :
ASW = Anderson Sweeney Williams. 1990. Statistics for Business and Economics. Eighth
Edition. International Student Edition. DMD = David M. Levine, Mark L. Berenson, David
Stephan. 2002. Statistics for Managers.International Edition.
R & D = Richard I. Levin, David S. Rubin. 1994. Statistics For Management. Six Edition.
Prentice Hall International Editions. New Yersey.
RM (1-2) = Robert D Mason, Douglas A. Lind. Alih Bahasa Ellen Gunawan Sitompul. dkk.
1996. Teknik Statistika untuk Bisnis dan Ekonomi. Penerbit Erlangga. Jakarta.
MBS (1-2) = Mc Clave, Benson, Sincich. Alih Bahasa Bob Sabran. 2011. Statistik untuk
Bisnis dan Ekonomi. Edisi Kesebelas. Penerbit Erlangga. Jakarta.
S & P (1) = Suharyadi dan Purwanto. 2003. Statistika untuk Ekonomi dan Keuangan Modern.
Penerbit Salemba Empat. Jakarta.
J.S (1-2) = J. Supranto. 2008. Statistik Teori dan Aplikasi. Edisi Ketujuh. Penerbit Erlangga.
Jakarta.
AD (1-2) = Anto Dayan. 1995. Pengantar Metode Statistik. Jilid I. Penerbit LP3ES. Jakarta.
13
LAMPIRAN
14