REGRESI LOGISTIK Revisi
REGRESI LOGISTIK Revisi
REGRESI LOGISTIK Revisi
OLEH:
KELOMPOK 3
0
A. Pendahuluan/Gambaran
Sebagai salah satu disiplin ilmu, statistika berperan untuk mengumpulkan,
menyajikan dan menganalisis data. Salah satu analisis pada statistika adalah analisis
regresi. Analisis regresi merupakan suatu metode yang digunakan untuk menganalisis
hubungan antara dua atau lebih variabel. Pada analisis regresi terdapat dua jenis variabel
yaitu variabel bebas dan variabel terikat. Berdasarkan pola hubungannya, analisis regresi
dibagi menjadi dua yaitu analisis regresi linear dan analisis regresi nonlinear. Data hasil
penelitian yang berupa data kualitatif yang harus koding (misal: Variabel Y kategorik
bernilai (1) menyatakan ada karakteristik; bernilai (0) menyatakan tidak ada karakteristik)
dapat dianalisis dengan regresi non-linear. Salah satu model regresi nonlinear adalah
regresi logistik.
B. Definisi
Regresi logistik merupakan sebuah metode analisis statistik untuk
menggambarkan hubungan antara variabel terikat dengan variabel bebas yang
mempunyai dua atau lebih kategori dengan variabel terikat yang menggunakan skala
kategorik maupun interval (Hosmer dan Lemeshow, 1989). Regresi logistik terbagi
menjadi dua yaitu regresi logistik biner dan regresi logistik multinomial.
Regresi Logistik biner adalah suatu analisis regresi yang digunakan untuk
menggambarkan hubungan antara variabel bebas dengan variabel terikat bersifat biner
atau dikotomus. Variabel dikotomus adalah variabel yang hanya mempunyai dua
kemungkinan nilai, misalnya sukses dan gagal (kategorik nominal). Variabel respon
(variabel terikat) berupa data kualitatif bernilai (1) menyatakan keberadaan karakteristik
(sukses) dan bernilai (0) untuk ketidakberadaan karakteristik (gagal).
(Bagan pengertian regresi logistik biner; banyak variabel x dengan 1 variabel y yang mempunyai 2 kategori/dikotomus)
(Bagan pengertian regresi logistik multinomial; banyak variabel x dengan 1 variabel y yang mempunyai lebih dari 2 kategori/polikotomus)
1
Menurut Hosmer dan Lemeshow (1989) ada beberapa metode yang dapat
digunakan untuk mengestimasi parameter model regresi logistik, yaitu maximum
likelihood methods, noniterative weighted least square methods, dan discriminant
function analysis methods. Salah satu metode yang lebih umum dan digunakan pada
sebagian besar paket program komputer adalah maximum likelihood methods atau metode
maksimum likelihood.
Metode maksimum likelihood adalah metode pendugaan parameter yang
digunakan pada model regresi logistik. Metode ini merupakan dasar pendekatan dalam
menaksir parameter pada model regresi logistik. Pada dasarnya metode maksimum
likelihood memberikan nilai taksiran parameter dengan memaksimalkan fungsi
likelihood. Untuk itu digunakan uji dan hipotesis statistik untuk menentukan apakah
variabel bebas dalam model signifikan atau berpengaruh secara nyata terhadap variabel
terikat.
Model regresi logistik yaitu:
Ket.
P(y) = fungsi kategori
a = konstanta
b1 = koefisien variabel
x = kode variabel
2
4. Dapat menyeleksi hubungan karena menggunakan pendekatan non linier log
transformasi untuk memprediksi odds ratio. Odd dalam ralam regresi logistik sering
dinyatakan sebagai probabilitas.
D. Contoh Kasus
1. Regresi Logistik Biner
Kasus
Faktor - faktor yang Mempengaruhi Indeks Prestasi Mahasiswa
Universitas Dhyana Pura Semester 2 terhadap Status Kelulusan.
Identifikasi variabel Y & X
Cumlaude (1)
Y Status kelulusan
Tidak Cumlaude (0)
3
Biaya hidup per bulan (x7) 1 = < Rp. 500.000
2 = Rp. 500.000 – Rp. 1.000.000
3 = > Rp. 1.000.000
Hubungan mahasiswa 1 = kurang baik
dengan teman (x8) 2 = cukup baik
3 = baik
Hubungan mahasiswa 1 = kurang baik
dengan keluarga (x9) 2 = cukup baik
3 = baik
Motivasi belajar (x10) 1 = rendah
2 = sedang
3 = tinggi
Hipotesis
- H0: Faktor nilai rapor, nilai UN, jalur masuk, pilihan jurusan, tempat tinggal,
metode belajar, biaya hidup per bulan, hubungan mahasiswa dengan teman,
hubungan mahasiswa dengan keluarga, dan motivasi belajar tidak
memengaruhi Indeks Prestasi mahasiswa Universitas Dhyana Pura semester 2
terhadap status kelulusan. βj = 0.
- H1: Faktor nilai rapor, nilai UN, jalur masuk, pilihan jurusan, tempat tinggal,
metode belajar, biaya hidup per bulan, hubungan mahasiswa dengan teman,
hubungan mahasiswa dengan keluarga, dan motivasi belajar mempengaruhi
Indeks Prestasi mahasiswa Universitas Dhyana Pura semester 2 terhadap
status kelulusan. βj ≠ 0.
Mekanisme Uji
1. Uji Signifikansi (Uji Likelihood dan Uji Wald)
2. Odds Rasio
Interpretasi
Jumlah sampel dalam penelitian ini adalah sebanyak 147 mahasiswa
Semester 1 Undhira.
1. Pengujian secara keseluruhan (uji likelihood)
- Hipotesis uji:
H0: β1 = β2 = … = β10 = 0
Ha: minimal ada satu βj ≠ 0, dengan j = 1, 2, … , 10
4
- Taraf signifikansi: α = 0,05
- Kriteria uji
Tolak H0 jika nilai G > X2(α,v)
- Hasil Statistik
G = 26,408
X2(0,05,10) = 18,307
- Pengambilan Keputusan
H0 ditolak sebab nilai G > X2(0,05,10) (26,408>18,307) sehingga dapat
disimpulkan bahwa variabel nilai rapor, nilai UN, jalur masuk, pilihan
jurusan, tempat tinggal, metode belajar, biaya hidup per bulan, hubungan
mahasiswa dengan teman, hubungan mahasiswa dengan keluarga, serta
motivasi belajar signifikan memengaruhi indeks prestasi mahasiswa.
2. Pengujian secara individu (uji wald)
- Hipotesis
H0: βj = 0
Ha: βj ≠ 0, dengan j = 1, 2, …, 10
- Taraf signifikasnsi: α = 0,05
- Kriteria uji
Tolak H0 jika W > X2(0,05,1)
- Tabel Analisis Regresi Logistik Masing-Masing Variabel Prediktor Secara Parsial
Variabel B Wald sig Exp(B)
Rapor 0,197 0,657
Rapor(1) -0,405 1,463 0,767 0
Nilai Rapor
Rapor(2) -0,456 3,720 0,669 0,771
Rapor(3) -0,711 0,54 0,817 0,547
UN 6,742 0,034
UN(1) 1,699 5,158 0,013* 5,468
Nilai UN UN(2) 1,059 4,266 0,039* 2,882
UN (3) -0,847 0,622 0,430 0,429
Jalur_masuk 1,437 0,225
Jalur
Jalur_masuk(1) -0,167 0,314 0,674 0,711
Masuk
Jalur_masuk(0) -0,911 0,364 0,081 0
Pilihan_jurusan 1,673 0,211
Pilihan
Pilihann_jurusan (1) 1,386 7,43 0,09 0
Jurusan
Pilihan_jurusan(2) 1,575 3,298 0,07 0,934
Tempat_tinggal 2,752 0,297
Tempat
Tempat_tinggal(1) -1,972 0,418 0,558 0,450
Tinggal
Tempat_tinggal(2) -0,997 0,183 0,101 0,768
Metode Metode_belajar 0,693 0,327
Belajar Metode_belajar(1) 4,421 0,961 0,423 0,1047
5
Metode_belajar(2) -0,538 0,641 0,503 0
Biaya_hidup 2,099 0,147
Biaya
Biaya_hidup(1) 0,288 0,086 0,789 1,333
Hidup per
Biaya_hidup(2) -0,272 0,095 0,758 0,762
Bulan
Biaya_hidup(3) 0,288 0,148 0,700 1,333
Hubungan Mahasiswa_teman 5,683 0,045
Mahasiswa Mahasiswa_teman(1) 19,741 2,753 0,011* 0,132
dengan Mahasiswa_teman(2) -0,972 5,683 0,017* 0,379
Teman Mahasiswa_teman(3) -2,367 2,956 0,086 0,094
Hubungan Mahasiswa_keluarga 1,537 0,700 4,050
Mahasiswa Mahasiswa_keluarga(1) 6,767 0,581 0,099 1,982
dengan Mahasiswa_keluarga(2) 1,387 0,879 0,390 1,778
Keluarga Mahasiswa_keluarga(3) 1,836 0,214 0,100 2,211
Motivasi_belajar 1,367 0,056 0,359
Motivasi Motivasi_belajar(1) -1,932 1,676 0,077 0,983
belajar Motivasi_belajar(2) -1,629 0,027 0,061 1,219
Motivasi_belajar(3) -0,523 0,441 0,082 2,178
Constanta 0,737 0,325 0,569 0,090
Model Logit
Model logit yang terbentuk adalah:
p(y) = a + b1x1 + b2x2 + b…x… + e
6
p(y) = 0,737 + 1,699x11 + 1,059x12 + 19,741x81 – 0,972x82 + e
p(y) = 0,737 + 1,699(1) + 1,059(2) + 19,741(1) – 0,972(2) + e
Keterangan:
X11 = Nilai UN 1
X12 = Nilai UN 2
X81 = Hubungan Mahasiswa dengan teman(1)
X82 = Hubungan Mahasiswa dengan teman(2)
Keputusan/Kesimpulan
Berdasarkan uji likelihood dan uji wald, dapat disimpulkan bahwa H0
ditolak. Nilai rapor, nilai UN, jalur masuk, pilihan jurursan, tempat tinggal,
metode belajar, biaya hidup perbulan, hubungan mahasiswa dengan teman,
hubungan mahasiswa dengan keluarga, serta motivasi belajar mahasiswa
signifikan memengaruhi indeks prestasi mahasiswa.
Interpretasi dari nilai odds rasio untuk variabel nilai UN sebesar 5,468.
Ini berarti kecenderungan indeks prestasi mahasiswa yang memiliki rata-rata nilai
UN < 8, 5,658 kali lebih besar dibandingkan mahasiswa yang memiliki rata-rata
nilai UN > 9.
DAFTAR PUSTAKA
1. http://eprints.uny.ac.id/52687/3/BAB%20I.pdf
2. http://eprints.undip.ac.id/40295/1/A12_Safitri_Daruyani.pdf
3. https://www.statistikian.com/2015/02/regresi-logistik.html
4. https://www.researchgate.net/publication/284442627_Model_regresi_logistik_multinomia
l_untuk_menentukan_pilihan_sekolah_lanjutan_tingkat_atas_pada_siswa_SMP/downloa
d