Uji Data (Sep 2023)
Uji Data (Sep 2023)
Uji Data (Sep 2023)
UJI DATA
Tujuan:
Untuk memastikan bahwa statistik
parametrik dapat digunakan untuk
menganalisis data, meliputi:
1. Uji missing data (data tidak lengkap/hilang)
2. Uji data outlier (data ekstrim/)
3. Uji asumsi Regresi: normalitas, linearitas,
multikolinearitas, heterokedastisitas,
autokorelasi
2
A. MISSING DATA (Data hilang/kosong)
• Adanya data yang kosong pada
suatu obyek
• Terminologi SPSS: adanya sel-sel
yang kosong pada satu/beberapa
variabel
• Misalnya: penelitian tentang gaji,
beberapa responden tidak
menyebutkan jumlah gajinya.
3
Perlakukan terhadap Missing data
Missing data ≤10% diabaikan (diisi dengan nilai
rata-rata)
Missing data sekitar 15%, membuang baris data
yang kosong
Missing data sekitar 20%-30%, mengumpulkan
data ulang
Missing data lebih dari 30%
membuang/mengganti variabel (Hair, et al.,
2010)
4
B. UJI DATA OUTLIER
(data ekstrim/menyimpang)
Data yang secara nyata berbeda dengan
data-data yang lain. Mungkin disebabkan
oleh:
a.Kesalahan input data
b.Kesalahan pensampelan
c.Bukan anggota populasi
d.Kondisi yang sesungguhnya
5
Uji Data Outlier (lanjutan)
Deteksi data outlier (menyimpang) dilakukan
dengan tiga cara:
1)Standarisasi data
2)Membuat grafik data dalam bentuk Scatter Plot
3)Menyajikan data dalam bentuk Box Plot
Contoh:
Standarisasi data (Z-score)
6
1) Standarisasi data
oMasukkan data Y, X1, X2, X3 ke SPSS
oBuka menu:
oAnalize -> Descriptive Statistiks -> Descriptives
oSetelah muncul kotak dialog, pindahkan variabel
Y, X1, X2, X3 ke Kotak Variables.
oAktifkan pilihan Save standardize values at
variables dan abaikan yang lainnya
oKemudian klik OK
7
Untuk sampel kurang dari 80, data
outlier memiliki skor Z lebih besar dari
+2,5 atau lebih kecil dari -2,5. Untuk
sampel besar data outlier pada kisaran
+3 sampai +4 (Hair, et al. 2010).
8
Penanganan data outlier
Dihilangkan karena dianggap tidak
mencerminkan sebaran data sebenarnya
Atau tetap dipertahankan karena
mencerminkan kondisi sebaran data
sesungguhnya
Keputusan tergantung pengguna data
9
C. UJI ASUMSI KLASIK REGRESI
Tujuan:
Untuk memastikan bahwa statistik Regresi
dapat digunakan untuk menganalisis data,
maka perlu dilakukan uji:
Normalitas Data,
Multikolinearitas Data,
Homokedastisitas Data,
Autokorelasi Data
Linearitas Data,
10
1. UJI NORMALITAS DATA
Bertujuan untuk mengetahui apakah
data berdistribusi normal atau tidak.
11
Penyebab Munculnya Nilai Ekstrim
12
Uji Normalitas
Shapiro-Wilk
Kolmogorov-Smirnov
Lilliefors
Dst.
13
PENGUJIAN NORMALITAS DENGAN SPSS
Uji Normalitas Residul: Shapiro Wik
Hasilnya: Dalam data SPSS selain data X1, X2 dan Y ada tambahan data
Res-1
14
Contoh Data Residuals (RES-1)
Dan seterusnya
15
Pengujian Normalitas Dengan SPSS
Uji Shapiro Wik
• Analize Descriptive Statistics
Explore… Muncul kotak dialog:
masukkan Unstandardized Re… ke kotak
Dependent
• Pilih Statistics OutlierContinue
PlotsNormality Plots With Test
ContinueOk
16
Output Uji SHAPIRO WILK
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Unstandardized
Residual
.087 30 .200* .968 30 .485
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
19
PENYEBAB
• Karena sifat-sifat yang terkandung dalam
kebanyakan variabel ekonomi/pendidikan
yang berubah bersama-sama sepanjang
waktu.
• Besaran-besaran ekonomi/pendidikan
dipengaruhi oleh faktor-faktor yang sama.
20
Cara mendeteksi:
1. Dengan melihat koefesien korelasi antara variabel bebas:
Jika koefesien korelasi antara variabel bebas ≥ 0,7 maka
terjadi multikolinier.
2. Korelasi antara variabel bebas lebih tinggi dari korelasi
antara bebas dengan variabel terikat
2. Dengan melihat nilai VIF (Varian infloating Factor) dan
nilai toleransi. Jika nilai VIF ≤ 10 dan nilai toleransi > 0,10
maka tidak terjadi multikolinier (Hair, et al., 2010)
21
Contoh Uji-Multikolinieritas melalui SPSS
Langkah-langkah pengujian:
a. Dependent Variable: Y
24
3. UJI HOMOKEDASTISITAS DATA
PENGERTIAN
• Uji homokedastisitas data pada prinsipnya
menguji apakah suatu kelompok data
mempunyai variansi yang sama di antara
anggota kelompok tersebut
PENYEBAB
• Variabel yang digunakan untuk memprediksi
memiliki nilai yang sangat beragam, sehingga
menghasilkan nilai residu yang tidak homogen.
25
Uji Heteroskedastisitas
CARA MENDETEKSI:
1. Dengan Uji Park
Yaitu dengan meregresikan variabel bebas terhadap
nilai log-linier kuadrat.
2. Dengan Uji Glejser
Yaitu dengan meregresikan variabel bebas terhadap
nilai residual mutlaknya.
3. Dengan Uji Korelasi Rank Spearman
Mengkorelasikan nilai residual dengan variabel bebas
dengan menggunakan Rank-spearman.
4. Uji Levene.
26
Contoh Uji Glejser dengan SPSS.
Langkah-langkah:
Analize Regression Linear Muncul Kotak
Dialog
Masukkan Y ke dependent dan X1 dan X2 ke
independet
Pilih Save Muncul Kotak Dialog.
Pilih unstandardized pada bagian residual
kemudian pilih continue dan pada tampilan awal pilih
tombol Ok, akan menghasilkan variabel baru
bernama unstandardized residual (RES-1).
Selanjutnya pilih Transform Compute variable
muncul Kotak Dialog.
27
Langkah-langkah (lanjutan):
Pada kotak Target variable ketik abresid pada
kota Fungtion group pilih All dan di bawahnya
akan muncul beberapa pilihan fungsi. Pilih Abs
kemudian klik tanda panah arah ke atas. Masukkan
variabel unstandardized residual (RES-1) ke
dalam kotak Numeric Expression dan akhirnya
pilih Ok.
Selanjutnya pilih Analyze Regression
Linear, muncul kotak dialog.
Masukkan variabel abresid ke dependent, dan
variabel X1 dan X2 ke independents dan klik Ok
sehingga akan muncul hasil sebagai berikut:
28
Output SPSS Hasil Uji Glejser
Coefficientsa
Unstandardized Standardized Collinearity
Coefficients Coefficients Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 8.588 7.600 1.130 .268
X1 -.130 .109 -.288 -1.194 .243 .604 1.657
X2 .096 .094 .244 1.015 .319 .604 1.657
a. Dependent Variable: Abresid
30
4. UJI AUTOKORELASI DATA
o Uji autokorelasi bertujuan untuk
menentukan apakah dalam model
regresi ada korelasi antara kesalahan
pengganggu pada periode t dengan
kesalahan pengganggu pada pada
periode t-1 (sebelumnya).
o Model regresi yang baik adalah model
regresi yang bebas dari autokorelasi.
o Khusus untuk data Time Series (data
multi tahun) 31
Uji Autokorelasi
• Uji Durbin Watson
• Uji Lagrange Multiplier
• Uji Breusch-Godfrey
32
Uji Durbin Watson
b. Dependent Variable: Y
36
Y * X1
ANOVA Table
Sum of Mean
Squares df Square F Sig.
Y * X1 Between (Combined) 4545.833 21 216.468 3.380 .041
Groups
Linearity 2029.000 1 2029.000 31.682 .000
Deviation from 2516.833 20 125.842 1.965 .164
Linearity
Within Groups 512.333 8 64.042
Total 5058.167 29
39
TERIMA
KASIH
40