Uji Data (Sep 2023)

UJI DATA
UJI DATA
Tujuan:
Untuk memastikan bahwa statistik
parametrik dapat digunakan untuk
menganalisis data, meliputi:
1. Uji missing data (data tidak lengkap/hilang)
2. Uji data outlier (data ekstrim/)
3. Uji asumsi Regresi: normalitas, linearitas,
multikolinearitas, heterokedastisitas,
autokorelasi
2
A. MISSING DATA (Data hilang/kosong)
• Adanya data yang kosong pada
suatu obyek
• Terminologi SPSS: adanya sel-sel
yang kosong pada satu/beberapa
variabel
• Misalnya: penelitian tentang gaji,
beberapa responden tidak
menyebutkan jumlah gajinya.
3
Perlakukan terhadap Missing data
 Missing data ≤10% diabaikan (diisi dengan nilai
rata-rata)
 Missing data sekitar 15%, membuang baris data
yang kosong
 Missing data sekitar 20%-30%, mengumpulkan
data ulang
 Missing data lebih dari 30%
membuang/mengganti variabel (Hair, et al.,
2010)
4
B. UJI DATA OUTLIER
(data ekstrim/menyimpang)
Data yang secara nyata berbeda dengan
data-data yang lain. Mungkin disebabkan
oleh:
a.Kesalahan input data
b.Kesalahan pensampelan
c.Bukan anggota populasi
d.Kondisi yang sesungguhnya
5
Uji Data Outlier (lanjutan)
Deteksi data outlier (menyimpang) dilakukan
dengan tiga cara:
1)Standarisasi data
2)Membuat grafik data dalam bentuk Scatter Plot
3)Menyajikan data dalam bentuk Box Plot
Contoh:
Standarisasi data (Z-score)
6
1) Standarisasi data
oMasukkan data Y, X1, X2, X3 ke SPSS
oBuka menu:
oAnalize -> Descriptive Statistiks -> Descriptives
oSetelah muncul kotak dialog, pindahkan variabel
Y, X1, X2, X3 ke Kotak Variables.
oAktifkan pilihan Save standardize values at
variables dan abaikan yang lainnya
oKemudian klik OK
7
Untuk sampel kurang dari 80, data
outlier memiliki skor Z lebih besar dari
+2,5 atau lebih kecil dari -2,5. Untuk
sampel besar data outlier pada kisaran
+3 sampai +4 (Hair, et al. 2010).
Data Outlier Data Outlier

Data Normal
-2,5 2,5
8
Penanganan data outlier
Dihilangkan karena dianggap tidak
mencerminkan sebaran data sebenarnya
Atau tetap dipertahankan karena
mencerminkan kondisi sebaran data
sesungguhnya
Keputusan tergantung pengguna data
9
C. UJI ASUMSI KLASIK REGRESI
Tujuan:
Untuk memastikan bahwa statistik Regresi
dapat digunakan untuk menganalisis data,
maka perlu dilakukan uji:
Normalitas Data,
Multikolinearitas Data,
Homokedastisitas Data,
Autokorelasi Data
Linearitas Data,
10
1. UJI NORMALITAS DATA
Bertujuan untuk mengetahui apakah
data berdistribusi normal atau tidak.
Penyebab Tidak Normal

Terdapat data ektrim/pencilan/outlier
(terlalu tinggi atau terlalu rendah)
11
Penyebab Munculnya Nilai Ekstrim
1. Kesalahan dalam pengambilan unit sampel.

Cara mengatasi: Mengganti unit sampel tersebut.
2. Kesalahan dalam menginput data.
Cara mengatasi: Memperbaiki input data yang
salah.
3. Data memang aneh dibanding data lainnya.
Cara mengatasi: Tambah ukuran sampel atau
dengan membuang data yang aneh tersebut.
12
Uji Normalitas
 Shapiro-Wilk
 Kolmogorov-Smirnov
 Lilliefors
 Dst.
13
PENGUJIAN NORMALITAS DENGAN SPSS
Uji Normalitas Residul: Shapiro Wik
Residual data ditentukan dengan cara:

• Masukkan data X1, X2 dan Y ke SPSS
• Analyze  Regression Masukkan Y ke dependent
dan masukkan X1 dan X2 ke independents  Save
Unstandardized ContinueOk
Hasilnya: Dalam data SPSS selain data X1, X2 dan Y ada tambahan data
Res-1
14
Contoh Data Residuals (RES-1)
Dan seterusnya
15
Pengujian Normalitas Dengan SPSS
Uji Shapiro Wik
• Analize Descriptive Statistics
Explore… Muncul kotak dialog:
masukkan Unstandardized Re… ke kotak
Dependent
• Pilih Statistics  OutlierContinue
PlotsNormality Plots With Test
ContinueOk
16
Output Uji SHAPIRO WILK
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Unstandardized
Residual
.087 30 .200* .968 30 .485
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
Lihat Uji Shapiro Wilk:

•Karena Nilai Sig. > 0,05 maka tidak signifikan.
•Yang berarti data berdistribusi normal.
17
Cara Mengatasi Data yang Tidak
Normal
• Menambah jumlah data.

• Menghilangkan data yang
dianggap sebagai penyebab
data tidak normal.
• Dibiarkan saja tetapi dengan
pilihan analisis yang cocok
18
2. UJI MULTIKOLINIERITAS DATA
PENGERTIAN
• Multikolinieritas berarti terjadi korelasi
yang kuat antara variabel bebas.
• Multikolinieritas berkenaan dengan
terdapatnya lebih dari satu hubungan
linear, dan istilah kolinieritas berkenaan
dengan terdapatnya satu hubungan linier.
19
PENYEBAB
• Karena sifat-sifat yang terkandung dalam
kebanyakan variabel ekonomi/pendidikan
yang berubah bersama-sama sepanjang
waktu.
• Besaran-besaran ekonomi/pendidikan
dipengaruhi oleh faktor-faktor yang sama.
20
Cara mendeteksi:
1. Dengan melihat koefesien korelasi antara variabel bebas:
Jika koefesien korelasi antara variabel bebas ≥ 0,7 maka
terjadi multikolinier.
2. Korelasi antara variabel bebas lebih tinggi dari korelasi
antara bebas dengan variabel terikat
2. Dengan melihat nilai VIF (Varian infloating Factor) dan
nilai toleransi. Jika nilai VIF ≤ 10 dan nilai toleransi > 0,10
maka tidak terjadi multikolinier (Hair, et al., 2010)
21
Contoh Uji-Multikolinieritas melalui SPSS
Langkah-langkah pengujian:
Dari data Y dan X1, X2, X3, pilih:
Analyze  Regression  linear 

statistics  Collinearity diagnostic 
continue dan pada tampilan awal pilih OK.
Akan muncul output SPSS sebagai berikut:

22
Output uji multicolinearitas:
Coefficientsa
Unstandardized Standardized
Collinearity
Coefficients Coefficients Statistics
Model B Std. Error Beta t Sig. Tolerance VIF

1 (Constant) 24.423 13.852 1.763 .089
X1 .463 .198 .422 2.339 .027 .604 1.657
X2 .319 .172 .336 1.859 .074 .604 1.657
a. Dependent Variable: Y
Terlihat bahwa hasil perhitungan menunjukan tidak ada

variabel bebas yang memiliki nilai Tolerance lebih kecil dari
0,10 demikian pula nilai VIF semua variabel bebas lebih kecil
dari 10. Dengan demikian maka tidak ada multikolonieritas
antara variabel bebas dalam model regresi. 23
Cara Mengatasi Multikolinier
• Memperbesar ukuran sampel
• Mengeluarkan salah satu variabel
bebas yang borkeralasi tinggi
• Memilih metode statistik yang tidak
mempersoalkan multikolinearitas
(Hair, et al., 2010)
24
3. UJI HOMOKEDASTISITAS DATA
PENGERTIAN
• Uji homokedastisitas data pada prinsipnya
menguji apakah suatu kelompok data
mempunyai variansi yang sama di antara
anggota kelompok tersebut
PENYEBAB
• Variabel yang digunakan untuk memprediksi
memiliki nilai yang sangat beragam, sehingga
menghasilkan nilai residu yang tidak homogen.
25
Uji Heteroskedastisitas
CARA MENDETEKSI:
1. Dengan Uji Park
Yaitu dengan meregresikan variabel bebas terhadap
nilai log-linier kuadrat.
2. Dengan Uji Glejser
Yaitu dengan meregresikan variabel bebas terhadap
nilai residual mutlaknya.
3. Dengan Uji Korelasi Rank Spearman
Mengkorelasikan nilai residual dengan variabel bebas
dengan menggunakan Rank-spearman.
4. Uji Levene.
26
Contoh Uji Glejser dengan SPSS.
Langkah-langkah:
Analize  Regression  Linear  Muncul Kotak
Dialog
Masukkan Y ke dependent dan X1 dan X2 ke
independet
Pilih Save  Muncul Kotak Dialog.
Pilih unstandardized pada bagian residual
kemudian pilih continue dan pada tampilan awal pilih
tombol Ok, akan menghasilkan variabel baru
bernama unstandardized residual (RES-1).
Selanjutnya pilih Transform  Compute variable
muncul Kotak Dialog.
27
Langkah-langkah (lanjutan):
Pada kotak Target variable ketik abresid pada
kota Fungtion group pilih All dan di bawahnya
akan muncul beberapa pilihan fungsi. Pilih Abs
kemudian klik tanda panah arah ke atas. Masukkan
variabel unstandardized residual (RES-1) ke
dalam kotak Numeric Expression dan akhirnya
pilih Ok.
Selanjutnya pilih Analyze  Regression 
Linear, muncul kotak dialog.
Masukkan variabel abresid ke dependent, dan
variabel X1 dan X2 ke independents dan klik Ok
sehingga akan muncul hasil sebagai berikut:
28
Output SPSS Hasil Uji Glejser
Coefficientsa
Unstandardized Standardized Collinearity
Coefficients Coefficients Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 8.588 7.600 1.130 .268
X1 -.130 .109 -.288 -1.194 .243 .604 1.657
X2 .096 .094 .244 1.015 .319 .604 1.657
a. Dependent Variable: Abresid
Nilai-nilai t-statistik dari variabel bebas tidak

signifikan secara statistik (p>0,05), sehingga dapat
disimpulkan bahwa model regresi Y atas X1 dan X2
tidak mengalami masalah heteroskedastisitas.
29
Cara Mengatasi Heteroskedastisitas
• Tambah jumlah data (pengamatan).
• Tranformasikan data (LN, AKAR
KUADRAT, SIN, COS, Log10) kemudian
proses pengujian dilakukan sekali lagi.
• Atau pilih uji statistik yang sesuai untuk
data yang heterokedastis.
30
4. UJI AUTOKORELASI DATA
o Uji autokorelasi bertujuan untuk
menentukan apakah dalam model
regresi ada korelasi antara kesalahan
pengganggu pada periode t dengan
kesalahan pengganggu pada pada
periode t-1 (sebelumnya).
o Model regresi yang baik adalah model
regresi yang bebas dari autokorelasi.
o Khusus untuk data Time Series (data
multi tahun) 31
Uji Autokorelasi
• Uji Durbin Watson
• Uji Lagrange Multiplier
• Uji Breusch-Godfrey
Dalam penulisan ini akan digunakan uji Durbin

Watson
32
Uji Durbin Watson
oAutokorelasi tidak terjadi apabila

nilai Durbin-Watson = 2.
oTerjadi autokorelasi positif jika
nilai Durbin-Watson mendekati 0.
oSebaliknya terjadi autokorelasi
negatif jika nilai Durbin-Watson
mendekati 4.
33
Contoh Kasus Uji Autokorelasi Durbin Watson
Langkah-langkah pengujian:
Dari data Y dan X1 dan X2 pilih:
 Analyze  Regression  linear

setelah itu pilih statistics, muncul
kotak dialog.
 Aktifkan pilihan Durbin Watson
 Selanjutnya pilih continue, sehingga
muncul hasil analisis Durbin Watson
sebagai berikut:
34
Output SPSS Hasil Uji Durbin-Watson
Model Summaryb
Adjusted R Std. Error of the Durbin-
Model R R Square Square Estimate Watson
1 .685a .469 .430 9.97307 1.946
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Hasil perhitungan menunjukkan bahwa koefisien

Durbin-Watson adalah 1,946 yang dapat
dibulatkan menjadi 2. Dengan demikian maka
dalam regresi variabel Y dengan X1 dan X2 tidak
terdapat gejala autokorelasi.
35
5. UJI LINIERITAS DATA
• Uji ini dilakukan untuk mengetahui model yang digunakan
apakah menggunakan model linier atau tidak.
• Cara mendeteksi dengan menggunakan SPSS: (Contoh data
X1, X2, Y)
Langkah-langkah:
 Analize  Compere means  Means
 Setelah muncul kotak dialog pindahkan Y ke dependent list
dan X1 dan X2 ke independent list selanjutnya klik Options dan
pilih Test for Linearity lalu Ok.
 Contoh hasil perhitungan linearitas data sebagai berikut:
36
Y * X1
ANOVA Table
Sum of Mean
Squares df Square F Sig.
Y * X1 Between (Combined) 4545.833 21 216.468 3.380 .041
Groups
Linearity 2029.000 1 2029.000 31.682 .000
Deviation from 2516.833 20 125.842 1.965 .164
Linearity
Within Groups 512.333 8 64.042
Total 5058.167 29
Hasil uji linearitas data menunjukkan bahwa deviation

from linearity variabel Y*X1 adalah p = 0,164 > 0,05. Hal
ini menunjukkan bahwa pasangan data yang dianalisis
memiliki hubungan yang linear.
37
Y * X2
ANOVA Table
Sum of Mean
Squares df Square F Sig.
Y * X2 Between (Combined) 3650.467 22 165.930 .825 .662
Groups Linearity 1828.724 1 1828.724 9.094 .020
Deviation .
from Linearity 1821.742 21 86.750 431 .936
Within Groups 1407.700 7 201.100
Total 5058.167 29
Hasil uji linearitas data menunjukkan bahwa

deviation from linearity variabel Y*X2 adalah p =
0,936 > 0,05. Hal ini menunjukkan bahwa
pasangan data yang dianalisis memiliki
hubungan yang bersifat linear.
38
Bagaimana jika data tidak Linier?
• Jika data tidak linear, gunakan regresi
non linear, misal: Curvilinear:
quadratik dan/atau cubic polynomials.
39
TERIMA
KASIH
40

Uji Data (Sep 2023)

Diunggah oleh

Hak Cipta:

Format Tersedia

Uji Data (Sep 2023)

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Uji Data (Sep 2023)

Diunggah oleh

Hak Cipta:

Format Tersedia

UJI DATA

Data Outlier Data Outlier

Penyebab Tidak Normal

1. Kesalahan dalam pengambilan unit sampel.

Residual data ditentukan dengan cara:

Lihat Uji Shapiro Wilk:

• Menambah jumlah data.

Dari data Y dan X1, X2, X3, pilih:

Analyze  Regression  linear 

Akan muncul output SPSS sebagai berikut:

Model B Std. Error Beta t Sig. Tolerance VIF

X1 .463 .198 .422 2.339 .027 .604 1.657

X2 .319 .172 .336 1.859 .074 .604 1.657

Terlihat bahwa hasil perhitungan menunjukan tidak ada

Nilai-nilai t-statistik dari variabel bebas tidak

Dalam penulisan ini akan digunakan uji Durbin

oAutokorelasi tidak terjadi apabila

 Analyze  Regression  linear

Hasil perhitungan menunjukkan bahwa koefisien

Hasil uji linearitas data menunjukkan bahwa deviation

Hasil uji linearitas data menunjukkan bahwa

Anda mungkin juga menyukai