Analisis Multivariat
Analisis Multivariat
Analisis Multivariat
1. Analisis Multivariat
Sebagai dasar dari metode SEM, analisis multivariat perlu dipahami dengan
baik. Menurut Widarjono (2010:1) analisis multivariat merupakan salah satu
analisis statistik yang berkaitan dengan banyak variabel. Analisis statistik bisa
dikelompokkan berdasarkan jumlah variable, yaitu : univariate, bivariate dan
multivariate.
Kata univariate terbentuk dari kata uni (satu) dan variate (variable),
sehingga analisis univariat adalah analisis satu variabel. Contoh analisis univariat
adalah pengukuran rata-rata (mean), standar deviasi dan varian sebagai ukuran
pusat dari sekelompok data. Jadi analisis univariate lebih bersifat analisis tunggal
terhadap satu variabel. Menurut Supranto (2010:7) kalau nasabah suatu bank
ditanya tentang jumlah tabungannya, penghasilan per bulan, umur, tingkat
pendidikan dan jumlah anggota keluarga maka diperoleh lima variabel yang berdiri
sendiri dan tidak dikaitkan dengan variabel lain. Jadi analisis disebut univariat jika
setiap variabel berdiri sendiri tidak terkait dengan variabel lain. Analisis terhadap
variabel tunggal ini disebut univariate. Dengan demikian analisis univariat boleh
saja dikatakan sebagai analisis statistik deskriptif. Dalam statistika dikenal istilah
statistik deskriptif dan inferensial. Statistik deskriptif berfungsi mendeskripsikan
karakteristik dari sekelompok hasil data penelitian terhadap variabel tunggal.
Sedangkan statistik inferensial berusaha menyimpulkan fenomena atau hubungan-
hubungan antara lebih dari satu variabel pada sebuah persamaan statistik.
Kata bivariate berasal dari kata bi (dua) dan variate (variable), sehingga
analisis bivariate berkaitan dengan dua variabel. Misalnya analisis korelasi yang
mencari keeratan hubungan antara dua variable exogen dan endogen. Menurut
Sunyoto (2007:31) pengukuran korelasi bivariat dapat dibedakan menjadi
pengukuran secara linear (termasuk parsial) dan secara berganda (multiple). Yang
dimaksud dengan pengukuran korelasi linear adalah pengukuran atau perhitungan
korelasi yang hanya melibatkan satu variable bebas (independent atau X) dan satu
variable terikat (dependent atau Y). Sedangkan pengukuran korelasi berganda
adalah perhitungan korelasi dengan melibatkan lebih dari satu variabel independent
(bebas) dengan satu variabel dependent (terikat).
2. Regresi
3. Regresi Linear
Dalam makalah ini yang akan dibahas adalah regresi linear sederhana,
yang hanya menyangkut satu peubah bebas. Nyatakanlah sampel acak ukuran n
dengan himpunan {(𝑥𝑖, 𝑦𝑖); 𝑖 = 1, 2, . . , 𝑛}. Bila diambil sampel tambahan tepat
sama dengan nilai 𝑥 maka kita yakin harga 𝑦 akan berbeda-beda. Jadi harga 𝑦i
pada pasangan terurut (𝑥i,𝑦i) merupakan harga dari sebuah peubah acak Yi.
Untuk mudahnya akan ditulis YIx dan ini menyatakan peubaha acak Y yang
berkaitan dengan suatu nilai tetap x, dan nyatakan rataan dan variansinya
2
masing-masing dengan µYIX dan variansinya 𝜎𝑌𝐼𝑋 . Jelas, bahwa bila 𝑥 = 𝑥i
maka lambang YIxi menyatakan peubah acak Yi dengan rataan µYIX dan
2
variansinya 𝜎𝑌𝐼𝑋 .
µYIX = α + βx.
Koefisien regresi α dan β merupakan dua parameter yang ditaksir dari
data sampel. Bila taksiran kedua parameter itu masing-masing dinyatakan
dengan 𝑎 dan 𝑏 maka µYIX dapat ditaksir dengan ŷ dari bentuk garis regresi
berdasarkan sampel atau garis kecocokan regresi.
ŷ = 𝑎 + 𝑏x
Dalam hal regresi linear sederhana, yaitu hanya terdapat peubah bebas
𝑥 dan satu peubah acak terikat Y, datanya dapat disajikan sebagai pasangan
pengamatan{(𝑥𝑖, 𝑦𝑖); 𝑖 = 1, 2, . . , 𝑛}. Akan menolong bila digunakan gagasan
dari pasal sebelumnya untuk mendefinisikan setiap peubah acak 𝑌𝑖 = 𝑌I𝑥𝑖
dengan suatu model statistika. Bila dimisalkan bahwa semua rataan µ𝑌I𝑥𝑖 terletak
pada suatu garis lurus, maka setiap 𝑌𝑖 dapat ditulis sebagai model regresi linear
sederhana.
𝑌𝑖 = 𝑌I𝑥𝑖 + 𝐸𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝐸𝑖 ,
dengan galat acak 𝐸𝑖 , galat model, haruslah mempunyai rataan nol. Setiap
pengamatan (𝑥𝑖 , 𝑦 𝑖 ) dalam sampel memenuhi hubungan 𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
ŷ = 𝑎 + 𝑏x
𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 + 𝑒𝑖 ,
𝑒𝑖 = 𝑦𝑖 − ŷ disebut galat sisa dan memberikan galat dalam kecocokan
model pada titik data ke i.
𝜕(𝐽𝐾𝐺)
= −2 ∑𝑛𝑖=1( 𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )
𝜕𝑎
𝜕(𝐽𝐾𝐺)
= −2 ∑𝑛𝑖=1(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )𝑥𝑖
𝜕𝑏
𝑛 ∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 𝑦𝑖 −(∑𝑖=1 𝑥𝑖 )(∑𝑖=1 𝑦𝑖 )
𝑏= 2
𝑛 ∑𝑛 2 𝑛
𝑖=1 𝑥 −(∑𝑖=1 𝑥𝑖 )
∑𝑛 𝑛
𝑖=1 𝑦𝑖 −𝑏 ∑𝑖=1 𝑥𝑖
𝑎= 𝑛
Contoh soal
1. Tariklah garis regresi untuk data pencemaran pada tabel di bawah ini !
Tabel 1
Jawab :
∑33 33
𝑖=1 𝑥1 = 1.104, ∑𝑖=1 𝑦𝑖 = 1.124,
∑33 33 2
𝑖=1 𝑥𝑖 𝑦𝑖 = 41.355 , ∑𝑖=1 𝑥 = 41.086
𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − (∑𝑛𝑖=1 𝑥𝑖 )(∑𝑛𝑖=1 𝑦𝑖 )
𝑏= 2
𝑛 ∑𝑛𝑖=1 𝑥 2 − (∑𝑛𝑖=1 𝑥𝑖 )
(33)(41.355)−(1.104)(1.124)
𝑏= (33)(41.086)−(1.104)2
= 0,903643
∑𝑛𝑖=1 𝑦𝑖 − 𝑏 ∑𝑛𝑖=1 𝑥𝑖
𝑎=
𝑛
1.124 − (0,903643)(1.104)
𝑎= = 3,829633
33
a. Uji Serentak
Statistik uji yang dipakai untuk melakukan uji serentak ini adalah uji F.
Uji F dikenal juga dengan uji Anova (Analysis Of Varians) yaitu uji untuk
melihat bagaimanakah pengaruh semua variabel prediktornya secara
bersama-sama terhadap variabel terikatnya atau untuk menguji apakah
model regresi yang kita buat baik (signifikan) atau tidak baik (non
signifikan). Jika model signifikan maka model bisa digunakan untuk
peramalan, sebaliknya jika non signifikan maka model regresi tidak bisa
digunakan untuk peramalan. Uji serentak merupakan uji terhadap nilai-nilai
koefisien regresi secara bersama-sama dengan hipotesa.
1. H0 : 1 2 ... k 0
H1 : j 0, j = 1,2,…,k
4. Uji Statistik
ˆ 2 X X
2
𝑓ℎ𝑖𝑡𝑢𝑛𝑔 =
S e2
5. Kesimpulan
fhitung ≤ fα(v1,v2), H0 gagal tolak
fhitung > fα(v1,v2), Ho ditolak
Tabel Analisis Ragam Regresi Linear
Sumber
df SS MS F hitung
variansi
Yˆ Y 2
Yˆ Y 2
𝛽̂ 2 X X
2
𝛽̂ 2 X X
2
S e2
Galat n-2
Y Ŷ 2
S 2
Y Yˆ 2
n2
e
n
1 n
Total n-1 Yi
i 1
2
( Y ) 2
n i 1
Dimana:
Y Y = simpangan total
b. Uji Parsial
Statistik uji yang dipakai untuk melakukan uji parsial ini adalah statistik
uji T. Uji T digunakan untuk menguji bagaimana pengaruh masing-masing
variabel bebasnya secara sendiri-sendiri terhadap variabel terikatnya. Jika
hasil pada uji serentak menunjukkan bahwa H0 ditolak, maka perlu
dilakukan uji individu dengan hipotesa :
1. H0: β = 0
H1: β ≠ 0 atau H1: β < 0 atau H1: β >0
2. Tentukan taraf nyata
4. Uji statistik
(b 1 ) (a 0 )
thitung = thitung =
se / (X X ) 2
atau 1
se
x2
n ( xi x ) 2
dapat juga ditulis
(b 1 )
thitung = s / J
e xx
Dimana:
a = taksiran bagi β0
b = taksiran bagi β1
t = nilai sebaran t
5. Keputusan:
a. H0 ditolak jika thitung > tα/2(n-2) atau thitung < - tα/2(n-2)untuk lawan
alternatif H1:β≠ 0
b. H0 ditolak jika thitung < - tα(n-2) untuk lawan alternatif H1: β < 0
c. H0 ditolak jika thitung > tα(n-2) untuk lawan alternatif H1: β > 0
3. Selang Kepercayaan
se se
b t b t
2
( X X )2 2
2
(X X )
Dapat ditulis juga dengan
t s t s
b 2 b 2
J xx J xx
Dimana:
b = taksiran bagi β1
t = nilai sebaran t
1 x2 1 x2
a t a t se
n ( xi x ) n ( xi x )
2 e 2
S 2 2
n n
S xi S xi
2 2
t t
a a
2 i 1 2 i 1
nJ xx nJ xx
Dimana:
a = taksiran bagi
x = nilai rata-rata x
Contoh soal :
Jawab :
1. H0 : = 1,0
2. H1 : < 1,0
5. Hitungan
(b 1 ) (0,903643 1,0)
thitung = s / J = 3, 2295 / 4152,18 1,92
e xx
6. Keputusan : harga t berarti pada taraf 0,03, suatu petunjuk kuat bahwa
< 1,0. H0 ditolak
4. Regresi Logistik
Model persamaan aljabar layaknya OLS yang biasa kita gunakan adalah
berikut: Y = B0 + B1X + e. Dimana e adalah error varians atau residual. Dengan
model regresi ini, tidak menggunakan interpretasi yang sama seperti halnya
persamaan regresi OLS. Model Persamaan yang terbentuk berbeda dengan
persamaan OLS. Berikut persamaannya:
Di mana:
Misalnya nilai Exp (B) pengaruh rokok terhadap terhadap kanker paru
adalah sebesar 2,23, maka disimpulkan bahwa orang yang merokok lebih beresiko
untuk mengalami kanker paru dibadningkan dengan orang yang tidak merokok.
Interprestasi ini diartikan apabila pengkodean kategori pada tiap variabel sebagai
berikut:
1. Variabel bebas adalah Rokok: Kode 0 untuk tidak merokok, kode 1 untuk
merokok.
2. Variabel terikat adalah kanker Paru: Kode 0 untuk tidak mengalami kanker
paru, kode 1 untuk mengalami kanker paru.
d. Pseudo R Square
Perbedaan lainnya yaitu pada regresi ini tidak ada nilai “R Square” untuk
mengukur besarnya pengaruh simultan beberapa variabel bebas terhadap variabel
terikat. Dalam regresi logistik dikenal istilah Pseudo R Square, yaitu nilai R Square
Semu yang maksudnya sama atau identik dengan R Square pada OLS.