Case Studies “Analisis Permasalahan
Regresi Linier Berganda “
ketika bensin dipompa kedalam tanki mobil, asap
mobil akan keluar ke atmosfer. Sebuah eksperimen dujicobakan untuk membuktikan
apakah variabel Y (jumlah asap mobil) dapat diprediksi dengan menggunakan 4
variabel yang didasarkan pada kondisi awal tanki dan tekanan bensin :
X1 : suhu tanki (oF)
X2 : suhu bensin (oF)
X3 : tekanan asap pada tanki (psi)
X4 : tekanan asap pada bensin (psi)
Model
postulat yang akan dibahas berikut adalah regresi linier berganda:
Tabel
1.1 data sebuah penelitian
No
|
Y
|
X1
|
X2
|
X3
|
X4
|
1
|
29
|
33
|
53
|
3.32
|
3.42
|
2
|
24
|
31
|
36
|
3.1
|
3.26
|
3
|
26
|
33
|
51
|
3.18
|
3.18
|
4
|
22
|
37
|
51
|
3.39
|
3.08
|
5
|
27
|
36
|
54
|
3.2
|
3.41
|
6
|
21
|
35
|
35
|
3.03
|
3.03
|
7
|
33
|
59
|
56
|
4.78
|
4.57
|
8
|
34
|
60
|
60
|
4.72
|
4.72
|
9
|
32
|
59
|
60
|
4.6
|
4.41
|
10
|
34
|
60
|
60
|
4.53
|
4.53
|
11
|
20
|
34
|
35
|
2.9
|
2.95
|
12
|
36
|
60
|
59
|
4.4
|
4.36
|
13
|
34
|
60
|
62
|
4.31
|
4.42
|
14
|
23
|
60
|
36
|
4.27
|
3.94
|
15
|
24
|
62
|
38
|
4.41
|
3.49
|
16
|
32
|
62
|
61
|
4.39
|
4.39
|
17
|
40
|
90
|
64
|
7.32
|
6.7
|
18
|
46
|
90
|
60
|
7.32
|
7.2
|
19
|
55
|
92
|
92
|
7.45
|
7.45
|
20
|
52
|
91
|
92
|
7.27
|
7.26
|
21
|
29
|
61
|
62
|
3.91
|
4.08
|
22
|
22
|
59
|
42
|
3.75
|
3.45
|
23
|
31
|
88
|
65
|
6.48
|
5.8
|
24
|
45
|
91
|
89
|
6.7
|
6.6
|
25
|
37
|
63
|
62
|
4.3
|
4.3
|
26
|
37
|
60
|
61
|
4.02
|
4.1
|
27
|
33
|
60
|
62
|
4.02
|
3.89
|
28
|
27
|
59
|
62
|
3.98
|
4.02
|
29
|
34
|
59
|
62
|
4.39
|
4.53
|
30
|
19
|
37
|
35
|
2.75
|
2.64
|
31
|
16
|
35
|
35
|
2.59
|
2.59
|
32
|
22
|
37
|
37
|
2.73
|
2.59
|
Source
: Weisberg (1985) p. 138 and rencher (2000) p 167- modified
ANALISA DATA
The
Postulated Model For The Problema
Dari
soal tersebut dipakai 4 variabel bebas dan 1 variabel tak bebas, sehingga
dipakai analisis regresi berganda. Berdasarkan analisis data statistic dengan
menggunakan minitab 14 didapatkan data
Predictor
Coef SE Coef T
P VIF
Constant
1.015 1.861 0.55
0.590
x1
-0.02861 0.09060 -0.32
0.755 13.0
x2
0.21582 0.06772 3.19
0.004 4.7
x3
-4.320 2.851 -1.52
0.141 71.3
x4
8.975 2.773 3.24
0.003 61.9
S = 2.73000
R-Sq = 92.6% R-Sq(adj) = 91.5%
Analysis of Variance
Source
DF SS MS
F P
Regression 4
2520.27 630.07 84.54
0.000
Residual Error
27 201.23 7.45
Total
31 2721.50
Bentuk
hubungan regresi linier berganda antara variabel Y dan X1, X2, X3,
X4 adalah :


Nilai beta dan S2
Nilai taksiran untuk beta adalah
:
Taksiran
Beta
|
Nilai
|
b0
|
1,015
|
b1
|
–
0,0286
|
b2
|
0,216
|
b3
|
–
4,32
|
b4
|
8,975
|
Nilai taksiran untuk variansi (s2)
akan sama dengan ni;ai mean square error (MSe) yaitu sebesar 7,45
Nilai
R2 dan Ra2
Dengan menggunakan minitab 14
didapatkan juga nilai R2 sebesar 92,6%. Nilai tersebut menunjukkan bahwa variansi
banyaknya uap dapat dijelaskan oleh kempat variable bebas sebesar 92,6%. Selain nilai R2 juga didapatkan
nilai Ra2 (R-square adjusted) sebesar 91,5%.
Overall
regression test
Untuk menguji signifikansi model,
maka dilakukan uji serentak terlebih dahulu untuk : mengetahui apakah secara keseluruhan
parameter regresi signifikan. Dengan hipotesis sebagai berikut :
Analysis of Variance
Source
DF SS MS
F P
Regression 4
2520.27 630.07 84.54
0.000
Residual Error
27 201.23 7.45
Total
31 2721.50
Source
DF Seq SS
x1
1 1857.11
x2
1 494.43
x3
1 90.63
x4
1 78.09
Untuk program pelatihan (treatment)
Ho : µ1 = µ2 = µ3
H1 : Paling sedikit ada satu µi
≠ µj untuk i ≠ j
Statistik uji
Tolak
Ho jika Fhitung >F4;27;0,05 atau P-Value < α
Dari uji overall dengan
menggunakan softwere minitab 14 didapatkan nilai P-value = 0.000 atau nilai α < 5%, hal ini
berarti tolak Ho artinya model regresi berganda yang diperoleh signifikan.
Sehingga bisa dilakukan pengujian secara individu. Dari hal ini dapat
disimpulkan bahwa variabel temperature tangki, temperature bensin, tekanan
tangki dan tekanan bensin secara simultan berpengaruh terhadap besarnya uap. Pada
tabel anova dibawah ini bahwa p-value untuk X1 dan X3 nilai
α > 5% sehingga parameternya tidak signifikan sedangkan untuk parameter X2
dan X4 nilai p-value < 5% sehingga parameternya signifikan. Nilai
R2 yang besar yaitu 92.6% akan tetapi banyak parameter regresinya
tidak signifikan merupakan gejala adanya kasus multkolinieritas yaitu adanya
hubungan antara variabel independen.
Pengujian
Individu (
=0 untuk j = 1,2,3,4)

Predictor
Coef SE Coef T
P VIF
Constant
1.015 1.861 0.55
0.590
x1
-0.02861 0.09060 -0.32
0.755 13.0
x2
0.21582 0.06772 3.19
0.004 4.7
x3
-4.320 2.851 -1.52
0.141 71.3
x4
8.975 2.773 3.24
0.003 61.9
S = 2.73000
R-Sq = 92.6% R-Sq(adj) = 91.5%
a. Pengujian untuk 

Adapun
langkah-langkah untuk menguji
adalah sebagai berikut :

H0 :
= 0

H1 :
≠ 0


Tolak H0
jika Thitung > T(27, 0,05) atau nilai p-value < 

Data diatas
menunjukkan bahwa nilai p-value untuk b1 adalah sebesar 0,755. Karena niali p-value >
maka diputuskan gagal
tolak H0 dan disimpulkan bahwa variable temperature tangki tidak
memiliki pengaruh yang signifikan terhadap banyaknya uap.

b. Pengujian untuk 

Adapun
langkah-langkah untuk menguji
adalah sebagai berikut :

H0 :
= 0

H1 :
≠ 0


Tolak H0
jika Thitung > T(27, 0,05) atau nilai p-value < 

Table 3 menunjukkan
bahwa nilai p-value untuk b2 adalah sebesar 0,004. Karena niali p-value <
maka diputuskan tolak
H0 dan disimpulkan bahwa variable temperature bensin memiliki
pengaruh yang signifikan terhadap banyaknya uap.

c. Pengujian untuk 

Adapun
langkah-langkah untuk menguji
adalah sebagai berikut :

H0 :
= 0

H1 :
≠ 0


Tolak H0
jika Thitung > T(27, 0,05) atau nilai p-value < 

Data diatas
menunjukkan bahwa nilai p-value untuk b3 adalah sebesar 0,141. Karena niali p-value >
maka diputuskan gagal
tolak H0 dan disimpulkan bahwa variable tekanan uap di tangki tidak
memiliki pengaruh yang signifikan terhadap banyaknya uap.

d. Pengujian untuk 

Adapun
langkah-langkah untuk menguji
adalah sebagai berikut :

H0 :
= 0

H1 :
≠ 0


Tolak H0
jika Thitung > T(27, 0,05) atau nilai p-value < 

Data diatas menunjukkan bahwa nilai p-value untuk b4
adalah sebesar 0,003. Karena niali
p-value <
maka diputuskan tolak
H0 dan disimpulkan bahwa variable tekanan uap bensin memiliki
pengaruh yang signifikan terhadap banyaknya uap.

The classic assumption for the
residual
Sebelumnya akan dianalisis
asumsi-asumsi residual aar model regresi berganda yang telah didapatkan, bisa
digunakan. Asumsi- asumsi tersebut antara lain :
1. Asumsi Distribusi Normal
Asumsi ini dilakukan
dengan melakukan uji normalitas data menggunakan Anderson Darling. Hipotesisnya
adalah
Ho = Residual berdistribusi normal
H1 = Residual tidak berdistribusi normal
Dengan menggunakan
, maka kesimpulan yang diperoleh adalah gagal tolak Ho,
karena p value (0.532) >
atau bisa dikatakan bahwa residual berdistribusi normal.



Gambar
1.1
2.
Asumsi tidak terjadi heteroskedastisitas (independent)
Asumsi berikutnya adalah pengujian asumsi heteroskedastisitas. Secara
visual, asumsi heteroskedastisitas ini bisa dilihat dari plot antara
dengan residualnya. Jika
scatter plot membentuk pola tertentu maka kemungkinan terjadi
heteroskedastisitas.


Gambar 1.2
Plot antara
residual dan
, secara visualisasi tidak terjadi heteroskedastsitas karena
plot datanya menyebar secara acak (tidak membentuk sebuah model tertentu).

Pengujian
terjadinya Heteroskedastisitas bisa dilakukan dengan menggunakan uji gletser
yaitu dengan meregresikan variabel independen dengan nilai mutlak residualnya.
Jika parameter-parameternya signifkan maka bisa disimpulkan terjadi
heteroskedastisitas
The
regression equation is
mutlak
= 1.19 + 0.130 x1 + 0.0385 x2 + 0.27 x3 - 2.35 x4
Predictor Coef
SE Coef T P
VIF
Constant 1.1873
0.9815 1.21 0.237
x1 0.12992 0.04777
2.72 0.011 13.0
x2 0.03854 0.03571
1.08 0.290 4.7
x3 0.273 1.503
0.18 0.857 71.3
x4 -2.353 1.462
-1.61 0.119 61.9
S
= 1.43953 R-Sq = 34.8% R-Sq(adj) = 25.2%
Dari
uji glejser dinyatakan bahwa R square model antara nilai residual mutlak dan
variabel independennya bernilai kecil dan sebagian besar parameternya tidak€
signifikan. Sehingga bisa disimpulkan tidak terjadi heteroskedastisitas.
3. Asumsi Autokorelasi
Asumsi
ini bisa di uji dengan menggunakan Durbin Watson.
Hipotesis :
H0 : Tidak terjadi autokorelasi
H1 : Terjadi autokorelasi
Prosedur pengujian untuk uji durbin Watson adalah :
Ø Uji satu arah lawan alternative
> 0. jika d <
dl simpulkan bahwa d nyata dan tolak Ho pada taraf
alpha.

Jika d > du simpulkan d tidak nyata, jangan tolak Ho
Jika dl
d
du, maka uji ini dikatakan tidak konklusif


Ø Uji satu arah lawan alternative
< 0,
ulangi prosedur pertama namun dengan mengganti d dengan 4-d

Uji dua arah lawan
alternatifnya p tidak sama dengan 0,
jika d < dl atau 4-d < dl,
Nilai
durbin Watson yang diperoleh dari Minitab.
Durbin-Watson
statistic = 1.73246
Karena
kesluruhan asumsi residual telah terpenuhi, maka model regresi yang didapatkan
bisa digunakan untuk pemodelan.
Seperti yang telah dijelaskan di awal
bahwa dalam regresi berganda ini ada kemungkinan terjadi multikolinieritas. Hal
ini bisa di deteksi dari adanya nilai R square yang tinggi (92.6%) namun
parameter regresinya tidak signifikan. Oleh karena itu, akan diterapkan
principal component analysis untuk mengatasi permasalahan tersebut.
4. Multikolinearitas
Multikolinearitas
adalah kasus dimana terdapat korelasi antar variable bebas. Multikolinearitas dapat dideteksi melalui
nilai VIF yang lebih besar dari 10.
Variabel
|
VIF
|
X1
|
12,997
|
X2
|
4,721
|
X3
|
71,301
|
X4
|
61,993
|
Tabel diatas
menunjukkan bahwa terdapat beberapa nilai VIF yang lebih dari 10, maka dapat
disimpulkan terjadi indikasi terjadinya kasus multikolinearitas. Selain dari nilai VIF juga dapat dilihat dari
R2 yang didapatkan sangat tinggi yaitu sebesar 92,6%. Namun dapat diketahui berdasarkan uji
individual bahwa dua variable dari empat variable bebas yang digunakan tidak
memiliki pengaruh yang signifikan terhadap varibel tak bebas. Kasus multikolinearitas bias berakibat
membalik tanda koefisien regresi, sehingga terkadang dihasilkan interpretasi
yang tidak sesuai dengan logika atau disiplin ilmu yang bersangkutan. Kasus multikolinearitas dapat ditanggulangi
dengan menggunakan Principal Component
Regression (PCR).
Deteksi
terjadinya outlier
Unusual
Observations
Obs x1
y Fit SE Fit
Residual St Resid
15
62.0 24.000 19.713
1.765 4.287 2.06R
18
90.0 46.000 44.386
1.917 1.614 0.83 X
23
88.0 31.000 36.586
1.302 -5.586 -2.33R
R
denotes an observation with a large standardized residual.
X
denotes an observation whose X value gives it large influence.
Deteksi
terjadinya outlier ada pada pengamatan yang ke 15, 18, dan 23. Untuk mengecek
apakah data outlier ini merupakan influential observation ataukah tidak maka
akan dilakukan regresi berganda kembali dengan 3 data pengamatan diatas
dibuang.
Hasilnya adalah
sebagai berikut :
y
= 0.09 - 0.0266 x1 + 0.245 x2 - 4.28 x3 + 8.73 x4
Predictor Coef
SE Coef T P
VIF
Constant 0.086
1.714 0.05 0.960
x1 -0.02660 0.08231
-0.32 0.749 10.7
x2 0.24540 0.07883
3.11 0.005 7.4
x3 -4.281 3.506
-1.22 0.234 104.3
x4 8.733 3.821
2.29 0.031 115.8
S
= 2.47256 R-Sq = 94.0% R-Sq(adj) = 93.0%
Analysis
of Variance
Source DF SS
MS F P
Regression 4
2300.72 575.18 94.08
0.000
Residual
Error 24 146.73
6.11
Total 28
2447.45
Source DF
Seq SS
x1 1
1836.07
x2 1
382.61
x3 1
50.12
x4 1
31.93
Pada
percobaan ini terdapat beberapa pengamatan yang berpotensi menjadi outlier
yaitu pengamatan 12, 23 dan 25. Nilai R2 sebelum 3 pengamatan
dibuang sebesar 92.6%, sedangkan setelah 3 pengamatan dibuang adalah sebesar
94%. Dapat diamati jika pengamatan tersebut dihilangkan, hasil regresi yang
didapatkan tidak jauh berbeda sehingga outlier tersebut tidak mempengaruhi
model. Sehingga pengamatan-pengamtan
tersebut bisa dibuang atau dipakai sebagai model.
Pemilihan Model Terbaik
Berdasarkan
analisis regresi diketahui bahwa terjadi kasus multikolinearitas, sehingga
langkah untuk mendapatkan model terbaik adalah dengan menanggulangi kasus
tersebut dengan menggunakan Principal
Component Regression (PCR). Hal
pertama yang dilakuka adalah mendapatkan komponen utama. Berdasarkan analisis dengan menggunakan
Minitab didapatkan :
Principal
Component Analysis: x1, x2, x3, x4
Eigenanalysis
of the Correlation Matrix
Eigenvalue 3.6398
0.2839 0.0687 0.0075
Proportion 0.910
0.071 0.017 0.002
Cumulative 0.910
0.981 0.998 1.000
Variable PC1
PC2 PC3 PC4
x1 -0.505
0.334 0.779 0.167
x2 -0.464
-0.873 0.099 -0.118
x3 -0.513
0.334 -0.320 -0.723
x4 -0.517
0.126 -0.531 0.660
data
diatas menunjukkan bahwa komponen utama pertama sudah bisa mewakili varians
sebesar 91 %. Sehingga dalam melakukan
regresi komponen utama cukup digunakan satu komponen saja.
Regression
Analysis: y versus w1
The
regression equation is
y
= 31.1 - 4.53 w1
Predictor Coef
SE Coef T P
Constant 31.1250
0.6477 48.05 0.000
w1 -4.5332 0.3449
-13.14 0.000
S
= 3.66394 R-Sq = 85.2% R-Sq(adj) = 84.7%
Analysis
of Variance
Source DF SS
MS F P
Regression 1
2318.8 2318.8 172.73
0.000
Residual
Error 30 402.7
13.4
Total 31
2721.5
Model
persamaan yang didapatkan adalah :
Y
= 31,125 – 4,533 w1
Untuk
mendapatkan model terbaik maka terlebih dahulu harus dilakukan pengujian
terhadap asumsi klasik sebagai berikut :
Autokorelasi :
H0 :
Tidak terjadi autokorelasi
H1 :
Terjadi autokorelasi

Tolak
H0 jika dh > 2 atau dh < -2
Berdasarkan
analisis regresi didapatkan nilai dh = 1,314. Karena -2 < dh <2 maka dapat
diputuskan terima H0 dan disimpulkan bahwa tidak terjadi
autokorelasi.
Heterocedastisitas :
Plot
antara nilai prediksi yang sudah distandarkan dengan nilai residual yang sudah
distandarkan adalah sebagai berikut :

Gambar 1.3 Plot Nilai Prediksi yang Sudah
Distandarkan vs Residual yang Distandarkan
Gambar
diatas menunjukkan bahwa pola yang didapatkan menyebar atau tidak membentuk
pola sehingga dapat dikatakan bahwa tidak terjadi heterocedastisitas atau
dengan kata lain varians residual homogen.
Selain menggunakan deteksi melalui plot maka dapat juga dilakukan
pengujian dengan menggunakan uji gleiser.
Langkah-langkah yang dapat ditempuh adalah sebagai berikut :
a.
Meregresikan
absolute residual dengan variable bebas.
b.
Melakukan
pengujian jika dari hasil regresi didapatkan bahwa variable bebas signifikan
maka terjadi kasus heterocedastisitas.
c.
Berdasarkan
hasil analisis didapatkan :
Sumber
variansi
|
Jumlah
Kuadrat
|
db
|
Rata-rata
Kuadrat
|
F
|
p-value
|
Regresi
|
8,66
|
1
|
8,66
|
1,93
|
0,175
|
Residual
|
134,55
|
30
|
4,49
|
||
Total
|
143,21
|
31
|
Dari
hasil di atas dapat diketahui bahwa regresi tidak signifikan sehingga variable
juga tidak signifikan maka dapat disimpulkan bahwa tidak terjadi kasus
heterocedastisitas.
Uji Normal :
Uji
yang dapat digunakan adalah Kolmogorov-Smirnov. Langkah-langkah pengujian distribusi normal
adalah sebagai berikut :
H0 :
Residual berdistribusi normal
H1 :
Residual tidak berdistribusi normal

Tolak
H0 jika p-value <
.

Berdasarkan
analisis didapatkan nilai p-value = 0,806.
Karena p-value >
maka dapat diputuskan
gagal tolak H0 dan disimpulkan bahwa residual berdistribusi normal.

Semua asumsi klasik sudah terpenuhi
maka langkah selanjutnya adalah menguji keberartian regresi yaitu dengan
pengujian overall regression. Pengujian
overall regression dapat dilakukan dengan langkah-langkah sebagai berikut :
Analysis
of Variance
Source DF
SS MS
F P
Regression 1
2318.8 2318.8 172.73
0.000
Residual
Error 30 402.7
13.4
Total
31 2721.5
H0 :
= 0

H1 :
≠ 0


Tolak
H0 jika Fhitung > F(1,30,0,05) atau p-value
<

Berdasarkan
Anova didapatkan p-value = 0,000. Karena
p-value <
mala tolak H0
dan disimpulkan bahwa variable bebas mempengaruhi variable tak bebas.

Model
terbaik yang didapatkan setelah semua asumsi klasik terpenuhi, regresi
signifikan dan kasus multikolinearitas telah ditasi adalah sebagai berikut :
Y = 31,125 – 4,533 w1
Y = 2,5 + 0,11609 X1 +
0,13794 X2 + 0,00158 X3 + 0,00167 X4
Dibawah
ini akan dilakukan analisis regresi lebih lanjut antara variable predictor
yaitu Y (jumlah asap mobil), X1(
suhu tanki (oF)), X2 (suhu bensin (oF)), X3(tekanan
asap pada tanki (psi)), X4 (tekanan asap pada bensin (psi)) .
1.1 Deskriptif
Untuk mempermudah analisis maka eksplorasi data sangat diperlukan.
Deskriptif data dari variable-variabel baik predictor maupun respon adalah
sebagai berikut.
Variabel Asap mobil
Gambar 1.4 Boxplot dan Histogram Variabel Jumlah Asap Mobil
Descriptive
Statistics: Y
Total Sum
of
Variable Count
Mean SE Mean TrMean
StDev Sum Squares
Minimum
Y 32
31.13 1.66 30.50
9.37 996.00 33722.00
16.00
Variable Q1
Median Q3 Maximum
Y 23.25
31.50 35.50 55.00
- X1( suhu tanki (oF))
![]() |
|||
![]() |
Gambar 1.5. Boxplot dan Histogram Variabel Suhu Tanki
Descriptive
Statistics: X1
Total
Sum of
Variable Count
Mean SE Mean TrMean
StDev Sum Squares
Minimum
X1 32
57.91 3.45 57.36
19.51 1853.00 119101.00
31.00
Variable Q1
Median Q3 Maximum
X1 37.00
60.00 62.00 92.00
- X2 (suhu bensin (oF))
![]() |
![]() |
||
Gambar 1.6. Boxplot dan Histogram Variabel X2
(suhu bensin (oF))
Descriptive
Statistics: X2
Total
Sum of
Variable Count
Mean SE Mean TrMean
StDev Sum Squares
Minimum
X2 32
55.91 2.78 54.82
15.73 1789.00 107689.00
35.00
Variable Q1
Median Q3 Maximum
X2 39.00
60.00 62.00 92.00
- X3(tekanan asap pada tanki (psi))
![]() |
![]() |
||
Gambar 1.7. Boxplot dan Histogram Variabel X3(tekanan
asap pada tanki (psi))
Descriptive
Statistics: X3
Total Sum
of
Variable Count
Mean SE Mean TrMean
StDev Sum Squares
Minimum
X3 32
4.422 0.257 4.336
1.452 141.510 691.163
2.590
Variable Q1
Median Q3 Maximum
X3 3.230
4.285 4.690 7.450
e. X4 (tekanan asap pada bensin (psi))
![]() |
![]() |
Gambar 1.8. Boxplot dan Histogram Variabel X4
(tekanan asap pada bensin (psi))
Dari boxplot pada gambar 1.1 – 1.5 terlihat
bahwa data variable predictor yaitu Y (jumlah asap mobil), X1( suhu tanki (oF)), X2
(suhu bensin (oF)), X3(tekanan asap pada tanki (psi)), X4
(tekanan asap pada bensin (psi)) tidak simetri. Data yang tidak simetri ini juga bisa
dilihat pada histogramnyayaitu dari nilai mean dan standard deviasinya. Untuk
mengetahui apakah hubungan antara variable respon dan predictor bersifat
linier, kuadratik atau yang lain, maka bisa dilakukan plot.

Gambar 1.9. plot Matrik variable Respon dan Prediktor
1.2 Korelasi
Korelasi antara variable predictor yaitu yaitu Y (jumlah asap mobil), X1( suhu tanki (oF)), X2
(suhu bensin (oF)), X3(tekanan asap pada tanki (psi)), X4
(tekanan asap pada bensin (psi)) sesuai dengan korelasi pearson
adalah sebagai berikut.
Correlations: Y, X1, X2, X3, X4
Y X1 X2
X3
X1
0.826
0.000
X2
0.909 0.774
0.000 0.000
X3
0.870 0.955 0.782
0.000 0.000 0.000
X4
0.921 0.934 0.837
0.985
0.000 0.000 0.000
0.000
Cell Contents: Pearson correlation
P-Value
Hipotesis yang bisa dibuat untuk menguji korelasi ini adalah sebagai
berikut.
Ho :

H1 : 

Hasil analisis korelasi diatas memperlihatkan bahwa nilai seluruh p-value
adalah 0. Karena p-value jatuh didaerah penolakan maka keputusan yang bisa
diambil adalah menolak hipotesis awal yang mengatakan bahwa tidak ada korelasi
antara variabel respond an variabel predictor. Oleh karena itu kesimpulan yang
bisa diambil dari uji hipotesis ini adalah antara variabel respon dengan
variabel predictor ada hubungan erat, yaitu semuanya diatas 77,4 %.
1.3 Regresi
Kemungkinan persamaan-persamaan yang mungkin bisa dibentuk antara lain :
y, x1; y,x1,x2; y,x1,x2,x3; y,x2; y,x2,x1; y,x2,x1,x3; y,x3; y,x3,x1;
y,x3,x1,x2.
|
||
![]() |
Tabel
1.2 Nilai R-sq dan R-adj untuk setiap persamaan
x1
|
x1,x2
|
x1,x2,x3
|
|
R(adj)
|
67.2%
|
85.5%
|
88.6%
|
R-sq
|
68.2%
|
86.4%
|
89.7%
|
x2
|
x2,x1
|
x2,x1,x3
|
|
R(adj)
|
82.1%
|
85.5%
|
88.6%
|
R-sq
|
82.7%
|
86.4%
|
89.7%
|
x3
|
x3,x1
|
x3,x1,x2
|
|
R(adj)
|
74.9%
|
74.0%
|
88.6%
|
R-sq
|
75.7%
|
75.7%
|
89.7%
|
Dengan memperhatikan R square dan R adjusted masing-masing persamaan
terlihat bahwa pada table 1.1. Penambahan variable x1 kedalam model belum bernilai
signifikan yang bisa dilihat pada R-adj sebesar 67,2%. Begitu juga saat x2
dimasukkan ke model, niali R-adj malah menurun yaitu sebesar 82,1%.Ketika x3
juga ikut masuk ke dalam model R-adj malah menurun menjadi 57.7%. Fenomena ini
juga terjadi pada kasus yang ketiga. Sehingga kontribusi x1,x2 dan x3 memang belum
begitu besar pada model.
1.4 Korelasi Parsial
Korelasi parsial yang akan dilakukan berhubungan
dengan koefisien determinasi yang diperoleh pada saat meregresikan variable
respon dan prediktornya. Misal untuk korelasi parsial y, x2,x3, x4 dengan
control x1 adalah sebagai berikut.
Controlling
X1
Partial
Corr

Korelasi antara Y dengan X1, X2, X3 dan X4 signifikan. Pada saat X1 dijadikan
sebagai control, ternyata variable X4, X3, dan X2 signifikan. Hal ini menandakan
bahwa variable X4, X3, dan X2 memang signifikan hubungannya terhadap variable
respon Y.
Untuk hasil lebih lanjut bisa
dilihat pada lampiran 1 tentang korelasi parsial. Penghitungan korelasi parsial
juga bisa dilakukan di Minitab. Tahap pertama adalah dengan mengkorelasikan
keempat variable yaitu y1, x1, x2, x3, x4. Kemudian melakukukan korelasi
residual dari hasil regresi untuk masing-masing kombinasinya dengan menetapkan
terlebih dahulu variable kontrolnya.