Analisis Variansi
Analisis
Variansi merupakan alat yang digunakan untuk mengevaluasi kebaikan model
regresi. Model regresi yang baik, salah
satunya ditandai oleh ting-ginya koefisien
determinasi, dinotasikan R2, yang dapat dihasilkan oleh Tabel Analisis Variansi.
Apabila
terdapat himpunan data random yang saling independen, dan tidak ada faktor yang
mempenga-ruhi, maka data tersebut akan bervariasi terhadap meannya. Pada data
random yang dipengaruhi oleh suatu faktor, variasi terhadap pengaruh faktor
ikut berkontribusi.
-Untuk menempatkan variabel-variabel bebas penting di dalam suatu studi
-Untuk menentukkan bagaimana mereka berinteraksi dalam mempengaruhi jawaban (Mendel hell dan reinmuth, 1982. hal: 542)
Analisis Varian memiliki dua tipe yaitu :
- Analisis varian 1 arah
Analisis
varian 1arah yaitu suatu metode untuk menguraikan keragaman total data
menjadi komponen-komponen yang mengukur berbagai sumber keragaman dengan
menggunakan One-Way ANOVA dengan satu perlakuan.
- Analisis varian 2 arah
Analisis
varian 2 arah yaitu suatu metode untuk menguraikan keragaman total data
menjadi komponen-komponen yang mengukur berbagai sumber keragaman
dengan menggunakan One-Way ANOVA dengan dua perlakuan.
Metode
perbandingan dua populasi telah terlebih dahulu dikembangkan, yang
meliputi perbandingan karakteristik yang menyangkut nilai rata-rata,
varian, deviasi standar, dan sebagainya. Metode tersebut dilakukan
misalnya untuk menguji apakah terdapat perbedaan ketelitian dua jenis
alat ukur, atau menguji apakah rata-rata umur mesin bubut dengan merek
tertentu akan sama dengan rata-rata umur mesin bubut merek lain, atau
menguji apakah rata-rata oksigen penyerapan jagung hibrida akan sama
dengan rata-rata penyerapan oksigen tanaman jagung local, dan lain
sebagainya. Perlu diperlihatkan bahwa dua populasi yang dibandingkan
dalam metode tersebut adalah dua populasi yang bersesuaian.
Dengan
demikian pengujian dua populasi yang dilakukan untuk mengetahui apakah
rata-rata jumlah kendaraan yang melewati jalan Perintis Kemerdekaan di
Tangerang setiap hari akan sama dengan rata-rata penjualan kartu telpon
seluler di LIPPO Karawaci tidak akan memberikan manfaat apa-apa, sebab
secara statistika mungkin saja kedua rata-rata kedua populasi tersebut
sama, atau memiliki variansi dan deviasi standar yang sama, dan secara
logika tidak memiliki hubungan yang berarti. Perbandingan karakteristik
antara dua populasi telah memberikan kontribusi yang besar dalam
perkembangan ilmu statistik dan aplikasinya dalam kehidupan sehari-hari.
Dengan membandingkan dua populasi yang bersesuaian, seseorang dapat
menentukan pilihan-pilihan yang akan ia ambil. Misalnya dalam lomba rally mobil, apakah lebih baik memilih ban merek A atau merek B.
Dalam
pengembangan pertanian di suatu daerah apakah lebih menguntung-kan
membudidayakan tanaman X daripada tanaman Y dan sebagainya. Akan tetapi
dalam praktiknya, kadang-kadang kita harus membandingkan karakteristik
lebih dari dua populasi. Misalnya diperlukan pengujian terhadap kekuatan
tarik dari baja dengan kadar karbon yang berbeda. Atau diperlukan
pengujian produktivitas beberapa mesin, dalam pabrik pemotongan logam,
di mana pemanfaatan waktu produktif dari beberapa mesin harus
dibandingkan untuk kemudian di analisis bagi pemerataan beban kerja dan
membentuk keseimbangan lintasan produksi yang optimum.
Untuk
memecahkan persoalan-persoalan semacam ini, dapat dilakukan
perbandingan antar dua populasi terlebih dahulu, untuk kemudian
diteruskan dengan membandingkannya dengan populasi yang lain. Tetapi hal
tersebut dapat dilakukan perbandingan antar dua populasi terlebih
dahulu, untuk kemudian diteruskan dengan membandingkan dengan populasi
yang lain. Tetapi hal tersebut akan memakan waktu yang lama dan akan
menimbulkan kesulitan yang relatif lebih besar apabila jumlah populasi
yang dibandingkan sangat banyak. Misalnya apabila seseorang ingin
mengetahui apakah terdapat perbedaan yang signifikan pada rata-rata
kekuatan tarik baja dan kadar karbon 0,1 % sampai dengan 1 %.
Apabila
terdapat 10 jenis baja dengan kadar karbon yang berbeda-beda, analisis
akan memakan waktu yang lama apabila masing-masing jenis baja
diperbandingkan satu dengan yang lain. Untuk menjawab tantangan semacam
ini, ilmu statistika memperkenalkan metode analisis karakteristik
beberapa populasi yang disebut dengan analisis variansi. Analisis varian
atau lebih dikenal dengan sebutan Anava adalah jenis analisis statistik
parametrik yang digunakan untuk menguji perbedaan antara 3 kelompok
data (pengamatan) atau lebih. Anava tidak saja mampu menguji perbedaan
antara 3 kelompok atau lebih dari satu variabel bebas, tetapi juga bisa
untuk menyelesaikan kelompok-kelompok data yang berasal dari 2 variabel
bebas atau lebih. Anava dengan 1 variabel bebas disebut Anava 1 jalur
sedangkan Anava dengan 2 variabel bebas atau lebih disebut Anava ganda
atau Anava faktorial.
Sebagai
statistik parametik Anava dikembangkan dari asumsi-asumsi
keparametrikan. Asumsi-asumsi keparametrikan tersebut antara lain: (1)
bahwa sampel harus berasal dari populasi yang terdistribusikan atau
terbesar secara normal, hal ini lebih dikenal dengan konsep asumsi
normalitas, (2) nilai-nilai varian dalam kelompok-kelompok sampel harus
menunjukkan adanya homogenitas, atau lebih dikenal asumsi homogenitas,
(3) data yang akann diolah harus berskala interval atau rasio, (4)
sampel penelitian harus diambil secara random. Kedudukan Anava dalam uji
parametric memiliki peranan yang cukup penting, bukan saja karena
digunakan untuk teknik uji beda, tetapi juga merupakan dasar bagi
analisis statistik parametric yang lain, yaitu dasar komputasi analisis
regresi dan analisis konvariansi.
Sebagai
mana ditunjukkan oleh namanya, Anava selalu berkaitan dengan
angka-angka variasi yang disebut dengan varian. Dalam statistik
deskriptif varian dikenal sebagai bentuk kuadrat standar deviasi. Lebih
khusus, Anava akan digunakan untuk menguji prbedaan antara 3 kelompok
data atau lebih dengan menggunakan nilai varian dalam kelompok dan
varian antar kelompok. Fungsi semacam ini mengingatkan pada analisis uji
beda dengan menggunakan teknik-t-tes. Bedanya teknik t-tes hanya dapat
digunakan pada dua kelompok data (pengamatan) dengan menggunakan nilai
rata-rata kelompok sebagai dasar penghitungannya. Akan tetapi Anava
dapat digunakan melakukan uji beda pada 3 kelompok data atau lebih.
Anava
untuk sebagian besar akan menjadi ciri dari analisis sataistik
penelitian eksperimental, yaitu suatu penelitian yang berusaha menguji
suatu akibat, efek, pengaruh dari suatu variabel tertentu terhadap
variabellain yang diteliti. Melalui Anava akan didapatkan suatu harga
yang mengindikasikan besarnya pengaruh suatu variabel terhadap variabel
lain yang disebut dengan rasio F atau koefisien F. Lambang F dalam
koefisien tersebut diberikan oleh Snedecor untuk menghormati pencipta
Anava, Ronald Fisher. Sedangkan Snedecor adalah penyusun tabel
nilai-nilai F yang digunakan untuk melihat taraf signifikansi dari
hasil-hasil uji Anava.
Dasar
pemikiran umum Anava adalah bahwa harga varian total (total variance)
pada populasi dalam suatu pengamatan (eksperimen) dapat dianalisis
menjadi 2 sumber, yaitu varian antar kelompok (between group variance) dan varian dalam kelompok (within group variance).
Skor varian antar kelompok akan dijadikan pembilang atau nominator
sedangkan skor varian dalam kelompok dimasukkan dalam penyebut atau
denominator. Untuk melakukan interpretasi pada hasil Anava digunakan
tabel nilai-nilai F sebagai kriterianya. Apabila harga F empirik lebih
besar atau sama dengan F teoritik maka diinterpretasikan signifikan,
yang artinya terdapat perbedaan antara kelompok-kelompok data yang
diteliti. Sebaliknya apabila F empirik lebih kecil dari pada F teoritik
diinterpretasikan tidak signifikan, yang artinya tidak terdapat
perbedaan antara kelompok-kelompok data yang diteliti. Disamping
memiliki fungsi sebagai alat untuk melakukan uji beda, Anava juga dapat
digunakan untuk mengadakan estimasi dan juga untuk menguji homogenitas
data.
- Kelebihan dan Kekurangan Analisis Variansi
Analisis
variansi sering digunakan untuk menguji hipotesis tentang perbedaan
rata-rata yang signifikan antara dua kelompok atau lebih. Kelebihan
analisis varian jika dibandingkan dengan pengujian t yang berdasarkan
perbedaan antara dua rata-rata adalah pengujian t hanya dapat menguji
perbedaan antara kedua rata-rata tersebut saja. Sehingga untuk lebih
dari dua rata-rata (mean) kita harus melakukan pengujian terhadap
masing-masing rata-rata dengan rata-rata lainnya. Meskipun hal tersebut
menyebabkan meningkatnya tingkat kesalahan yang disebut kesalahan
tingkat satu akan semakin berkurang.
Walaupun
demikian analisis variansi memiliki kelemahan, yaitu apabila terdapat
perbedaan antar kelompok yang dianalisis, letak perbedaannya tidak
diketahui, apakah antara A, dan B, B dan C, A dan C dan seterusnya.
Selain itu analisis variansi memerlukan paling sedikit dua kali
pengulangan, bahkan empat kali lebih baik. Semakin banyak pengulangan,
kita semakin percaya bahwa informasi rata-rata benar-benar mencerminkan
kenyataan. Untuk mendeteksi perbedaan antar kelompok, analisis variansi
dapat dilanjutkan dengan Scheff’s test, Duncan Multiple Range test, Tukey’s test, Student-Newman-Keul’s test. Pengecekan
melalui suatu pengujian t untuk masing-masing variabel kurang baik
karena semakin sering dilakukan pengujian t secara simultan, tingkat
kepercayaannya semakin turun.
- Anava Sebagai Alat Estimasi
Melakukan
estimasi adalah menentukan perkiraan apakah nilai-nilai varian yang
terdapat pada kelompok-kelompok sampel memiliki nilai variasi yang sama
dengan yang terdapat pada populasi. Misalnya, kita mendapatkan skor-skor
hasil ujian statistik dari 2 kelompok mahasiswa, yaitu laki-laki dan
perempuan. Dari penyebaran kelompok tampak atau diduga bahwa skor hasil
ujian mahasiswa perempuan cenderung lebih heterogen atau memiliki
variabilitas yang lebih tinggi dibandingkan laki-laki. Persoalannya
adalah apakah perbedaan variabilitas ini juga tergambar pada
populasinya? Untuk menjawab hal ini maka tugas kita adalah menghitung
rasio atau perbandingan F estimasi, dengan menggunakan rumus berikut:
Misalkan
skor-skor ujian statistik pada kedua kelompok mahasiswa tersebut
dimasukkan dan diolah dalam tabel 6.1 untuk menentukan rasio F
estimasinya.
TABEL 6.1.Tabel Penolong Untuk Menghitung F Estimasi adalah sebagai berikut:
Laki-laki (Lk)
|
Perempuan (Pr)
|
X
|
X2
|
X
|
X2
|
39
45
49
53
57
60
60
61
65
71
78
82
|
1521
2025
2401
1809
6579
3600
3600
3721
4225
5041
6068
6724
|
24
28
31
37
53
59
64
70
75
75
83
90
91
|
576
784
961
1369
2809
3481
4049
4900
5625
5625
6889
8100
8281
|
720
|
4500
|
780
|
53496
|
Sekarang
jika lakukan uji signifikansi dengan memeriksa tabel nilai-nilai F.
dengan menggunakan db = 11 dan 12 didapatkan harga F teoritik dari tabel
sebesar 2,79 pada taraf 5% dan 4,40 pada taraf 1%. Oleh karena F
empirik kita lebih besar dibandingkan F teoritik pada taraf 5%, maka
dapat diestimsikan bahwa skor-skor mahasiswa perempuan pada populasi
juga memiliki tingkat variablitas yang lebih tinggi daripada laki-laki,
sebagaimana yang terjadi pada sampel.
Dalam
setiap penghitungan statistik yang menggunakan Anava harus disertai
landasan bahwa harga-harga varian dalam kelompok bersifat homogen atau
relatif sejenis. Homogenitas varian merupakan asumsi yang penting di
dalam penghitungan Anava. Hal ini disebabkan karena pada hakekatnya
Anava digunakan untuk membandingkan varian dalam kelompok yang berasal
dari 3 kategori data atau lebih, dan kategori-kategori tersebut baru
dapat dibandingkan secara adil apabila harga-harga varian pada
masing-masing kategori bersifat homogeny.
Penghitungan
homogenitas harga varian harus dilakukan pada awal-awal kegiatan
analisis data. Hal ini dilakukan untuk memastikan apakah asumsi
homogenitas pada masing-masing kategori data sudah terpenuhi ataukah
belum. Apabila asumsi homogenitasnya terbukti maka peneliti dapat
melakukan pada tahap analisis data lanjutan. Akan tetapi apabila tidak
terbukti maka peneliti harus melakukan pembetulan-pembetulan
metodologis, misalnya dengan menambah jumlah sampel, memperkecil harga
variabilitas, dan kalau perlu mengubah desain penelitiannya. Melakukan
pengumpulan lagi, melakukan uji homogenitas lagi, dan setelah asumsi
homogenitasnya terpenuhi dapat dilanjutkan kepada analisis data akhir.
Prosedur ini memang memakan waktu, tetapi akan didapatkan hasil-hasil
penelitian yang amat valid. Ada sementara orang yang melakukan konversi
nilai F bila varian dalam kelompok terbukti tidak homogen, yaitu dengan
jalan mengalikan harga p (probable error) dengan bilangan 2, akan tetapi sesungguhnya cara ini sangat lemah dari metodologinya.
Prosedur yang digunakan untuk menguji homogenitas varian dalam kelompok adalah dengan jalan menemukan harga Fmaximum.
Sebagaimana penafsiran pada harga F yang sering digunakan pada uji
beda, dimana bila F terbukti signifikan artinya terdapat perbedaan dan
sebaliknya bila tidak signifikan berarti tidak ada perbedaan. Pada uji
homogenitas, harga F yang diharapkan adalah harga F yang tidak
signifikan, yaitu harga F empirik yang lebih kecil daripada harga F
teoritik yang terdapat dalam tabel. Seperti dijelaskan diatas bahwa
makna harga F yang tidak signifikan adalah menunjukkan tidak adanya
perbedaan yang juga bisa diartikan sama, sejenis, tidak heterogen, atau
homogen.
Adapun rumus yang digunakan untuk menguji homogenitas varian adalah:
Misalkan
kita memiliki 3 kelompok data skor-skor ujian statistik dari kelas A,
B, dan C. Skor-skor tersebut dimasukkan dan diolah dalam tabel 6.2 untuk
menemukan rasio Fmaximum.
Tabel 6.2.Tabel Kerja Untuk Menghitung Fmaximum.
A
|
B
|
C
|
X
|
X2
|
X
|
X2
|
X
|
X2
|
63
47
67
81
|
3969
2209
4489
6561
|
43
28
31
37
|
1849
784
961
1369
|
53
61
41
43
|
2809
3721
1681
1849
|
258
|
17228
|
139
|
4963
|
198
|
10060
|
Sekarang
kita lakukan uji signifikansi dengan memeriksa tabel nilai-nilai F.
dengan menggunakan db = 3 didapatkan harga F teoritik dari tabel sebesar
9,28 pada taraf 5% dan 29,46 pada taraf 1%. Oleh karena F empirik kita
lebih kecil dibandingkan F teoritik, maka dapat diinterpretasikan bahwa
hara F empirik tidak signifikan, yang berarti bahwa harga varian dalam
masing-masing kelompok adalah homogen.
Anava
1 jalur adalah teknik statistik parametrik yang digunakan untuk menguji
perbedaan antara 3 atau lebih kelompok data berskala interval atau
rasio yang berasal dari 1 variabel bebas. Langkah-langkah yang ditempuh
untuk menghitung Analisis varian 1 jalur adalah sebagai berikut:
- Menghitung jumlah kuadrat (sum of squares) total (Jkt), antar kelompok (Jka), dan dalam kelompok (Jkd). untuk menghitung masing-masing harga Jk digunakan rumus sebagai berikut:
dimana disebut juga dengan suku koreksi (sk) atau correction (c)
- Menghitung derajat kebebasan (degree of freedom) total (dbt), antar kelompok (dba) dan dalam kelompok (dbd), dengan rumus:
dimana N = jumlah subyek, K = jumlah kelompok data.
- Menghitung rata-rata kuadrat (mean of square) antar kelompok (Rka), dan dalam kelompok (Rkd), dengan rumus:
- Menghitung perbandingan atau rasio F dengan rumus:
Melakukan
interpretasi dan uji signifikansi pada rasi F yang diperoleh dengan
membandingkannya d dengan harga F teoritik yang terdapat dalam tabel
nilai-nilai F. Rasio F yang diperoleh disebut F empirik (Fe) sedangkan harga F yang terdapat dalam tabel disebut dengan F teoritik (Ft).
Apabila maka diinterprestasikan signifikannya berarti terdapat
perbedaan, dan apabila maka diinterprestasikan tidak signifikan yang
lebih tidak terdapat perbedaan diantara kategori data yang diteliti.
Sedangkan prosedur untuk melihat tabel nilai F adalah dengan menggunakan
dba sebagai pembilang dan dbd sebagai penyebut.
Contoh,
seorang peneliti ingin melakukan penelitian eksperimen untuk menguji
perbedaan efektivitas dari 3 metode pengajaran bahasa Inggris, yaitu
metode (A) melalui tatap muka secara regular di dalam kelas, metode (B)
menggunakan permainan, dan metode (C) dengan menggunakan home stay yaitu
tinggal dan belajar bersama orang asing. Lima belas mahasiswa diambil
secara random dibagi tiga dan dimasukkan ke dalam masing-masing metode.
Pada akhir masa eksperimen para siswa tersebut diukur kemampuan Bahasa
Inggrisnya. Misalnya skor-skor kemampuan Bahasa Inggris dari tiga
kelompok siswa tersebut adalah sebgai berikut:
Metode A : 19 12 14 16 15
Metode B : 25 21 23 26 20
Metode C : 26 28 25 29 30
Untuk
menganalisis perbedaan efektifitas 3 macam metode pengajaran tersebut,
berturut-turut harus dipersiapkan tabel penolong untuk, menghitung Jk,
Rk, db dan rasio F.
Tabel 6.3.Tabel Penolong untuk Menghitung Anava 1 Jalur
Metode A
|
Metode B
|
Metode C
|
Total
|
|
|
|
|
|
|
|
|
19
12
14
16
15
|
361
144
196
256
225
|
25
21
23
26
20
|
625
441
529
676
400
|
26
28
25
29
30
|
676
784
625
841
900
|
70
61
62
71
65
|
1662
1369
1350
1773
1525
|
76
|
1182
|
115
|
2671
|
138
|
3826
|
329
|
7679
|
Berdasarkan harga-harga yang diperoleh dari tabbel 6.3 tersebut dapat dilakukan hal-hal sebagai berikut:
- Menghitung
- Menghitung Rka dan Rkd
- Menghitung rasio F
- Melakukan uji signifikansi
Dengan menggunakan dba = 2 dan dbd =
12 didapatkan harga F teoritik dalam tabel nilai-nilai F sebesar 3,88
pada taraf 5% dan 6,93 pada taraf 1%. Berdasarkan harga F teoritis dapat
dibuktikan bahwa F empirik sebesar 33,70 lebih besar daripada F
teoritik baik pada taraf 5% maupun taraf 1%. Dengan demikian dapat
diinterpretasikan bahwa terdapat perbedaan yang signifikan pada
kememapuan Bahasa Inggris para siswa setelah dilakukan pengajaran dengan
metode yang berbeda. Kesimpulan lebih lanjut yang dapat ditemukan
adalah bahwa metode C merupakan yang paling efektif untuk meningkatkan
kemampuan Bahasa Inggris yaitu dengan harga rata-rata 27,6 dan kemudian
disusul metode B dengan rata-rata 23, selanjutnya metode A dengan nilai
rata-rata 15,2.
- Membuat tabel ringkasan Anava seperti Tabel 6.4 berikut:
Tabel 6.4.Tabel Ringkasan Analisis varian satu jalur
Sumber
|
Jk
|
db
|
Rk
|
F empirik
|
F teoritik
|
Interpretasi
|
Antar kel.
Dalam kel.
|
392,93
70
|
2
12
|
196,965
5,83
|
33,70
|
3,88(5%)
6,93(1%)
|
Signifikan
Signifikan
|
Total
|
462,93
|
14
|
-
|
-
|
-
|
-
|