Analisis Butir Tes

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 23

BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Mutu pendidikan dipengaruhi oleh banyak faktor, diantaranya siswa,


pengelola sekolah, lingkungan,kualitas pengajaran, kurikulum dan sebagainya.
Usaha peningkatan pendidikan bisa ditempuh dengan peningkatan kualitas
pembelajaran dan sistem evaluasi yang baik. 1 Keduanya saling berkaitan sistem
pembelajaran yang baik akan menghasilkan kualitas pendidikan yang baik,
selanjutnya sistem penilaian yang baik akan mendorong guru untuk menentukan
strategi mengajar yang baik dan memotivasi siswa untuk belajar yang lebih baik.

Sehubungan dengan itu, maka di dalam pembelajaran dibutuhkan guru yang


tidak hanya mengajar dengan baik, namun mampu melakukan evaluasi dengan
baik. Kegiatan evaluasi sebagai bagian dari program pembelajaran perlu lebih
dioptimalkan. Evaluasi tidak hanya bertumpu pada penilaian hasil belajar, namun
perlu penilaian terhadap input, output dan kualitas proses pembelajaran itu sendiri.

Untuk mengetahui apakah penyelenggaraan progam dapat mencapai


tujuannya secara efektif dan efisien, maka perlu dilakukan evaluasi. Untuk itu,
evaluasi dilakukan atas komponen-komponen dan proses kerjanya sehingga apabila
terjadi kegagalan dalam mencapai tujuan maka dapat ditelusuri komponen dan
proses yang menjadi sumber kegagalan.2

Dengan demikian maka apabila dikenal sebuah tes akan tercermin hasilnya
dalam suatu kurva normal. Sebagian kecil siswa berada didaerah sedang, sebagian
kecil berada di ekor kiri, dan sebagian kecil yang lain berada di ekor kanan. Apabila
keadaan setelah hasil tes dianalisis tidak seperti yang diharapkan dalam kurva
normal, maka tentu ada “apa-apa” dengan soal tesnya. Apabila hampir seluruh
siswa memperoleh skor jelek berarti bahwa tes yang disusun mungkin terlalu sukar.

1
Arikunto, Suharsimi, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 1987),
hlm. 21
2
Purwanto, Evaluasi Hasil Belajar (Yogyakarta:Pustaka Belajar, 2009), hlm.1.
1
Sebaliknya jika seluruh siswa memperoleh skor baik, dapat diartikan bahwa tesnya
terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain seandainya tes itu
sudah disusun sebaik-baiknya sehingga memenuhi persyaratan sebagai tes.3

B. Rumusan Masalah
1. Apakah yang dimaksud dengan analisis butir soal secara kualitatif dan
kuantitatif?
2. Bagaimana cara mengaplikasikan analisis butir soal secara kualitatif dan
kuantitatif?
3. Apa manfaat dari menganalisis butir soal?

C. Tujuan
1. Mendeskripsikan analisis butir soal secara kualitatif dan kuantitatif.
2. Mengaplikasikan cara mengaplikasikan analisis butir soal secara kualitatif
dan kuantitatif.
3. Mengetahui manfaat dari menganalisis butir soal.

3
Daryanto, Evaluasi Pendidikan (Jakarta:PT.Rineka Cipta, 2001), hlm. 176-177.
2
BAB II

PEMBAHASAN

A. Analisis Butir Soal Secara Kualitatif dan Kuantitatif


Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan
berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan
ini biasanya dilakukan sebelum soal digunakan atau diujikan. Aspek yang
diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal ditelaah
dari segi materi, konstruksi, bahasa atau budaya, dan kunci jawaban atau pedoman
penskorannya. Dalam menganalisis butir soal, terdapat dua teknik. Yaitu teknik
kualitatif dan teknik kuantitatif.
1. Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal
secara kualitatif, diantaranya adalah teknik moderator dan teknik panel.
a. Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat
satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang
mengajarkan materi, ahli materi, penyusun atau pengembang kurikulum,
ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sangat
baik karena setiap butir soal dilihat secara bersama-sama berdasarkan
kaidah penulisannya. Di samping itu, para penelaah dipersilakan
mengomentari berdasarkan kompetensinya masing-masing. Setiap
komentar atau masukan dari peserta diskusi dicatat. Setiap butir soal dapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun,
kelemahan teknik ini memiliki kelemahan karena memerlukan waktu lama
untuk rnendiskusikan setiap satu butir soal.
b. Teknik Panel yakni suatu teknik menelaah butir soal berdasarkan kaidah
penulisan butir soal. Kaidah itu diantaranya materi, konstruksi, bahasa atau
budaya, kebenaran kunci jawaban atau pedoman penskoran. Caranya
beberapa penelaah diberikan butir-butir soal yang akan ditelaah, format
penelaahan, dan pedoman penilaian atau penelaahan. Pada tahap awal,
semua orang yang terlibat dalam kegiatan penelaahan disamakan

3
persepsinya, kemudian mereka berkerja sendiri-sendiri di tempat berbeda.
Para penelaah dipersilakan memperbaiki langsung pada teks soal dan
memberikan komentarnya serta memberikan nilai pada setiap butir soal
dengan kriteria: soal baik, perlu diperbaiki, atau diganti.

Dalam menganalisis butir soal secara kualitatif, penggunaan format


penelaahan soal akan sangat membantu dan mempermudah prosedur
pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk
menganalisis setiap butir soal. Format penelaahan soal yang dimaksud adalah
format penelaahan butir soal: uraian, pilihan ganda, tes perbuatan dan instrumen
non-tes. Berikut disajikan format penelaahan butir soal.

a. Format Penelaahan Butir Soal Bentuk Uraian


Mata pelajaran :
Kelas/semester :
Penelaah :
No. Aspek yang ditelaah Nomor soal
A. Materi 1 2 3 4 5 ...
1 Soal sesuai dengan indikator (menuntut tes tertulis
untuk bentuk Uraian)
2 Batasan pertanyaan dan jawaban yang diharapkan
sudah sesuai
3 Materi yang ditanyakan sesuai dengan kompetensi
(urgensi, relevansi, kontinuitas, keterpakaian
sehari-hari tinggi)
4 Isi materi yang ditanyakan sesuai dengan jenjang
jenis sekolah atau tingkat kelas
B. Konstruksi
1 Menggunakan kata tanya atau perintah yang
menuntut jawaban uraian
2 Ada petunjuk yang jelas tentang cara mengerjakan
soal
3 Ada pedoman penskorannya
4
4 Tabel, gambar, grafik, peta, atau yang sejenisnya
disajikan dengan jelas dan terbaca
Bahasa/Budaya
1 Butir soal menggunakan bahasa Indonesia yang
baku
2 Rumusan kalimat komunikatif
3 Tidak menggunakan kata/ungkapan yang
menimbulkan penafsiran ganda atau salah
pengertian
4 Tidak menggunakan bahasa yang berlaku
setempat/tabu

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

b. Format Penelaahan Butir Soal Bentuk Pilihan Ganda


Mata pelajaran :
Kelas/semester :
Penelaah :
No. Aspek yang ditelaah Nomor soal
A. Materi 1 2 3 4 5 ...
1 Soal sesuai dengan indikator (menuntut tes tertulis
untuk bentuk pilihan ganda)
2 Materi yang ditanyakan sesuai dengan kompetensi
(urgensi, relevansi, kontinuitas, keterpakaian
sehari-hari tinggi)
3 Pilihan jawaban homogen dan logis
4 Hanya ada satu jawaban
B. Konstruksi
1 Pokok soal dirumuskan dengan singkat, jelas, dan
tegas
2 Ada petunjuk yang jelas tentang cara mengerjakan
soal

5
3 Pokok soal tidak memberi petunjuk kunci jawaban
4 Pokok soal bebas dan pernyataan yang bersifat
negatif ganda
5 Pilihan jawaban homogen dan logis ditinjau dari
segi materi
6 Gambar, grafik, tabel, diagram, atau sejenisnya
jelas dan berfungsi
7 Panjang pilihan jawaban relatif sama
8 Pilihan jawaban tidak menggunakan pernyataan
"semua jawaban di atas salah/benar" dan
sejenisnya
9 Pilihan jawaban yang berbentuk angka/waktu
disusun berdasarkan urutan besar kecilnya angka
atau kronologisnya
10 Butir soal tidak bergantung pada jawaban soal
sebelumnya
Bahasa/Budaya
1 Menggunakan bahasa yang sesuai dengan kaidah
bahasa Indonesia
2 Menggunakan bahasa yang komunikatif
3 Tidak menggunakan bahasa yang berlaku
setempat/tabu
4 Pilihan jawaban tidak mengulang kata/kelompok
kata yang sama, kecuali merupakan satu
kesatuan pengertian

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

2. Analisis Butir Soal Secara Kuantitatif


Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan
pada data empirik. Data empirik ini diperoleh dari soal yang telah diujikan. Ada
dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik
dan modern. Analisis butir soal secara klasik adalah proses penelaahan butir soal
6
melalui informasi dari jawaban peserta didik tes guna meningkatkan mutu butir
soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan analisis
butir soal secara klasik adalah murah, sederhana, familiar, dapat dilaksanakan
sehari-hari dengan cepat menggunakan komputer, dan dapat menggunakan data
dari beberapa peserta didik atau sampel kecil (Millman dan Greene, 1993: 358).
Analisis jenis butir ini yang lazim digunakan dalam praktik di lapangan, terutama
oleh guru disekolah. Aspek yang perlu diperhatikan dalam analisis butir soal
secara klasik adalah setiap butir soal ditelaah dari segi: tingkat kesukaran butir,
daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk
obyektif) atau fungsi pengecoh pada setiap pilihan jawaban, reliabilitas dan
validitas soal.

a. Analisis Tingkat Kesukaran Soal

Menganalisis tingkat kesukaran soal artinya mengkaji soal-soal tes dari


segi kesulitannya sehingga dapat diperoleh soal-soal mana yang termasuk
mudah, sedang, dan sukar.4
Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama
dapat diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh
masing-masing butir item tersebut. butir-butir item tes hasil belajar dapat
dinyatakan sebagai butir-butir item yang baik, apabila butir-butir item tersebut
tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat
kesukaran item itu adalah sedang atau cukup. 5
Suatu tes tidak boleh terlalu mudah, dan juga tidak boleh terlalu sukar.
Sebuah item yang terlalu mudah sehingga dapat dijawab dengan benar oleh
semua anak bukanlah merupakan item yang baik. Begitu pula item yang terlalu
sukar sehingga tidak dapat dijawab oleh semua anak juga bukan merupakan
item yang baik. Jadi item yang baik adalah item yang mempunyai derajat
kesukaran tertentu.
Analisis butir soal atau analisis item adalah pengkajian pertanyaan-
pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas

4
Sulistyorini, EvaluasiPendidikan, (Yogyakarta: Teras, 2009), h. 173
5
Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: RajaGrafindo Persada), 2006,
h. 370
7
yang memadai. Ada dua jenis analisis butir soal, yakni analisis tingkat
kesukaran soal dan analisis daya pembeda. Menganalisis tingkat kesukaran soal
artinya mengkaji soal-soal tes dari segi kesulitannya sehingga dapat diperoleh
soal-soal mana yang temasuk mudah, sedang, dan sukar. Sedangkan
menganalisis daya pembeda artinya mengkaji soal-soal tes dari segi
kesanggupan tes tersebut dalam membedakan siswa yang termasuk ke dalam
kategori lemah atau rendah dan kategori kuat atau tinggi prestasinya. 6
Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan
siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai pembuat soal.
Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal
adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang, dan
sukar. Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah
soal kategori mudah, sedang, dan sukar. Pertimbangan pertama adalah adanya
keseimbangan, yakni jumlah soal sama untuk ketiga kategori tersebut. Artinya,
soal mudah, sedang, dan sukar jumlahnya seimbang. Misalnya tes objektif
pilihan berganda dalam pelajaran matematika disusun sebanyak 60 pertanyaan.
Dari 60 pertanyaan, soal kategori mudah sebanyak 20, kategori sedang 20, dan
kategori sukar 20. Pertimbangan kedua proporsi jumlah soal untuk ketiga
kategori tersebut didasarkan atas kurva normal. Artinya, sebagian besar soal
berada dalam kategori sedang, sebagian lagi termasuk ke dalam kategori mudah
dan sukar dengan proporsi yang seimbang.
Perbandingan antara soal mudah-sedang-sukar bisa dibuat 3-4-3.
Artinya, 30 % soal kategori mudah, 40 % soal kategori sedang, dan 30 % lagi
soal kategori sukar. Misalnya, dari 60 pertanyaan pilihan ganda terdapat 18 soal
kategori mudah, 24 soal kategori sedang, dan 18 soal kategori sukar. Persoalan
lain adalah menentukan kriteria soal, yaitu ukuran untuk menentukan apakah
soal tersebut termasuk mudah, sedang, atau sukar. Dalam menentukan kriteria
ini digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan
tertentu. Pertimbangan tersebut antara lain adalah:

6
Nana Sudjana, Penilaian Hasil Proses Belajar, (Bandung: Remaja Rosdakarya, 2006),
h.135
8
a) Abilitas yang diukur dalam pertanyaan tersebut. misalnya untuk bidang
kognitif, aspek pengetahuan atau ingatan dan pemahaman termasuk kategori
mudah, aspek penerapan dan analitis termasuk kategori sedang, dan aspek
sintesis dan evaluasi termasuk kategori sukar.
b) Sifat materi yang diujikan atau ditanyakan. Misalnya ada fakta, konsep,
prinsip dan hukum, serta generalisasi. Fakta termasuk ke dalam kategori
mudah, konsep dan prinsip termasuk ke dalam kategori sedang, dan
generalisasi (menarik kesimpulan) termasuk ke dalam kategori sukar.
c) Isi bahan yang ditanyakan sesuai dengan bidang keilmuannya, baik luasnya
maupun kedalamannya. Tentang persoalan isi bahan yang akan diujikan,
guru sendiri sendiri harus sudah bisa menentukan mana yang termasuk
mudah-sedang-sukar. Dengan kata lain, untuk menentukan kesulitan isi
bahan, kewenangan ada pada guru itu sendiri.
d) Bentuk soal. Misalnya dalam tes objektif, tipe soal pilihan benar-salah lebih
mudah daripada pilihan berganda dengan option tiga atau empat.
Menjodohkan relatif lebih sulit daripada pilihan berganda jika terdapat lima
atau lebih yang harus dipasangkan.
Dengan demikian, keempat pertimbangan di atas tidak mutlak sebab
bergantung pada isi bahan yang ditanyakan. Kadang-kadang soal benar-salah
untuk aspek tertentu lebih sulit daripada pilihan berganda untuk aspek lainnya.
Demikian juga soal yang mengungkapkan kemampuan analisis dalam hal
tertentu lebih mudah daripada soal yang mengungkapkan pemahaman. Dengan
demikian, judgment ada pada guru yang bersangkutan setelah ia menentukan
ruang lingkup materi yang akan diujikan, baik luas maupun kedalamannya.
Hal yang sama berlaku dalam menyusun tes uraian (esai). Artinya, soal-
soal jenis esai hendaknya memperhatikan pula tingkat kesukaran soal.
Mengingat sifatnya, menentukan tingkat kesukaran soal tes uraian jauh lebih
mudah daripada tes objektif. Melalui analisis abilitas yang diukur serta isi dan
sifat bahan yang ditanyakan, dalam tes uraian dapat dengan mudah menentukan
tingkat kesukaran.
Setelah judgment dilakukan oleh guru, kemudian soal tersebut
diujicobakan dan dianalisis apakah judgment tersebut sesuai atau tidak.

9
Misalnya soal nomor 5 termasuk ke dalam kategori mudah, soal nomor 7
kategori sedang, dan nomor 9 kategori sukar. Setelah dilakukan uji coba,
hasilnya dianalisis apakah nomor-nomor soal itu sesuai dengan judgment
tersebut. cara melakukan analisis untuk menentukan tingkat kesukaran soal
adalah dengan menggunakan rumus sebagai berikut:
𝐵
I=𝑁

I = indeks kesulitan untuk setiap butir soal


B = banyaknya siswa yang menjawab benar setiap butir soal
N = banyaknya siswa yang memberikan jawaban pada soal yang
dimaksudkan
Kriteria yang digunakan adalah makin kecil indeks yang diperoleh,
makin sulit soal tersebut. sebaliknya, makin besar indeks yang diperoleh,
makin mudah soal tesebut. Kriteria indeks kesulitan soal itu adalah sbb.:
- 0 – 0,30 = soal kategori sukar,
- 0,31 – 0,70 = soal kategori sedang,
- 0, 71 – 1,00 = soal kategori mudah.
Contoh:
Guru Agama memberikan 10 pertanyaan pilihan berganda dengan
komposisi 3 soal mudah, 4 soal sedang, dan 3 soal sukar. Jika dilukiskan,
susunan soalnya adalah sebagai berikut:
No soal Abilitas yang diukur Tingkat kesulitan soal
1 Pengetahuan Mudah
2 Aplikasi Sedang
3 Pemahaman Mudah
4 Analisis Sedang
5 Evaluasi Sukar
6 Sintesis Sukar
7 Pemahaman Mudah
8 Aplikasi Sedang
9 Analisis Sedang
10 Sintesis Sukar

10
Kemudian soal tersebut diberikan kepada 20 orang siswa, dan tidak
seorang pun yang tidak mengisi seluruh pertanyaan tersebut. setelah
diperiksa, hasilnya adalah sebagai berikut:
No Banyaknya Banyaknya siswa Indeks B Kategori
soal siswa yang yang menjawab N soal
menjawab (N) betul (B)
1 20 18 0,9 Mudah
2 20 12 0,6 Sedang
3 20 10 0,5 Sedang
4 20 20 1,0 Mudah
5 20 6 0,3 Sukar
6 20 4 0,2 Sukar
7 20 16 0,8 Mudah
8 20 11 0,55 Sedang
9 20 17 0,85 Mudah
10 20 5 0,25 Sukar

Dari sebaran di atas ternyata ada tiga soal yang meleset, yakni soal nomor
3 yang semula diproyeksikan ke dalam kategori mudah, setela dicoba ternyata
termasuk ke dalam kategori sedang. Demikian, juga soal nomor 4 yang semula
diproyeksikan sedang ternyata termasuk ke dalam kategori mudah. Nomor soal
9 semula diproyeksikan sedang, ternyata termasuk ke dalam kategori mudah.
Sedangkan tujuh soal lainnya sesuai dengan proyeksi semula. Atas dasar
tersebut, ketiga soal di atas harus diperbaiki kembali.
- Soal no 3 diturunkan ke dalam kategori mudah
- Soal no 4 dinaikkan ke dalam kategori sedang
- Soal no 9 dinaikkan ke dalam kategori sedang

1. Menghitung Tingkat Kesukaran Untuk Soal Bentuk Uraian


Cara menghitung tingkat kesukaran untuk soal berbentuk uraian adalah
menghitung berapa persen siswa yang gagal menjawab benar atau ada di

11
bawah batas lulus (passing grade) untuk tiap-tiap soal. untuk menafsirkan
tingkat kesukaran soalnya dapat digunakan kreteria sebagai berikut:
a. Jika jumlah peserta didik yang gagal mencapai 27%, termasuk mudah.
b. Jika jumlah peserta didik yang gagal antara 28%, sampai dengan 72%,
termasuk sedang.
c. Jika jumlah peserta didik yang gagal mencapai 72%, keatas, termasuk
sukar.
Contoh:
Di sebuah Madrasah Ibtidaiyah 33 orang siswa di tes dengan lima
soal bentuk uraian. Skor maksimum ditentukan 10 dan skor minimum 0.
Jumlah siswa yang memperoleh nilai 0-5=10 orang (berarti gagal), nilai 6 =
12 orang dan nilai 7-10 = 11 orang.
10
Jadi, tingkat kesukaran (TK) = 33 × 100 % = 30,3%

Tingkat kesukaran 30,3 berada di antara 28 dan 72, berarti soal tersebut
termasuk sedang. Catatan: batas lulus ideal = 6 (skala 0 - 10)

2. Analisis Daya Pembeda


Daya pembeda (discriminating power) adalah pengukuran sejauh
mana suatu butir soal mampu membedakan peserta didik yang sudah
menguasai kompetensi dengan peserta didik yang belum/kurang menguasai
kompetensi berdasarkan kriteria tertentu. Semakin tinggi koefisien daya
pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan
antara peserta didik yang menguasai kompetensi dengan peserta didik yang
kurang menguasai kompetensi.7
Analisis daya pembeda mengkaji butir-butir soal dengan tujuan
mengetahui kesanggupan soal dalam membedakan siswa yang tergolong
mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah
prestasinya. Artinya, bila soal tersebut diberikan kepada anak yang mampu,
hasilnya menunjukkan prestasi yang tinggi; dan bila diberikan kepada siswa
yang lemah, hasilnya rendah. Tes dikatakan tidak memiliki daya pembeda

7
Zainal Arifin, Evaluasi Pembelajaran, (Bandung: Remaja Rosdakarya, 2012), h. 273
12
apabila tes tersebut jika diujikan kepada anak berprestasi tinggi, hasilnya
rendah, tetapi bila diberikan kepada anak yang lemah, hasilnya lebih tinggi.
Atau bila diberikan kepada kedua kategori siswa tersebut, hasilnya sama
saja. Dengan demikian, tes yang tidak memiliki daya pembeda, tidak akan
menghasilkan gambaran hasil yang sesuai dengan kemampuan siswa yang
sebenarnya. Sungguh aneh bila anak pandai tidak lulus, tetapi anak bodoh
lulus dengan baik tanpa dilakukan manipulasi oleh si penilai atau diluar
faktor kebetulan.8
Daya beda yang ideal adalah daya beda 0,40 ke atas. Namun untuk
ulangan ulangan harian, masih dapat ditolerir daya beda sebesar 0,20. 9
klasifikasidayapembeda:
D: 0,00 – 0,20 : jelek (poor)
D: 0,20 – 0,40 : cukup (satisfactory)
D: 0,40 – 0,70 : baik (good)
D: 0,70 – 1,00 : baik sekali (excellent)
D: negatif semuanya tidak baik, jadi semua butir soal yang
mempunyai nilai D negatif sebaiknya dibuang saja.10

Cara yang biasa digunakan dalam analisis daya pembeda adalah dengan
menggunakan tabel atau kriteria dari Rose dan Stanley,
Rumusnya adalah:
SR-ST
SR = siswa yang menjawab salah dari kelompok rendah
ST = siswa yang menjawab salah dari kelompok tinggi
Contoh:
Tes pilihan ganda dengan option 4 diberikan kepada 30 orang siswa.
Jumlah soal 15. Setelah diperiksa, datanya adalah sebagai berikut:

8
Nana Sudjana, Penilaian Hasil Proses Belajar, (Bandung: Remaja Rosdakarya, 2006),
h.141
9
WayanNurkancana&Sumartana, EvaluasiPendidikan, (Surabaya: Usaha Nasional, 1986),
h. 134
10
Daryanto, EvaluasiPendidikan, (Jakarta: RinekaCipta, 1999), h. 190
13
No Siswa yang menjawab Siswa yang menjawab SR – ST Ket
Soal salah kelompok rendah salah kelompok tinggi
(SR) (ST)
1 6 1 5
2 6 1 5
3 5 2 3
4 6 1 5
5 2 1 1
6 5 1 4
7 2 1 1
8 7 1 6
9 7 1 6
10 4 2 2
11 3 1 2
12 6 1 2
13 2 1 5
14 6 1 1
15 5 2 3
N = 30 orang N = 27 % dari 30 = 8
Kriteria yang digunakan dari tabel Ross dan Stanley adalah sebagai
berikut:
Jumlah testi N Option

(N) (27% N) 2 3 4 5

28 – 31 8 4 5 5 5

32 – 35 9 5 5 5 5

36 – 38 10 5 5 5 5

Dst.

Kriteria pengujian daya pembeda adalah sbb.:

14
Bila SR – ST sama atau lebih besar dari nilai tabel, artinya butir soal
itu mempunyai daya pembeda.
Dari data di atas, batas pengujian adalah 5, yakni yang pertama dalam tabel
di atas dengan jumlah N (28 – 31), n = 8 pada option 4.
Dengan demikian dapat disimpulkan sbb.:
No item SR – ST Batas nilai tabel Keterangan
1 5 5 Diterima
2 5 5 Diterima
3 3 5 Ditolak
4 5 5 Diterima
5 1 5 Ditolak
6 4 5 Ditolak
7 1 5 Ditolak
8 6 5 Diterima
9 6 5 Diterima
10 2 5 Ditolak
11 2 5 Ditolak
12 5 5 Diterima
13 1 5 Ditolak
14 5 5 Diterima
15 3 5 Ditolak

Dari kesimpulan diatas hanya soal nomor 1,2,4,8,9,12, dan 14 yang


memenuhi daya pembeda, sedangkan soal nomor lainnya tidak memiliki daya
pembeda.
Dari contoh diatas dapat disimpulkan bahwa cara menghitung daya
pembeda adalah dengan menempuh langkah sbb.:
a) Memeriksa jawaban soal semua siswa peserta tes
b) Membuat daftar peringkat hasil tes berdasarkan skor yang dicapainya
c) Menentukan jumlah sampel sebanyak 27 % dari jumlah peserta tes untuk
kelompok siswa pandai (peringkat atas) dan 27% untuk kelompok siswa
kurang (peringkat bawah)

15
d) Melakukan analisis butir soal, yakni menghitung jumlah siswa yang
menjawab salah dari semua nomor soal, baik pada kelompok pandai maupun
pada kelompok kurang
e) Menghitung selisih jumlah siswa yang salah menjawab pada kelompok
kurang dengan kelompok pandai (SR – ST)
f) Membandingkan nilai selisih yang diperoleh dengan nilai tabel Ross dan
Stanley
g) Menentukan ada tidaknya daya pembeda pada setiap nomor soal dengan
kriteria “memiliki daya pembeda” bila nilai selisih jumlah siswa yang
menjawab salah antara kelompok kurang dengan kelompok pandai (SR – ST)
sama atau lebih besar dari nilai tabel.
Butir soal yang tidak memiliki daya pembeda diduga terlalu mudah atau
terlalu sukar sehingga perlu diperbaiki atau diganti dengan pertanyaan lain.
Idealnya semua butir soal memiliki daya pembeda dan tingkat kesukaran.

3. Menganalisis Pengecoh
4. Pada saat membicarakan tes objektif bentuk multiple choice
5. item
6. tersebut untuk setiap butir
7. item
8. yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan
beberapa kemungkinan jawab, atau yang sering dikenal dengan istilah
option atau alternatif. Option atau alternatif itu jumlahnya berkisar
antara 3 sampai dengan 5 buah, dan

Pada saat membicarakan tentang tes objektif untuk multiple choice


item telah dikemukakan bahwa pada tes objektif bentuk multiple choice
item tersebut untuk setiap butir yang dikeluarkan dalam tes hasil belajar
telah dilengkapi dengan kemungkinan jawaban, atau yang sering dikenal
dengan istilah option atau alternatif.
Option atau alternatif itu jumlahnya berkisar antara tiga sampai
dengan lima buah. Dan dari kemungkinan-kemungkinan jawaban yang

16
terpasang pada setiap butir item itu, salah satu diantaranya adalah
merupakan jawaban betul (= kuncijawaban); sedangkan sisanya adalah
merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal
dengan istilah distraktor (pengecoh).11
Analisis distaraktor yang juga dikenal dengan istilah penyesat atau
penggoda adalah pilihan jawaban yang bukan merupakan kunci jawaban.
Pengecoh bukan sekedar pelengkap pilihan pengecoh diadakan untuk
menyesatkan siswa agar tidak memilih kunci jawaban. Pengecoh menggoda
siswa yang kurang begitu memahami materipelajaran untuk memilihnya.
Agar dapat melakukan fungsinya untuk mengecoh, maka pengecoh harus
dibuat semirip mungkin dengan kunci jawaban.12
Pengecoh dianggap baik bila jumlah peserta didik yang memilih
pengecoh itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung
dengan rumus:
keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban (opsi)
1 = bilangan tetap

Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu
(sesuai kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan
demikian, pengecoh tidak berfungsi.
Contoh:
Siswa MI yang berjumlah 50 orang di tes dengan 10 soal bentuk
pilihan ganda. Tiap soal memiliki 5 alternatif jawaban (a, b, c, d dan e).
Kunci jawaban (jawaban yang benar) soal nomor 8 adalah c. Setelah soal

11
Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada,
2006), h. 409
12
Purwanto, Evaluasi Hasil Belajar, (Yogyakarta: Pustaka Pelajar, 2009), h. 108
17
nomor 8 diperiksa untuk semua peserta didik, ternyata dari 50 orang siswa,
20 siswa menjawab benardan 30 siswa menjawab salah. Idealnya, pengecoh
dipilih secara merata, artinya semua pengecoh secara merata ikut
menyesatkan siswa. Perhatikan contoh soal nomor 8 berikut ini:

Alternatif Jawaban a B C d e
DistribusiJawabansiswa 7 8 20 7 8
IP 93% 107% ** 93% 107%
KualitasPengecoh ++ ++ ** ++ ++

Keterangan:
** : kunci jawaban
++ : sangat baik
+ : baik
- : kurang baik
_ : jelek
__ : sangat jelek
Pada contoh di atas, IP butir a, b, d, dan e adalah 93%, 107%, 93%
dan 107%.semua dekat dengan angka 100%, sehingga digolongkan sangat
baik sebab semua pengecoh itu berfungsi. Jka pilihan jawaban siswa
menumpuk pada satu alternatif jawaban, misalnya sebagai berikut:
Alternatif Jawaban a B C d e
Distribusi Jawaban siswa 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas Pengecoh _ - ** ++ _

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik,


pengecoh (e) dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka
pengecoh (a) dan (e) perlu diganti karena termasuk jelek, dan pengecoh (b)
perlu direvisi karena kurang baik. Adapun kualitas pengecoh berdasarkan
indeks pengecoh adalah:

18
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126% - 150%
Kurang baik IP = 26% - 50% atau 151% - 175%
Jelek IP = 0% - 25% atau 176% - 200%
Sangat jelek IP = lebih dari 200%
Untuk analisis pengecoh perlu dibuat table khusus agar setiap butir soal
diketahui berapa banyak siswa yang menjawa buntuk satiap option. Hal ini tentu
saja sangat memakan waktu dan tenaga. Tapi jika diolah dengan computer
menggunakan statistik SPSS maka akan cepat.

B. Manfaat Analisis Butir Soal


Kegiatan analisis butir soal memiliki banyak manfaat, diantaranya: (1) dapat
membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan, (2)
relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa
di kelas, (3) mendukung penulisan butir soal yang efektif, (4) secara materi dapat
memperbaiki tes di kelas, (5) meningkatkan validitas soal dan reliabilitas
(Anastasi&Urbina, 1997:172).
Nitko (1996:308-309) juga menguraikan manfaat kegiatan analisis butir
soal, di antaranya untuk: (1) menentukan apakah suatu fungsi butir soal sesuai
dengan yang diharapkan, (2) memberi masukan kepada siswa tentang kemampuan
dan sebagai dasar untuk bahan diskusi di kelas, (3) memberi masukan kepada guru
tentang kesulitan siswa, (4) memberi masukan pada aspek tertentu untuk
pengembangan kurikulum, (5) merevisi materi yang diukur, (6) meningkatkan
keterampilan penulisan soal.
Dari uraian di atas menunjukkan analisis butir soal memberikan manfaat:
(1) menentukan soal-soal yang cacat atau tidak berfungsi dengan baik; (2)
meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat kesukaran,
daya pembeda, dan pengecoh soal; (3) meningkatkan validitas soal dan reliabilitas;
(4) merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan
banyaknya anak yang tidak dapat menjawab butir soal tertentu.

19
20
BAB III
PENUTUP

A. Kesimpulan

Analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah


penulisan soal (tes tertulis, perbuatan, dan sikap). Ada beberapa teknik yang dapat
digunakan untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik
moderator dan teknik panel.
a) Teknik moderator
merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah.
b) Teknik Panel yakni suatu teknik menelaah butir soal berdasarkan kaidah
penulisan butir soal.

Analisis butir soal secara kuantitatif adalah analisis butir soal


didasarkan pada data empirik. Data empirik ini diperoleh dari soal yang telah
diujikan. Ada dua pendekatan dalam analisis secara kuantitatif, yaitu:
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui
informasi dari jawaban peserta didik tes guna meningkatkan mutu butir soal yang
bersangkutan dengan menggunakan teori tes klasik. Aspek yang perlu diperhatikan
dalam analisis butir soal secara klasik adalah setiap butir soal ditelaah dari segi:
tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban
(untuk soal bentuk obyektif) atau fungsi pengecoh pada setiap pilihan jawaban,
reliabilitas dan validitas soal

Analisis butir soal secara modern yaitu penelaahan butir soal dengan
menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini
merupakan suatu teori yang menggunakan fungsi matematika untuk
menghubungkan antara peluang menjawab benar suatu scal dengan kemampuan
siswa. Nama lain IRT adalah latent trait theory (LTT), atau characteristics curve
theory (ICC).

21
Manfaat menganalisis butir soal, yaitu:

1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik


2. Meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat
kesukaran, daya pembeda, dan pengecoh soal,
3. Meningkatkan validitas soal dan reliabilitas, dan
4. Merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai
dengan banyaknya anak yang tidak dapat menjawab butir soal tertentu.

B. Saran
Ketika kita menjadi pengajar dan pendidik, sebaiknya dalam penyusunan
instrument tes, seperti soal tes hendaknya disesuaikan dengan kriteria penyusunan
soal yang baik dan benar. Dimana, tingkat kesukarannya diperhatikan, daya
pembeda disesuaikan, pengecoh soal berfungsi dengan baik. Dan juga ketika diuji
dengan validitas maupun realibilitas sesuai dengan kualitas dan metode
pembelajaran yang menjunjung tinggi cita-cita guru Indonesia untuk mencerdaskan
kehidupan bangsa

22
DAFTAR PUSTAKA

Arifin, Zaenal. 2009. EVALUASI PEMBELAJARAN. Bandung; PT.REMAJA


ROSDAKARYA
Arikunto, Suharsimi. 2003. DASAR-DASAR EVALUASI PENDIDIKAN. 2012.
Jakarta; Bumi Aksara
Kusaeri dan Suprananto. 2012. PENGUKURAN DAN PENILAIAN PENDIDIKAN.
Jakarta; GRAHA ILMU
Sudaryono. DASAR-DASAR EVALUASI PEMBELAJARAN. Jakarta; GRAHA
ILMU
Purwanto, EVALUASI HASIL BELAJAR. 2009. Yogyakarta:Pustaka Belajar

Sulistyorini, EVALUASIPENDIDIKAN, 2009. Yogyakarta: Teras

Anas Sudijono. PENGANTAR EVALUASI PENDIDIKAN. 2006. Jakarta: Raja


Grafindo Persada.

23

Anda mungkin juga menyukai