Penyusunan Perangkat Tes
Penyusunan Perangkat Tes
Penyusunan Perangkat Tes
1
BAB VI
PENYUSUNAN PERANGKAT TES DAN PELAKSANAAN TES
159
mengevaluasi hasil belajar tersebut digunakan tes. Tes adalah cara (yang dapat
dipergunakan) atau prosedur yang (yang perlu di tempuh) dalam rangka pengukuran dan
penilaian di bidang pendidikan. Pengertian tes lebih ditekankan pada penggunaan alat
pengukuran. Menurut Sumadi Suryabrata (1984 :22) tes adalah pertanyaan-pertanyaan
yang harus dijawab dan atau perintah-perintah yang harus dijalankan, yang mendasakan
harus bagaimana peserta tes menjawab pertanyaan atau melakukan perintah-perintah itu,
penyelidik mengambil kesimpulan dengan cara membandingkannya dengan dengan
standar atau peserta tes yang lain.
Tes sebagai alat pengukur hasil belajar siswa, diharapkan mampu memberikan
informasi yang dapat dipertanggungjawabkan kebenarannya. Artinya, alat tes dapat
memberikan informasi tentang siswa sesuai keadaan yang mendekati sesungguhnya. Hal
itu penting karena informasi tersebut akan dipergunakan untuk mempertimbangkan dan
kemudian memutuskan berbagai kebijakan baik yang berkenaan dengan siswa maupun
kegiatan pengajaran secara umum.
Pengertian lain tentang tes, diungkapkan dalam kutipan dari beberapa pendapat para
ahli, yaitu :
1. Tes adalah suatu pengukuran yang berisi serangkaian pertanyaan, dimana
masing-masing pertanyaan memiliki jawaban yang benar (Ebel & Frisbie, 1986)
2. Tes merupakan serangkaian tugas-tugas yang digunakan dalam berbagai observasi (Sax,
1980)
3. Tes seringkali berkonotasi dengan adanya pertanyaan-pertanyaan standar yang perlu
dijawab ( Mahrens & Lehmann, 1973)
Tes hasil belajar adalah salah satu alat ukur yang paling banyak digunakan untuk
mengetahui hasil belajar seseorang dalam proses belajar-mengajar atau suatu program
pendidikan. Karena sedemikian banyak tes itu digunakan dalam dunia pendidikan, maka
ada baiknya seorang guru sebagai salah satu pihak yang berwenang menyusun tes hasil
belajar, hendaknya mengetahui karakteristik berbagai bentuk tes sebagai alat ukur hasil
belajar. Hopkins melalui Suyata (1997:18) menjelaskan bahwa penyusunan tes adalah
“lebih pada seni daripada ilmu” dan seni menyusun tes dapat dipelajari lewat petunjuk-
petunjuk yang jelas, praktek penyusunan yang terus menerus, serta umpan balik dari apa
yang disusunnya.
Sebagai alat ukur dalam penilaian hasil belajar, tes digunakan untuk mengukur
perkembangan atau kemajuan belajar peserta didik, setelah mereka mengikuti proses
160
pembelajaran. Dalam menyusun tes hasil belajar maka terlebih dahulu perlu diperhatikan
beberapa hal yang terkait dengan penilaian hasil belajar peserta didik antara lain
(BSNP,2007):
1. Penilaian ditujukan untuk mengukur pencapaian kompetensi; tes hasil belajar harus
dapat mengukur secara jelas hasil belajar (learning outcomes) yang telah ditetapkan
sesuai dengan tujuan.
2. Penilaian menggunakan acuan kriteria yakni berdasarkan pencapaian kompetensi
peserta didik setelah mengikuti proses pembelajaran;
3. Bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi, sehingga
betul-betul cocok untuk mengukur hasil belajar yang diinginkan sesuai dengan tujuan
tes itu sendiri.
4. Penilaian dilakukan secara menyeluruh dan berkelanjutan; merupakan sampel yang
representatif dari populasi bahan pelajaran yang telah diajarkan, sehingga dapat
dianggap mewakili seluruh performance yang telah diperoleh selama peserta didik
mengikuti suatu unit pengajaran.
5. Hasil penilaian ditindaklanjuti dengan program remedial bagi peserta didik yang
pencapaian kompetensinya di bawah kriteria ketuntasan dan program pengayaan bagi
peserta didik yang telah memenuhi kriteria ketuntasan. Hasil penilaian dapat dijadikan
alat untuk mencari informasi yang berguna untuk memperbaiki cara belajar siswa dan
cara mengajar guru itu sendiri.
6. Penilaian harus sesuai dengan kegiatan pembelajaran; tes hasil belajar harus didesain
sesuai dengan kegunaannya untuk memperoleh hasil yang diinginkan.
Menurut Suharsimi (2003) tes yang baik harus mempunyai syarat-syarat sebagai
berikut: 1) Harus efisien (Parsimony) 2) Harus baku (Standardize) 3) Mempunyai norma
4) Objektif 5) Valid (Sahih) 6) Reliabel (Andal ). Oleh sebab itu untuk memperoleh tes
yang baik, tes tersebut harus di uji cobakan terlebih dahulu dan hasilnya di analisis
sehingga memenuhi syarat-syarat tersebut di atas. Hal ini sejalan dengan pedoman yang
dikeluarkan BSNP (2007) yang berkaitan dengan syarat-syarat penilaian sebagai berikut:
1. Sahih (valid), yakni penilaian didasarkan pada data yang mencerminkan kemampuan
yang diukur;
2. Objektif, yakni penilaian didasarkan pada prosedur dan kriteria yang jelas, tidak
dipengaruhi subjektivitas penilai;
161
3. Adil, yakni penilaian tidak menguntungkan atau merugikan peserta didik, dan tidak
membedakan latar belakang sosial-ekonomi, budaya, agama, bahasa, suku bangsa, dan
jender;
4. Terpadu, yakni penilaian merupakan komponen yang tidak terpisahkan dari kegiatan
pembelajaran;
5. Terbuka, yakni prosedur penilaian, kriteria penilaian, dan dasar pengambilan
keputusan dapat diketahui oleh pihak yang berkepentingan;
6. Menyeluruh dan berkesinambungan, yakni penilaian mencakup semua aspek
kompetensi dengan menggunakan berbagai teknik yang sesuai, untuk memantau
perkembangan kemampuan peserta didik;
7. Sistematis, yakni penilaian dilakukan secara berencana dan bertahap dengan mengikuti
langkah-langkah yang baku;
8. Menggunakan acuan kriteria, yakni penilaian didasarkan pada ukuran pencapaian
kompetensi yang ditetapkan;
9. Akuntabel, yakni penilaian dapat dipertanggungjawabkan, baik dari segi teknik,
prosedur, maupun hasilnya.
10. Reliabel, sering diterjemahkan dengan istilah keajegan (stability) atau kemantapan
(consystence). Maka sebuah tes dapat dikatakan reliabel apabila hasil-hasil pengukuran
yang digunakan dengan menggunakan tes tersebut secara berulangkali terhadap obyek
yang sama, senantiasa menunjukkan hasil yang tetap sama atau sifatnya ajeg dan stabil.
Guna mengetahui, apakah sebuah tes hasil belajar telah memiliki reliabilitas yang tinggi
ataukah rendah, dapat digunakan tiga jenis pendekatan, yaitu: (1) pendekatan single test
atau single trial, (2) pendekatan test retest, dan (3) pendekatan alternate forms.
Agar tes yang disiapkan oleh setiap guru menghasilkan bahan ulangan/ujian yang
sesuai dengan syarat-syarat tersebut di atas, maka harus dilakukan langkah-langkah berikut,
yaitu:
1. Menentukan Tujuan Tes/soal
Penyusunan tes diawali dengan menentukan tujuan yang ingin dicapai dengan
menyelenggarakan tes tersebut. Dalam tes bahasa pada umumnya tes disusun sebagai
tes hasil belajar. Tes hasil belajar yang mempunyau tujuan utama yaitu untuk
menentukan tingkat penguasaan siswa terhadap bahan pelajaran yang telah diajarkan
sampai tahap tertentu hingga tes tersebut diselenggarakan. Selain tujuan utama tersebut
162
biasanya tes dilakukan juga dengan tujuan untuk mengetahui kesulitan belajar siswa,
dan kelemahan butir-butir tes.
2. Penentuan jenis dan bentuk soal
Dalam menentukan jenis tes yang akan digunakan perlu memperhatikan beberapa
faktor yaitu jumlah peserta tes, banyak sedikitnya bahan yang harus dicakup, waktu
yang tersedia, kemampuan pengajar untuk mengembangkan soal, kemudahan
penyelenggaraan, kemudahan pelaksanaan koreksi dan penilaian. Semua itu perlu
diperhatikan dengan seksama agar jenis dan bentuk tes yang digunakan dapat benar-
benar mengukur tingkat kemampuan dan pemahaman siswa.
Faktor-faktor tersebut di atas mempunyai peranan yang sangat banyak pada
penentuan soal yang akan dibuat. Misalnya soal esai, mempunyai kemudahan dalam
penyusunan soalnya tetapi dalam pengoreksian akan membutuhkan waktu yang lama
dan memerlukan pikiran yang tidak sedikit. Soal esai berbanding terbalik dengan soal
pilihan ganda, soal pilihan ganda dalam penyusunanya memang agak berat dan
memakan waktu yang lama dan dalam jumlah yang banyak, tetapi pada akhirnya ketika
memeriksa hasil jawaban yang dikerjakan akan sangat mudah dan cepat.
3. Menyusun Kisi-kisi
Kisi-kisi merupakan deskripsi mengenai ruang lingkup dan isi materi yang akan
diujikan. Tujuan penyusunan kisi-kisi sebelum membuat soal adalah untuk menentukan
ruang lingkup dan tekanan soal yang setepat-tepatnya sehingga dapat menjadi petunjuk
dalam menulis soal. Dengan adanya penyusunan kisi-kisi maka akan sangat mudah
dalam mendeteksi poin mana yang tepat digunakan sebagai tes dari
berbagai kompetensi dasar.
4. Penulisan Butir Soal
Tahap penulisan butir soal dimulai dengan menentukan jumlah soal yang perlu
disusun. Penulisan butir tes pertama-tama mungkin menghasilakan butir soal yang
memeliki berbagai kekurangan dan kelemahan. Dengan kenyataan demikian maka
sebagai persediaan penyusunan butir soal diperlukan jumlah yang lebih besar dari
klebutuhan karena pada akhirnya butir-butir tersebut akan dipilih yang sesuai dengan
kompetensi yang diujikan. Selain membuat butir-butir soal perlu juga disusun kunci
jawaban yang nantinya akan digunakan sebagi acuan penilaian. Setelah mendapatkan
butir-butir soal selanjutnya kita harus memilih lagi butir soal mana yang sekiranya tepat
untuk dipakai.
163
5. Pemantapan Butir Soal atau Validasi Soal dan Kunci Jawaban
Usaha pemantapan yang paling baik dan bertanggung jawab dalam
pengembangan tes dan butir-butirnya dapat diusahakan melalui rangkaian uji coba. Uji
coba biasanya dilakukan hanya pada pengembangan tes berstandar yang luas jangkauan
pernggunaanya dan penting kegunaanya. Usaha pemantapan ini bertujuan untuk
mengetahui kesesuain, kelebihan, dan kekurangan dari soal yang telah disusun.
Setelah soal benar-benar teruji validitasnya, kemudian kunci jawaban yang sudah
dibuat bersamaan pembuatan butir soal diuji kembali kebenaranya dan kemudian
disusun sesuai dengan urutan soal yang telah dibuat.
168
4) dalam menyusun butir-butir soal tes uraian hendaknya diusahakan agar
pertanyaan-pertanyaan atau perintah-perintahnya jangan dibuat seragam,
melainkan dibuat secara bervariasi.
5) kalimat soal hendaknya disusun secara ringkas, padat dan jelas.
6) suatu hal penting yang tidak boleh dilupakan oleh pemberi tes (guru) ialah, agar
dalam menyusun butir-butir soal yang harus dijawab atau dikerjakan oleh
peserta tes, hendaknya dikemukakan pedoman tentang cara mengerjakan atau
menjawab butir-butir soal tersebut.
f. Penggunaan Tes Bentuk Uraian
169
beberapa ketentuan yang perlu diikuti dan dipenuhi. Pemilihan format tes uraian
menjadi pertimbangan lagi apabila mengingat betapa tidak mudahnya pemberian
skor dengan prinsip pengukuran yang benar. Berikut adalah rambu-rambu
bagaimana menyusun tes uraian dengan memenuhi kriteria dan prinsip-prinsip
pengukuran.
171
dengan masalah reliabilitas tes, yang makin banyak jumlah soal, makin
tinggi koefisien reliabilitas soal tersebut.
d) Disarankan untuk tidak menulis butir soal bentuk pilihan pada soal tes
uraian, kecuali penulis soal dapat memberikan bobot skor yang sama pada
soal-soal yang diberikan.
e) Soal disusun secara berseri dari yang sederhana sampai ke yang kompleks,
dari soal yang relatif mudah, makin lama makin sulit, dan diakhiri dengan
soal yang paling sulit, yaitu soal evaluasi.
172
h. Penskoran Tes Uraian
Dari beberapa jenis tes subyektif, tes uraian merupakan jenis tes yang paling
tinggi tingkat subyektivitasnya, karena jawabannya yang relatif panjang, beragam isi
dan kemasannya. Djiwandono (2008: 59) menjelaskan bahwasanya penskoran tes
subyektif dalam bentuk esei tidak dilakukan dengan menggunakan kunci jawaban
seperti pada penskoran tes obyektif, melainkan dengan menggunakan rambu-rambu
penskoran (scoring guide), yang memuat pedoman, kadang-kadang sekadar kriteria,
yang menyebutkan jawaban yang diharapkan dalam hal relevansi isi, susunan,
bahasa yang digunakan termasuk ejaan, bahkan panjang dan pendeknya jawaban,
dan lain-lain. Kadang-kadang disertai proporsi skor yang disediakan bagi masing-
masing unsur berdasarkan tingkat pentingnya suatu unsur yang diskor.
Kriteria penskoran tes esei secara analitik:
1) Relevansi isi jawaban peserta tes dengan jawaban yang diharapkan.
2) Kecukupan isi jawaban peserta tes tentang masalah yang ditanyakan.
3) Kerapian dan kejelasan penyusunan isi jawaban peserta tes.
4) Lain-lain yang perlu dan relevan dengan bidang kajian dan titik berat sasaran tes
(dengan uraian dan rinciannya), misalnya penggunaan bahasa yang lugas dan
mudah dimengerti.
173
Tabel 26. Penskoran pada Tes Uraian
RINCIAN TINGKAT KETERCAPAIAN
NO KRITERIA SKOR
KRITERIA
Isi sepenuhnya sesuai dengan pertanyaan 4
Isi sebagian besar sesuai dengan pertanyaan 3
1 Relevansi isi
Isi sedikit sesuai dengan pertanyaan 2
Isi jawaban tidak sesuai dengan pertanyaan 1
Jawaban tuntas 4
Jawaban hampir tuntas 3
2 Ketuntasan
Jawaban kurang tuntas 2
Jawaban jauh dari tuntas 1
Amat sistematis 4
Mendekati sistematis 3
3 pengorganisasian
sedikit sistematis 2
Tidak sistematis 1
174
4) Buat Poin-Poin Penting untuk Setiap Jawaban Soal
Agar penskoran dapat dilakukan dengan lebih obyektif, untuk setiap soal
perlu dibuat daftar poin-poin penting yang perlu ada.
178
(4) Tabel,gambar,grafik,peta atau yang sejenisnya disajikan dengan jelas dan terbaca
Perhatikan gambar berikut !
(6) Rumusan pokok soal dan pilihan jawanban harus merupakan pernyataan yang diperlukan
saja. Artinya apabila terdapat rumusan atau pernyataan yang sebetulnya tidak diperlukan,
maka rumusan atau pernyataan itu dihilangkan saja.
179
Contoh soal yang kurang baik :
Mesin USG (Ultrasonografi) menggunakan gelombang suara berfrekuensi sangat tinggi
untuk membuat gambar di layar komputer. USG kehamilan antara lain bermanfaat sebagai
berikut, kecuali… .
A. Diagnosis dan konfirmasi awal kehamilan
B. Melihat posisi dan kondisi plasenta
C. Memeriksa denyut jantung janin.
D. Menghitung usia ibu hamil dan beratnya.
Contoh soal yang lebih baik :
Manfaat dari USG (Ultrasonografi) pada kasus kehamilan adalah, kecuali… .
A. Diagnosis dan konfirmasi awal kehamilan
B. Melihat posisi dan kondisi plasenta
C. Memeriksa denyut jantung janin.
D. Menghitung usia ibu hamil dan beratnya.
(7) Pokok soal jangan memberi petunjuk ke arah jawaban yang benar.
Artinya, pada pokok soal jangan sampai terdapat kata, kelompok kata, atau ungkapan
yang dapat memberikan petunjuk ke arah jawaban yang benar.
Contoh soal yang kurang baik
Generator listrik di Pusat Listrik Tenaga Air (PLTA) Sigura-gura digerakkan oleh … .
A. tenaga air*
B. tenaga uap panas
C. tenaga gas bumi
D. tenaga solar
(8) Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda.
Artinya, pada pokok soal jangan sampai terdapat dua kata atau lebih yang mengandung
arti negatif. Hal ini untuk mencegah terjadinya kesalahan penafsiran siswa terhadap arti
pernyataan yang dimasud. Untuk keterampilan bahasa, penggunaan negatif ganda
diperbolehkan bila aspek yang akan diukur justru pengertian tentang negatif ganda itu
sendiri.
180
Contoh soal kurang baik
Nama bangun geometri di bawah ini bukan merupakan bangun ruang kecuali … .
A. segitiga samakaki
B. segitiga samasisi
C. prisma segitiga*
D. bujur sangkar
Penjelasan : pokok soal diperbaiki menjadi : “Nama bangun geometri di bawah ini yang
merupakan bangun ruang adalah … .
(9) Pilihan jawaban harus homogen dan logis ditinjau dari segi materi.
Artinya, semua pilihan jawaban berasal dari materi yang sama seperti yang ditanyakan
oleh pokok soal, penulisannya harus setara, dan semua pilihan jawaban harus berfungsi.
Contoh soal kurang baik.
Fungsi berikut yang mempunyai nilai minimum -4 adalah ….
A. f(x) = x² + 3x – 10 C. f(x)= x³ + 4 x² - 5x
B. f(x) = x² + x – 6 D. f(x) = x² + 6x + 5 *
Penjelasan :
Pilihan c tidak homogen dari segi materi karena mempergunakan fungsi berderajar tiga,
sedangkan pilihan lainnya merupakan fungsi berderajat dua.
Contoh Soal yang lebih baik.
Fungsi berikut yang memiliki nilai minimum - 4 adalah ….
A. f(x) = x² + 3x – 10 C. f(x)= x² - 4 x² - 5x
B. f(x) = x² + x – 6 D. f(x) = x² + 6x + 5 *
181
D. Mengetahui bila Anda memiliki lebih dari satu bayi (kembar), karena Kehamilan
kembar meningkatkan risiko hambatan pertumbuhan janin
Penjelasan : pilihan D diperbaiki menjadi : “Mengetahui bila Anda memiliki lebih dari
satu bayi (kembar)”
(11) Pilihan jawaban jangan mengandung pernyataan “semua pilihan jawaban di atas salah
atau benar”.
Artinya, dengan adanya pilihan jawaban seperti ini, maka secara materi pilihan jawaban
berkurang satu karena pernyataan ini bukan merupakan materi yang ditanyakan dan
pernyataan itu menjadi tidak homogen.
Contoh soal Kurang baik.
Peristiwa menempelnya serbuk sari di kepala putik pada proses penyerbukan dinamakan
….
A. peleburan sel
B. pembuahan
C. fertilisasi
D. semua jawaban salah *
Penjelasan:
Pilihan jawaban kurang baik karena mengandung pernyataan “semua jawaban salah”.
Hal ini akan menyebabkan secara materi pilihan jawaban berkurang satu, sebab
pernyataan tersebut bukan merupakan materi yang ditanyakan.
Perbaikan soal:
Peristiwa menempelnya serbuk sari di kepala putik pada proses penyerbukan dinamakan
….
A. persarian*
B. pembuahan
C. fertilisasi
D. peleburan sel
(12) Pilihan jawaban berbentuk angka atau waktu harus disusun berdasarkan urutan besar
kecilnya nilai angka atau kronologis waktunya.
Artinya, pilihan jawaban yang berbentuk angka harus disusun berdasarkan besar kecilnya
nilai angka, dari nilai angka paling kecil berurutan sampai nilai angka yang paling besar,
182
dan sebaliknya. Demikian juga pilihan jawaban yang menunjukkan waktu harus disusun
secara kronologis. Penyusunan secara urut dimaksudkan untuk memudahkan siswa
melihat pilihan jawaban.
Contoh soal yang kurang baik
Hasil dari 4³ adalah … .
A. 7
B. 64*
C. 12
D. 81
Penjelasan : pilihan jawaban diurutkan dari kecil ke besar atau sebaliknya, seperti 7, 12,
64*, 81 atau 81, 64*, 12, 7
(13) Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
(a) Penggunaan kalimat (harus ada unsur subjek, predikat dan harus menghindari
pernyataan yang hanya berupa anak kalimat)
Contoh soal kurang baik.
Di dalam perkembang biakan rhizopus secara generatif adalah dengan cara
pembentukan ….
A. askospora C. zigospora*
B. basidiospora D. sporangiospora
Penjelasan :
Subjek tidak jelas karena diantar oleh kata “di dalam”. Oleh karena itu kata
“Di dalam” dihilangkan.
(b) Pemakaian kata (Pilihlah kata-kata yang tepat dengan pokok masalah yang itanyakan.
Penulisan kata perlu disesuaikan dengan kebenaran penulisan baku)
Contoh soal kurang baik.
Salah satu paktor yang mempengaruhi harga konstanta kesetimbangan reaksi kimia
adalah ….
A. Volume
B. Tekanan
C. Suhu*
D. Sipat sat
Penjelasan :
183
Penulisan kata baku untuk : paktor, konsetanta, sipat,
sat adalah faktor, konstanta, sifat dan zat.
184
dihilangkan atau yang harus diisi oleh murid ini adalah merupakan
pengertian yang kita minta dari siswa.
b) Petunjuk penyusunan
Saran-saran dalam menyusun tes bentuk isian ini adalah sebagai berikut:
(1) Perlu selalu diingat bahwa kita tidak dapat merencanakan lebih dari
satu jawaban yang kelihatan logis.
(2) Jangan mengutip kalimat/pernyataan yang tertera pada buku/ catatan.
(3) Diusahakan semua tempat kosong hendaknya sama panjang.
(4) Diusahakan hendaknya setiap pernyataan jangan mempunyai lebih dari
satu tempat kosong.
(5) Jangan mulai dengan tempat kosong.
185
4) Agar tes obyektif di samping mengungkap aspek ingatan atau hafalan juga dapat
mengungkap aspek-aspek berpikir yang lebih dalam, maka dalam merancang dan
menyusun butir-butir item tes obyektif hendaknya pemberi tes (guru)
menggunakan alat bantu berupa Tabel Spesifikasi Soal yang sering dikenal dengan
istilah kisi-kisi soal atau blue print.
5) Dalam menyusun kalimat soal-soal obyektif, bahasa atau istilah-istilah yang
dipergunakan hendaknya cukup sederhana, ringkas, jelas dan mudah dipahami
oleh peserta tes.
6) Untuk mencegah terjadinya silang pendapat atau perdebatan antara peserta tes
dengan pemberi tes (guru), dalam menyusun butir-butir soal tes obyektif
hendaknya diusahakan sungguh-sungguh agar tidak ada butir-butir yang dapat
menghasilkan penafsiran ganda atau kerancuan dalam pemberian jawabannya.
7) Cara memenggal atau memutus kalimat, membubuhkan tanda-tanda baca seperti
titik, koma dan sebagainya, penulisan tanda-tanda aljabar seperti kuadrat, akar dan
sebagainya, hendaknya ditulis secara benar, usahakan agar tidak terjadi kesalahan
ketik atau kesalahan cetak, sehingga tidak mengganggu konsentrasi peserta tes
dalam memberikan jawaban soal.
8) Dengan cara bagaimanakah peserta tes seharusnya memberikan jawaban terhadap
butir-butir soal yang diajukan dalam tes, hendaknya diberikan pedoman atau
petunjuknya secara jelas dan tegas.
g. Pembuatan Tabel Spesifikasi Soal Sebagai Salah Satu Upaya dalam Mengatasi
Kelemahan Tes Obyektif
1) Pengertian tabel Spesifikasi
Tabel spesifikasi yang juga dikenal dengan istilah kisi-kisi soal atau blue print
adalah sebuah tabel analisis yang di dalamnya dimuat rincian materi tes dan tingkah
laku beserta proporsi yang dikehendaki oleh pemberi tes (guru), di mana pada tiap
petak (sel) dari tabel tersebut diisi dengan angka-angka yang menunjukkan
banyaknya butir soal yang akan dikeluarkan dalam tes hasil belajar bentuk obyektif.
Tabel spesifikasi itu memuat informasi-informasi yang berhubungan dengan
butir-butir soal tes yang akan disusun. Di dalamnya, dimuat tentang bagian-bagian
dari materi pelajaran yang akan diukur (diteskan), taraf kompetensi yang akan
diungkap, banyaknya butir soal untuk masing-masing bagian dan keseluruhan tes,
taraf kesukaran masing-masing soal dan sebagainya.
186
TEKNIK PELAKSANAAN TES HASIL BELAJAR
Dalam praktek, pelaksanaan tes hasil belajar dapat diselenggarakan secara tertulis
(tes tertulis), dengan secara lisan (tes lisan) dan dengan tes perbuatan.
1. Teknik Pelaksanaan Tes Tertulis
Dalam melaksanakan tes tertulis ada beberapa hal yang perlu mendapat perhatian, yaitu
sebagaimana dikemukakan berikut ini.
b. agar dalam mengerjakan soal tes para peserta tes mendapat ketenangan, seyogyanya
ruang tempat berlangsungnya tes dipilihkan yang jauh dari keramaian, kebisingan,
suara hiruk pikuk dan lalu lalangnya orang.
c. ruangan tes harus cukup longgar, tidak berdesak-desakan, tempat duduk diatur
dengan jarak tertentu yang memungkinkan tercegahnya kerja sama yang tidak sehat
di antara peserta tes.
d. ruangan tes sebaiknya memiliki system pencahayaan dan pertukaran udara yang
baik.
e. jika dalam ruangan tes tidak tersedia meja tulis atau kursi yang memiliki alas tempat
penulis, maka sebelum tes dilaksanakan hendaknya sudah disiapkan alat berupa alat
tulis yang terbuat dari triplex, hardboard atau bahan lainnya.
f. agar peserta tes dapat memulai mengerjakan soal tes secara bersamaan, hendaknya
lembar soal-soal tes diletakkan secara terbalik.
g. dalam mengawasi jalannya tes, pengawas hendaknya berlaku wajar.
h. sebelum berlangsungnya tes, hendaknya sudah ditentukan lebih dahulu sanksi yang
dapat dikenakan kepada peserta tes yang berbuat curang.
i. sebagai bukti mengikuti tes, harus disiapkan daftar hadir yang harus ditandatangani
oleh seluruh peserta tes.
j. jika waktu yang ditentukan telah habis, hendaknya peserta tes diminta untuk
menghentikan pekerjaannya dan secepatnya meninggalkan ruangan tes.
k. untuk mencegah timbulnya berbagai kesulitan di kemudian hari, pada Berita Acara
Pelaksanaan Tes harus dituliskan secara lengkap, berapa orang peserta tes yang hadir
dan siapa yang tidak hadir, dengan menuliskan identitasnya (nomor urut, nomor
induk, nomor ujian, nama dan sebagainya), dan apabila terjadi penyimpangan-
penyimpangan atau kelainan-kelainan harus dicatat dalam berita acara pelaksanaan
tes tersebut.
187
2. Teknik Pelaksanaan Tes Lisan
Beberapa petunjuk praktis berikut ini kiranya akan dapat dipergunakan sebagai
pegangan dalam pelaksanaan tes lisan.
a. sebelum tes lisan dilaksanakan, seyogyanya pemberi tes (guru) sudah melakukan
inventarisasi berbagai jenis soal yang akan diajukan kepada peserta tes dalam tes
lisan tersebut.
b. setiap butir soal yang telah ditetapkan untuk diajukan dalam tes lisan itu, juga harus
disiapkan sekaligus pedoman atau ancar-ancar jawaban betulnya.
c. jangan sekali-kali menentukan skor atau nilai hasil tes lisan setelah seluruh peserta
tes menjalani tes lisan. Skor atau nilai hasil tes lisan harus sudah dapat ditentukan
di saat masing-masing peserta tes selesai dites.
d. tes hasil belajar yang dilaksanakan secara lisan hendaknya jangan sampai
menyimpang atau berubah arah dari evaluasi menjadi diskusi.
e. dalam rangka menegakkan prinsip obyektivitas dan prinsip keadilan, dalam tes
yang dilaksanakan secara lisan itu, pemberi tes (guru) hendaknya jangan sekali-kali
"memberikan angin segar" atau "memancing-mancing" dengan kata-kata, kalimat-
kalimat atau kode-kode tertentu yang sifatnya menolong peserta tes tertentu alasan
"kasihan" atau karena pemberi tes (guru) menaruh "rasa simpati" kepada peserta tes
yang ada dihadapinya itu.
f. tes lisan harus berlangsung secara wajar.
g. sekalipun acapkali sulit untuk dapat diwujudkan, namun sebaiknya pemberi tes
(guru) mempunyai pedoman atau ancar-ancar yang pasti.
h. pertanyaan-pertanyaan yang diajukan dalam tes lisan hendaknya dibuat bervariasi.
i. sejauh mungkin dapat diusahakan agar tes lisan itu berlangsung secara individual
(satu demi satu).
189
5. Memotivasi dan membimbing belajar
Hasil tes seyogyanya dapat memotivasi untuk lebih berprestasi, dan dapat
menjadi pembimbing bagi mereka untuk belajar. Ketika hasil tes ditunjukkan, biasanya
siswa berminat sekali untuk mengetahuinya, guru dapat memanfaatkan minat yang besar
tersebut untuk memberikan dorongan kepada siswa untuk belajar lebih giat. Dalam
penggunaan ini, tes yang dimaksud adalah tes formatif.
6. Perbaikan kurikulum dan program pendidikan
Perbaikan kurikulum dan program pendidikan yang baik hendaknya
didasarkan pada hasil penilaian pendidikan yang tepat pula, sehingga hal itu
tidak sia-sia belaka.
7. Pengembangan ilmu
Hasil tes, pengukuran dan penilaian yang tepat sudah jelas akan
dapat memberikan konstribusi bagi pengembangan teori dasar pendidikan.
8. Memberikan laporan kepada orang tua.
Laporan diberikan pada orang tua siswa, dengan tujuan agar dia memiliki
gambaran oyektif tentang perkembangan anaknya, untuk kemudian menyikapinya.
Dalam penggunaan ini, tes yang dimaksud adalah tes sumatif. Pemberian laporan ini
dilakukan setelah hasil tes tersebut dipadukan dengan hasil tes-tes formatif atau sub
sumatif sebelumnya.
190
2. Tes selalu menimbulkan rasa cemas peserta tes.memang sampai bats tertentu rasa cemas
itu dibutuhkan untuk dapat mencapai prestasi terbaik, tetapi tes acapkali menimbulkan
rasa cemas yang tidak perlu, yang justru dapat menghambat seseorang mampu
mendemonstrasikan kemampuan terbaiknya.
3. Tes acapkali justru menghukum peserta didik yang kreatif.karena tes itu selalu menuntut
jawaban yang sudah ditentukan pola dan isinya, maka tentu saja hal itu tidak memberi
ruang gerak yang cukup bagi anak yang kreatif.
4. Tes selalu terikat pad kebudayaan tertentu. Tidak ada tes hasil belajar yang bebas budaya.
Karena itu kemampuan peserta tes untuk memberi jawaban terbaik turut ditentukan oleh
kebudayaan penyusun tes.
5. Tes hanya mengukur hasil belajar yang sederhana dan yang remeh. Hampir tidak pernah
ada tes hasil belajar yang mampu mengungkapkan tingkah laku peserta didik secara
menyeluruh, yang justru menjadi tujuan utama pendidikan formal apapun.
Karena banyak kritik yang tajam dari masyarakat terhadap tes hasil pendidikan, maka
para pendidik harus dapat melakukan tes dengan penuh tanggung jawab. Untuk itu perlu
ditegakan beberapa etika tes, yang membedakan tes yang etik dan tindakan yang tidak etik
dalam pelaksanaan tes secara professional. Praktek tes hasil belajar yang etik terutama
mencangkup empat hal utama :
1. Kerahasiaan Hasil Tes
Setiap pendidik dan pengajar wajib melindungi kerahasiakan hasil tes, baik secara
hasil individual maupun secara kelompok. Hasil tes hanya dapat disampaikan kepada
orang lain bila :
a) Ada izin dari peserta didik yang bersangkutan atau orang yang bertanggung jawab
terhadap peserta didik (bagi peserta didik yang belum dewasa). Jadi dengan
demikian praktek menempelkan hasil tes di papan pengumuman dengan identitas
jelas peserta tes, merupakan pelanggaran terhadap etika ini.
b) Ada tanda-tanda yang jelas terhadap hasil tes tersebut menunjukan gejala yang
membahayakan dirinya atau membahayakan kepentingan orang lain.
c) Bila penyampaian hasil tes tersebut kepada orang lain jelas-jelas menguntungkan
peserta tes.
2. Keamanan tes
Tes merupakan alat pengukur yang hanya dapat digunakan secara professional.
Dengan demikian tes tidak dapat digunakan diluar batas-batas yang ditentukan oleh
191
profesionalisme pekerjaan guru. Dengan demikian maka setiap pendidik harus dapat
menjamin keamanan tes, baik sebelum maupun sesudah digunakan.
3. Interpretasi Hasil Tes
Hal yang paling mengandung kemungkinan penyalahgunaan tes adalah
penginterpretasian hasil tes secara salah. Karena itu maka interpretasi hasil tes harus
diikuti tanggung jawab professional. Bila hasil tes diinterpretasi secara tidak patut,
dalam jangka panjang akan dapat membahayakan kehidupan peserta tes.
4. Penggunaan Tes
Tes hasil belajar haruslah digunakan secara patut. Bila tes hasil belajar tertentu
merupakan tes baku, maka tes tersebut harus digunakan di bawah ketentuan yang
berlaku bagi pelaksanaan tes baku tersebut harus digunakan dibawah ketentuan yang
berlaku bagi pelaksanaan tes baku tersebut. Tak ada tes baku yang boleh digunakan
diluar prosedur yang ditapakan oleh tes itu sendiri.
Disamping beberapa prinsip seperti yang diuraikan di atas, ada beberapa petunjuk
praktis yang hendaknya ditaati oleh pendidik dalam tes:
1. Pelaksaan tes hendaknya diberi tahu terlebih dahulu kepada peserta tes. Hanya karena
pertimbangan tertentu, yang sangat penting yang dapat membenarkan pendidik tidak
memberi tahu terlebih dahulu kepada peserta tes tentang tes yang akan dilaksanakan.
Bahkan kisi-kisi tes sebaiknya diberi tahu kepada peserta tes sebelum melaksanakan
tes.
2. Sebaiknya pendidik menjelaskan cara menjawab yang dituntut dalam suatu tes.
Petunjuk menjawab tes bukanlah sesuatu yang harus dirahasiakan. Petunjuk yang
bersifat menjebak harus dihindari.
3. Sebaiknya pendidik justru memotivasi peserta tes mengerjakan tesnya secara baik.
Jangan sampai seorang pendidik justru menakut-nakuti peserta didik.
4. Bila pendidik menggunakan tes baku, maka hendaknya pendidik tersebut bertanggung
jawab penuh terhadap keamanan tes tersebut. Tidak ada tes baku yang boleh digunakan
dalam latihan.
5. Seorang pendidik dapat menggunakan hasil tes untuk mengidentifikasi kekuatan dan
kelemahan peserta tes, asalkan hal tersebut tetap menjadi rahasia peserta tes dan
pendidik yang bersangkutan.
6. Guru hendaknya menghindari diri dari keterlibatan dalam bimbingan tes yang dapat
diperkirakan akan menggangu proses hasil belajar peserta didik. Hal ini menjadi
192
penting bila guru yang bersangkutan justru terlibat dalam penyusunan butir tes yang
digunakan.
7. Adalah tidak etik bila seorang guru mengembangkan butir soal atau perangkat soal yang
paralel dengan suatu tes baku dengan maksud untuk digunakan dalam bimbingan tes.
8. Adalah tidak etik untuk mendiskriminasikan peserta didik tertentu atau kelompok
tertentu yang boleh mengikuti suatu tes atau melarang mengikuti tes.
9. Adalah tidak etik untuk memperpanjang waktu atau menyingkat waktu yang telah
ditentukan oleh petunjuk tes.
10. Guru tidak boleh meningkatkan rasa cemas peserta tes dengan penjelasan yang tidak
perlu.
Jumlah soal
Penyebaran kunci jawaban = + 3
Jumlah pilihan jawaban
8. Menentukan soal inti (anchor items) sebanyak 10 % dari jumlah soal dalam satu paket.
Soal inti ini diperlukan apabila soal yang dirakit terdiri dari beberapa tes paralel.
Tujuannya adalah agar antar tes memiliki keterkaitan yang sama. Penempatan soal inti
dalam paket tes diletakkan secara acak.
9. Menentukan besarnya bobot setiap soal (untuk soal bentuk uraian)
Bobot soal adalah besarnya angka yang ditetapkan untuk suatu butir soal dalam
perbandingan (ratio) dengan butir soal lainnya dalam satu perangkat tes. Penentuan
besar kecilnya bobot soal didasarkan atas tingkat kedalaman dan keluasan materi yang
ditanyakan atau kompleksitas jawaban yang dituntut oleh suatu soal. Untuk
mempermudah perhitungan/penentuan nilai akhir, jumlah bobot keseluruhan pada satu
perangkat tes uraian ditetapkan 100. Perakit soal harus dapat mengalokasikan besarnya
bobot untuk setiap soal dari bobot yang telah ditetapkan. Bobot suatu soal yang sudah
ditetapkan pada satu perangkat tes dapat berubah bila soal tersebut dirakit ke dalam
perangkat tes yang lain.
194
bersangkutan dibagi skor maksimum kali bobot. Tabel konversi ini merupakan tabel
konversi sederhana atau klasik.
Untuk memudahkan penggunaan tabel konversi, kita ingat proses penyamaan
skala atau konversi alat ukur suhu yang didasarkan pada konversi rumus yang sudah
standar, misal skala pengukuran: Celcius (titik awal 00 titik didih 1000). Reamur (titik
awal 00 titik didih 800), Fahrenheit (titik awal 320 titik didih 2120 ), Kelvin (titik awal
2370 titik didih 3730). Masing-masing skala pengukuran ini bukan untuk dibandingkan
atau sebagai penentu kelulusan atau sebagai pengatrol nilai, namun masing-masing
memiliki skala sendiri-sendiri. Keberadaan skala ini tidak bisa dikatakan bahwa orang
yang menggunakan skala pengukuran Celcius dan Reamur akan selalu dirugikan
karena keduanya memiliki nilai 0 sampai dengan 4 (bila acuan kriterianya 4,01),
sedangkan orang yang menggunakan Fahrenheit dan Kelvin selalu diuntungkan karena
titik awalnya 32 dan 237. Demikian pula dengan konversi nilai dalam ulangan atau
ujian. Guru atau panitia ujian mau menggunakan konversi yang mana. Dalam ilmu
pengukuran, konversi dapat disusun melalui konversi biasa dan konversi yang
terkalibrasi dengan model respon butir. Apabila UN atau US sudah mempergunakan
konversi model respon butir, semua nilai peserta didik harus mengacu pada model
konversi ini, tidak membandingkan dengan konversi lain/biasa.
Konversi biasa (model pengukuran secara klasik) penggunaannya biasa digunakan
guru di sekolah, yaitu untuk memperoleh nilai murni peserta didik. Bila menghendaki
skor maksimum 10 digunakan rumus (skor perolehan: skor maksimum) x 10 dan bila
menggunakan skor maksimum 100 digunakan nilai konversi dengan rumus (skor
perolehan: skor maksimum) x 100 atau bila menggunakan skor maksimum 4
digunakan nilai konversi dengan rumus (skor perolehan : skor maksimum) x 4.
Konversi seperti ini memiliki dua kelemahan, pertama adalah bahwa setiap butir soal
dihitung memiliki tingkat kesukaran yang sama. Artinya peserta didik manapun yang
menjawab benar 40 dari 50 butir soal dalam satu tes (terserah nomor butir soal berapa
yang benar, apakah nomor 1 benar, nomor 2 salah, nomor 3 benar atau sebaliknya dan
seterusnya, yang penting benar 40 soal) peserta didik yang bersangkutan akan
memperoleh nilai 8 (untuk konversi skor maksimum 10), 80 (untuk konversi skor
maksimum 100) 0,2 (untuk konversi skor maksimum 4). Kelemahan kedua adalah
bahwa tingkat kesukaran butir soal tidak ditempatkan/dikalibrasi pada skala yang
sama. Artinya bahwa butir-butir soal tidak disusun berdasarkan tingkat kesukarannya
dan kemampuan peserta didik sehingga model konversi ini belum bisa menentukan
195
nilai murni peserta didik yang sebenarnya. Seharusnya hanya peserta didik yang
memiliki kemampuan tinggi (misal pada skala kemampuan 1, kemampuan 2,
kemampuan 3) yang dapat menjawab benar semua soal dalam tes pada skala yang
bersangkutan atau tingkat kesukaran butir (mudah, sedang, sukar) sesuai dengan
kemampuan peserta didik yang bersangkutan. Apabila sekolah mempergunakan
konversi biasa seperti ini justru akan merugikan peserta didik yang memiliki
kemampuan lebih tinggi.
Konversi yang terkalibrasi adalah konversi nilai yang disusun berdasarkan
kemampuan peserta didik dari tingkat kesukaran butir soal yang terkalibrasi dengan
model Rasch (Item Response Theory). Untuk memahami model terkalibrasi ini
diperlukan pengertian berikut. Setiap jumlah jawaban yang benar soal, misal 1 sampai
dengan 50, masing-masing butir memiliki tingkat kemampuan (untuk teori klasik tidak
ada). Tingkat kemampuan ini diperoleh dari rumus model Rasch P= (e (-)) : (1 + e (-
): P adalah peluang menjawab benar satu butir soal. E = 2,7183, = tingkat
kemampuan peserta didik, dan = tingat kesukaran butir soal. Kemudian nilai abilitas
(misal -3,00 sampai dengan +3,00) ditransformasi ke dalam skala 0-10, 0-100, atau 0-
4. Misal untuk dapat ditransformasi ke dalam skala 0-100 diperlukan rata-rata 50 dan
standar deviasi 5, sehingga untuk membuat tabel konversi mempergunakan rumus
Y=50+5X. Y=nilai peserta didik dan X adalah nilai abilitas. Dengan rumus inilah
konversi terkalibrasi dapat disusun. Jadi dalam konversi yang terkalibrasi skalanya
didasarkan dua hal penting, yaitu tingkat kesukaran dan tingkat kemampuan peserta
didik. Soal ditempatkan pada tingkat kesukaran dan kemampuan peserta didik yang
telah disamakan skalanya. Bila tes sudah disamakan skalanya, siapapun yang
mengambil tes pada paket yang mudah, sedang, dan sukar, masing-masing tes masih
berada pada skala yang sama dan bisa dibandingkan. Oleh karena itu, tes yang
diberikan kepada peserta didik sudah selayaknya harus sesuai dengan tingkat
kemampuan peserta didik. Apabila kemampuan peserta didik dalam memahami materi
yang diajarkan guru itu tinggi (sudah tercapai target kompetensinya), peluang
menjawab benar soal pasti tinggi. Namun sebaliknya bila kemampuan peserta didik
dalam memahami materi yang diajarkan guru itu rendah (belum tercapai target
kompetensinya), peluang menjawab benar soal pasti rendah. Apakah tesnya berbentuk
tes lisan, tertulis (soalnya berbentuk pilihan ganda, uraian, isian, dll.), atau perbuatan.
Model Rasch merupakan salahsatu model dalam teori respon butir yang
196
menitikberatkan pada parameter tingkat kesukaran butir soal. Model ini telah
digunakan di berbagai kalangan seperti untuk sertifikasi ujian kedokteran di USA,
sejumlah program penilaian sekolah di USA, program penilaian di Australia, studi
matematik dan science internasional ketiga, National School English Literacy Survey
di Australia, equating tes English di Provinsi Guandong Cina, dan beberapa tes
diagnostic. Model ini banyak digunakan orang sebagai pendekatan analitik standard
untuk kalibrasi instrumen karena modelnya sederhana, elegant, hemat, atau efektif dan
efisien.
Konversi nilai berdasarkan Model Rasch memiliki keunggulan bila
dibandingkan dengan konversi nilai berdasarkan model pengukuran secara klasik.
Keterbatasan model pengukuran secara klasik adalah seperti berikut. (1) Tingkat
kemampuan dalam teori klasik adalah “true score”. Jika tes sulit artinya tingkat
kemampuan peserta didik rendah. Jika tes mudah artinya tingkat kemampuan peserta
didik tinggi. (2) tingkat kesukaran soal didefinisikan sebagai proporsi peserta didik
dalam kelompok yang menjawab benar soal. Mudah/sulitnya butir soal tergantung
pada kemampuan peserta didik yang dites dan keberadaan tes yang diberikan. (3) Daya
pembeda, reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta
didik. Artinya bahwa konversi nilai berdasarkan teori tes klasik memiliki kelemahan,
yaitu (1) tingkat kesukaran dan daya pembeda tergantung pada sampel; (2) penggunaan
metode dan teknik untuk desain dan analisis tes dengan memperbandingkan
kemampuan peserta didik pada pembagian kelompok di atas, tengah, bawah.
Meningkatnya validitas skor tes diperoleh dari tingkat kesukaran tes dihubungkan
dengan tingkat kemampuan setiap peserta didik; (3) konsep reliabilitas tes
didefinisikan dari istilah tes paralel; (4) tidak ada dasar teori untuk menentukan
bagaimana peserta didik memperoleh tes yang sesuai dengan kemampuan peserta
didik; (5) Standar kesalahan pengukuran hanya berlaku untuk seluruh peserta didik.
Disamping itu, tes klasik telah gagal memberi kesimpulan yang tepat terhadap
beberapa masalah testing seperti: desain tes (statistik butir klasik tidak memberitahu
penyusun tes tentang lokasi maksimum daya pembeda butir pada skala skor tes),
identifikasi item bias, dan equating skor tes (tidak suksesnya pada item bias dan
equating skor tes karena sulit menentukan kemampuan yang sebenarnya di antara
kelompok). Kelebihan model Rasch atau teori respon butir secara umum adalah
bahwa: (1) model ini tidak berdasarkan grup dependen, (2) skor peserta didik
dideskripsikan bukan tes dependen, (3) model ini menekankan pada tingkat butir soal
197
bukan tes, (4) model ini tidak memerlukan paralel tes untuk menentukan reliabilitas
tes, (5) model ini merupakan suatu model yang memberikan suatu pengukuran
ketepatan untuk setiap skor tingkat kemampuan. Tujuan utama teori respon butir
adalah memberikan invariant pada statistik soal dan estimasi kemampuan. Oleh karena
itu, kelebihan teori respon butir adalah: (1) responden dapat diskor pada skala yang
sama, (2) skor responden dapat dibandingkan pada dua atau lebih bentuk tes yang
sama, (3) semua bentuk soal memperoleh perlakuan melalui cara yang sama, (4) tes
dapat disusun sesuai keahlian berdasarkan tingkat kemampuan yang akan dites.
RANGKUMAN