Penilaian Karya Seni Lukis
Penilaian Karya Seni Lukis
Penilaian Karya Seni Lukis
ABSTRACT
This study aim at developing an assessment specification for childrens painting in
elementary schools by developing a valid and reliable assessment instrument to measure the
performance of childrens painting. The development of this assessment instrument was
intended to guide the painting teachers in elementary schools in carrying out assessment
objectively.
This study is a development research which uses quantitative and qualitative approaches.
The development process was carried out in five phases, covering initial study, defining,
designing, developing, and dissemination phases. The subjects of this study were elementary
schools teachers and pupils in the first grade to third grades and painting teachers in
Muhammadiyah Sapen Yogyakarta elementary school, MIN (Islamic State Elementary School)
Tempel, and Langen Sari Yogyakarta elementary school. The construct of the instrument
consisting of instrument for process, product, self, and group assessment , was developed based
on the suggestion of art education experts, childrens art painting experts, evaluation experts,
and painting experts. The reliability coefficient of the assessment instrument was computed
based on
generalizeability theory developed by Crick and Brennan consisting of G
(generalized study) and D (decision study) theories with the variance of person, rater, item,
person rater interaction, and error components using Genova computer package program, and
interrater Cohens Kappa fomula.
The validity evidence is obtained through three focus group discussions and one seminar.
The average of cofficients genova is 0.71 and the average of Cohens Cappa is 0.73, this value
are higher than the minimum criteria, 0.70.
Keyword: Childrens painting, reliability , generalizeability theory, G (generalized study), and
D (decision study).
hasil belajar karya peserta didik . Hal ini sesuai dengan kompetensi yang dituntut
sebagai seorang guru yaitu menyelenggarakan penilaian dan evaluasi proses dan hasil
belajar. Penilaian proses antara lain melalui pengamatan terhadap perubahan perilaku
dan sikap untuk menilai perkembangan kompetensi peserta didik (PP Nomor 19, 2005).
Penelitian ini didasarkan pada asumsi bahwa pemahaman guru-guru terhadap
hakekat pendidikan seni terutama pelaksanaan pembelajaran seni lukis sekolah dasar
belum mantap sehingga mereka cenderung membimbing secara tidak tepat dan menilai
secara subjektif. Karena kurangnya pemahaman tersebut, guru kurang berani dalam
menilai karya anak. Dengan demikian masalah subjektivitas menjadi masalah yang
tidak dapat dihindari dalam penilaian karya lukis anak. Subjektivitas dalam penilaian
karya seni lukis anak pada dasarnya disebabkan oleh kesulitan guru dalam menentukan
kriteria penilaian, padahal pelajaran melukis bagi anak-anak adalah pelajaran yang
menyenangkan. Untuk memecahkan permasalahan penilaian proses dan produk tersebut
perlu digunakan pendekatan penilaian yaitu performance assessment.
Subjektivitas dalam penilaian karya seni lukis anak pada dasarnya disebabkan
oleh kesulitan guru dalam menentukan kriteria penilaian padahal pelajaran melukis bagi
anak-anak adalah pelajaran yang menyenangkan. Hal ini diakui oleh dua puluh orang
guru yang dapat ditemui dalam studi awal penelitian ini.
2. Rumusan Masalah
Masalah penelitian ini dapat dirumuskan sebagai berikut:
1. Bagaimana spesifikasi instrumen penilaian asesmen performan karya seni lukis
anak di sekolah dasar?
2. Bagaimana karakteristik instrumen penilaian asesmen performan karya seni
lukis anak yang mencakup validitas, reliabilitas, dan keterpakaian di sekolah
dasar?
3. Tujuan Penelitian
Tujuan penelitian ini adalah untuk:
1. Mengembangkan spesifikasi instrumen penilaian asesmen performan karya seni
lukis anak di sekolah dasar.
2.
dimensi, sehingga seni lukis merupakan karya yang terlepas dari unsur-unsur kegunaan
praktis. Lebih jelas lagi seni lukis merupakan suatu pengucapan pengalaman artistik
seseorang yang dicurahkan ke dalam bidang dua dimensi dengan menggunakan garis,
warna, bidang, dan tekstur. Karya seni lukis yang juga sering disebut dengan lukisan,
umumnya dibuat di atas kain kanvas berpigura dengan bahan cat minyak, cat akrilik,
atau bahan lainnya. Objek dan gaya lukisan sangatlah beragam. Karya seni lukis
bergaya naturalis (potret) dibuat persis seperti objek aslinya, seperti pemandangan alam,
figur manusia, binatang, atau benda lainnya. Karya lukis bergaya ekspresionis (penuh
perasaan) memiliki objek benda atau figur yang dibuat dengan garis dan warna yang
bernuansa emosi pelukisnya. Lukisan bergaya abstrak berasal dari khayalan kreatif
senimannya, bentuknya tidak nyata, tersamar, bahkan kurang dimengerti oleh orang
awam, tetapi mengandung berbagai alternatif rupa yang baru (Sachari, 2004: 10).
Dalam pembuatan sebuah karya seni lukis, ada beberapa hal yang perlu
diperhatikan, yaitu elemen seni lukis (garis, bidang, ruang, tekstur, warna, dan kaidahkaidah komposisi.
2. Seni Lukis bagi Anak Usia Sekolah Dasar
a.
dapat memberikan suatu pandangan tingkah laku dan apresiasi pertumbuhan dan
perkembangan bervariasi yang dialami anak. Dengan lukisan anak dapat dibaca jiwa
dan kehidupan anak-anak yang bersifat polos. Goresannya spontan dan bebas: miring
kesana kemari. Penggunaan warna sesuai dengan suasana hatinya, sangat berani: merah
kuning, biru, hitam dan seterusnya. Apa yang dituangkan dalam tema lukisannya adalah
apa yang dilihatnya sesuai dengan lingkungan hidup yang nyata dan khayalnya, sesuai
dengan kacamata anak.
Dalam proses melukis, anak tidak ada rasa takut. Kegiatan seni di samping
penting bagi perkembangan kognitif juga memberikan rangsangan bagi pertumbuhan
persepsi, emosional, social, dam krativitas anak. Dengan kegiatan ini perlu diketahui
apa yang dapat dikembangkan pada diri anak secara maksimal, karena lukisan anak itu
sendiri mencerminkan segi kejiwaan anak.
Peran pendidikan seni yang multi dimensional pada dasarnya dapat
mengembangkan kemampuan dasar manusia, seperti fisik, perceptual, intelektual,
emosional, social, kreativitas, dan estetik (Lowenfeld, 1982) Demikian juga pada
multiple intelegences Gardners yang membagi karakteristik kecerdasan menjadi
sembilan
jalur
yaitu:
verbal/linguistic,
interpersonal,
visual/spasial,
pikiran dan perasaan dalam ujud karya seni rupa atau lukisan tanpa terbatas pada apa
yang terlihat dengan mata kepala saja, melainkan lebih pada apa yang mereka mengerti,
pikirkan atau khayalkan. Perkembangan menggambar anak menurut Ricci (1960: 302307):
The child starts drawing with an interlacing network of lines and then moves on to
simple representational foms which become more detailed with age. He recognized in
these simple forms that the child draws a description of the subject according to his
knowledge of that subject and not according to its visual appearance.
Dengan demikian anak menggambar mulai yang paling sederhana yaitu dengan
garis-garis dan berkembang menjadi bentuk-bentuk yang representasional dan detail
sesuai dengan perkembangan usia sesuai dengan pengetahuannya sendiri bukan menurut
penampakan visual.
Banyak sedikitnya unsur pada lukisan sangat tergantung pada keasyikan
pemikiran dan fantasinya, lebih banyak yang akan mereka ceritakan maka lebih banyak
pula bentuk yang akan dimunculkannya. Dengan penalaran anak wajar dan spontan
maka hasilnya tampak sungguh naif. Ungkapan pribadinya muncul melalui bentukbentuk dengan makna simbolik tertentu, intuitif, dan lebih dekat pada sifat bermain.
Selanjutnya,
sesuai
pendapat
para
ahli
(Lansing,
1976:
138-139),
perkembangan gambar anak pada dasarnya dapat disederhanakan menjadi tiga tahap
pokok: (1) tahap coreng-moreng (umur dua sampai empat tahun), (2) tahap figurative
(umur tiga sampai dua belas tahun), dan (3) tahap keputusan artistic (umur dua belas
tahun ke atas).
c.
nama dari kelompok mata pelajaran estetika yang dilaksanakan pada tingkat sekolah
dasar. Dalam Peraturan Pemerintah Nomor 19 (Peraturan Pemerintah, 2005) disebutkan
tujuan mata pelajaran Seni Budaya dan Ketrampilan adalah untuk meningkatkan
sensitifitas, kemampuan mengekspresikan dan kemampuan mengapresiasi keindahan
dan harmoni. Dalam mata pelajaran tersebut, dua kegiatan yang saling terkait satu sama
lain yaitu apresiasi dan kreasi, termasuk di dalamnya yang bersifat rekreatif
(performance).
Kegiatan apresiasi, dimaksudkan melatih perkembangan kepekaan rasa estetik
peserta didik. Peserta didik berperan sebagai pengamat yang menghayati gejala
keindahan yang ada dalam karya seni kemudian menanggapinya. Dalam hal ini tentunya
keterlibatan intelektual dan pengalaman estetik peserta didik sangat berperan.
Kegiatan kreasi mempunyai makna menciptakan karya seni yang baru,
sedangkan rekreasi menampilkan/menggelar karya seni. Pada kegiatan ini peserta didik
secara aktif menghasilkan suatu karya seni (lukisan, ilustrasi, relief, dan sebagainya)).
Dalam hal ini keterlibatan intelektual peserta didik sangat dominan. Misalnya dalam
pembuatan karya seni lukis dikenal adanya aspek bentuk yang diubah menjadi struktur.
Hal ini memerlukan kerja intelektual. Jacques Maritain dalam Sumardjo (2000: 51)
menyebutkan adanya ekspresi intelektual yang diperlukan untuk mengubah bentuk
menjadi struktur.
Standar Kompetensi dan Kompetensi Dasar mata pelajaran Seni Budaya dan
Kerajinan Sekolah Dasar berdasarkan Kurikulum Tingkat Satuan Pendidikan 2006
yang meliputi kegiatan apresiasi dan kreasi. Pada kompetensi dasar disebutkan bahwa
mengekspresikan diri melalui karya gambar ekspresif dan mengekspresikan diri melalui
gambar imajinatif, dilaksanakan pada kelas satu semester dua, kelas dua semester satu
dan semester dua, juga kelas tiga semester dua.
3. Karakteristik Penilaian dalam Pendidikan Seni
Penilaian seni lukis anak meliputi penilaian proses dan penilaian hasil atau
produk. Dengan demikian untuk memecahkan permasalahan penilaian proses dan hasil
karya peserta didik tersebut perlu digunakan pendekatan penilaian yaitu performance
assessment.
Dengan melakukan kegiatan asesmen dapat diketahui perubahan yang terjadi
pada anak didik. Sedangkan penilaian kinerja (performance assessment) menurut Berk
sebagai berikut: performance assessment is the process of gathering data by systematic
observation for making decisions about an individual (Berk, 1986: ix). Ada lima unsurunsur kunci dalam definisi yang dikemukakan oleh Berk, yaitu:
1. Performance assessment is a process, not a test or any single measurement
device. 2. The focus of this process is data gathering, using a variety of instruments
and strategies. 3. The data are collected by means of systematic observation. 4. The
data are integrated for the purpose of making specific decisions. 5. The subject of
the decision making is the individual, usually an employee or a student, not a
program or product reflecting a groups activity. (Berk, 1986: ix).
Selanjutnya Berk mengatakan bahwa dalam Performance assessment selalu
terkait dengan adanya rubrik penilaian yang merupakan bagian dari
Performance
assessment: Subsumed under the rubric Performance assessment are a host of other
related terms that are often used synonymously with it.
Melengkapi pendapat tersebut, Zainul (2005: 4) menyatakan bahwa asesmen
kinerja secara sederhana didefinisikan sebagai penilaian terhadap proses perolehan,
penerapan, pengetahuan dan ketrampilan, melalui proses pembelajaran yang
menunjukkan kemampuan peserta didik dalam proses dan produk.
a.
dalam berkreasi membuat karya seni lukis. Menurut Conrad (1964: 271) the processes
of evaluation help to build guides and to define and clarity the purposes and
accomplishments of the educational processes.In art education, the evaluation
prosesses are natural parts of art activity.Karena proses penilaian membangun
bimbingan terhadap peserta didik dan memperjelas tujuan dan pemenuhan dalam proses
pembelajaran, maka penilain proses sangat diperlukan apalagi proses penilaian
merupakan bagian yang alami dari aktivitas seni.
Sesungguhnya kemampuan-kemampuan peserta didik yang dikembangkan
dalam pendidikan seni rupa lebih banyak dalam bentuk penampilan yang sulit diukur
dengan tes, yaitu terutama penampilan-penampilan peserta didik dalam aspek afektif
7
dan psikomotorik. Dengan instrumen teknik non tes akan diperoleh data akurat dengan
tidak kehilangan aktivitas yang dilakukan oleh peserta didik. Non tes digunakan tatkala
pengertian evaluasi tidak sekedar identik dengan testing tetapi mempunyai pengertian
yang lebih luas yaitu suatu proses penentuan nilai-nilai fenomena-fenomena yang secara
edukasional relevan (Eisner, 1972: 204).
b.
kompetensi peserta didik dalam membuat karya cipta seni lukis. Dalam hal ini pendidik
memfokuskan perhatiannya pada hasil karya lukis yang diciptakan oleh peserta didik
yang tentunya tidak terlepas dari proses penciptaannya. Oleh karena itu kegiatan
penilaian memerlukan kriteria. Conrad (1964: 271) menjelaskan bahwa:
Evaluation criteria are not rigid. New criteria must be formulated for each group of
children because children are constantly growing and changing in their thinking,
their abilities, and their knowledges. The processes of evaluation help to build
guides and to define and clarity the purposes and accomplishments of educational
processes.
Dengan demikian penetapan kriteria harus disesuaikan dengan perkembangan usia
anak dan kriteria tidak bersifat kaku.
Kriteria untuk melakukan penilaian produk karya seni lukis
cukup sulit
karena adanya keragaman cara pandang terhadap karya seni. Salah satunya pendapat
Aspin dalam Ross (1982: 66) yang menyatakan bahwa: Work of art is correctly
described as unique particulars, but the description prompts the question: how can
something which is unique generate criteria for evaluating other unique objects? Sifat
unik ini
mempunyai sifat
sehingga sulit menerapkan kriteria yang sama untuk menilai karya yang lain.
Perdebatan-perdebatan yang sering terjadi karena perbedaan pemahaman,
meminjam dari penilaian kritik, Pepper (1973: 451) berpendapat bahwa bisa saja
perbedaan yang terjadi disebabkan oleh pandangan kontekstual yang tidak sama, karena
masing-masing kepentingan tidak ada titik temu. Disini penilaian dapat dilihat sebagai
suatu proses intersubjektif, dan setiap proses intersubjektif selalu mendatangkan
konflik. Namun demikian, Heyfron (1986: 56) berpendapat bahwa:
that the arts are not fundamentally different from other subjects in the
curriculum (e.g. science) and that a high degree of consensus about criteria
appropriate for judging art work is not only conceptually consistent with the
8
notion of art, but also practicably desirable. It contends that judgements about the
merits of art work can be justified with reference to publicly agreed criteria.
Hal ini menunjukkan bahwa penilaian dari suatu pekerjaan seni tidak hanya
konsisten secara konseptual tetapi diperlukan juga praktisnya. Baik buruknya pekerjaan
seni dibenarkan dengan adanya referensi
khalayak umum.
Lebih jauh lagi dalam dokumen APU (Aesthetic Development, 1983: 5)
menyebutkan bahwa: What matters most in the arts as in science, is that judgements
and interpretations should be informed with considerable consensus about the criteria
to be applied when determining quality. Dengan demikian pada waktu menentukan
kualitas karya diperlukan kriteria-kriteria yang merupakan konsensus dan sudah
dipertimbangkan terlebih dahulu.
4. Validitas dan Reliabilitas Instrumen Pengukuran
Validitas dan reliabilitas merupakan hal utama yang harus dipenuhi untuk
menentukan kualitas suatu instrumen penilaian.
a. Validitas
Validitas instrumen dapat dimaknai sebagai ketepatan dalam memberikan
interpretasi terhadap hasil pengukurannya. Sesungguhnyalah persoalan validitas
instrumen berhubungan dengan pertanyaan, apakah suatu instrumen mampu
menggambarkan ciri-ciri, sifat-sifat, atau aspek apa saja yang akan diukur, sesuai
dengan keadaan yang sebenarnya.
Relevans dan accuracy, adalah dua makna yang terkandung dalam konsep
validitas. Relevans menunjuk pada kemampuan instrumen untuk memerankan fungsi
untuk apa instrumen dimaksudkan. Sedangkan accuracy menunjuk pada ketepatan
instrumen mengidentifikasi aspek-aspek yang akan diukur secara tepat, menggambarkan
keadaan yang sebenarnya.
Secara umum terdapat tiga macam validitas, yaitu validitas konstruk (construct
validity), validitas isi (content validity), dan validitas criteria (criterion-related validity).
(Kerlinger, 2000: 686; Babbie, 2004: 144-145). Validitas konstruk menunjuk pada
sejauh mana instrumen yang disusun mampu menghasilkan butir-butir pertanyaan yang
dilandasi oleh konsep teoritik tertentu. Validitas konstruk disusun berdasarkan pada
konsep teori yang sudah mapan dan pertimbangan-pertimbangan yang rasional. Untuk
memantapkan validitas konstruk dibutuhkan expert judgment yaitu masukan,
9
pertimbangan, dan kritik dari para ahli terkait. Validitas isi berhubungan dengan
kemampuan instrumen untuk menggambarkan secara tepat domain prilaku yang diukur.
Ada dua makna dalam validitas isi yaitu, validitas butir dan validitas sampling. Validitas
isi berhubungan dengan pertanyaan seberapa jauh butir-butir instrumen mencerminkan
keseluruhan isi dari aspek yang hendak diukur. Langkah selanjutnya pada validitas isi
adalah menjabarkan dalam aspek yang terperinci selanjutnya didiskripsikan indikatorindilkatornya. Selanjutnya dimintakan pertimbangan kolega atau ahli yang berkompeten
melalui forum diskusi antar ahli (focus group discasion), untuk memperoleh masukan,
saran, kritik, dan evaluasi guna menyempurnakan instrumen yang disusun.
Berdasarkan uraian di atas, dapat ditarik suatu pengertian bahwa untuk
pengembangan afektif dapat digunakan semua jenis validitas atau salah satu jenis
validitas. Pada penelitian ini digunakan validitas isi dan validitaas konstruk.
b. Reliabilitas
Reliabilitas instrumen menunjukkan tingkat kestabilan, konsestensi, keajegan, dan
atau kehandalan instrumen untuk menggambarkan gejala seperti apa adanya. Secara
konsep instrument yang reliabel adalah apabila digunakan terhadap subjek yang sama
akan menunjukkan hasil yang sama, walaupun dalam waktu dan kondisi yang berbeda.
Salah satu pendekatan dasar untuk mengukur reliabilitas adalah stabilitas.
Stabilitas diperoleh dengan mengkorelasikan skor siswa dari dua kali pelaksanaan tes,
menggunakan korelasi intraklas (interclass correlation). Penggunaan korelasi intraklas
dimaksudkan untuk memberikan indeks mengukur kesamaan pasangan skor dalam
hubungannya dengan variabilitas total dari seluruh skor (Fernandes, 1984:35). Cara lain
untuk menilai reliabilitas adalah dengan menggunakan teknik intereter yaitu, dua
peneliti menggunakan alat ukur yang sama untuk mengukur kemampuan seseorang
kemudian hasil pengukuran tersebut dikorelasikan.
10
C. Metode penelitian
1.
Model Pengembangan
Penelitian ini merupakan penelitian pengembangan yang menggunakan
digunakan untuk
menghasilkan instrumen yang baku dalam menilai karya lukis anak. Pendekatan ini
digunakan, karena pengembangan instrumen penilaian seni lukis anak harus dimulai
dengan membangun konstruk
interpretasi hasil
pengukuran. Konsep validitas bersifat unity concept yang dibangun dari teori yang
melandasi konsep pengembangan, instrumen, dan bukti empirik . Bukti validitas harus
memiliki validitas interpretasi hasil pengukurannya. Bukti validitas interpretasi hasil
pengukuran instrumen penilaian karya seni lukis anak memerlukan data kualitatif dan
kuantitatif. Data kualitatif yang diperlukan merupakan landasan teoritis bangunan
konstruk instrumen, yang pengumpulannya dimulai sejak awal pengembangan konstruk,
melalui berbagai penelusuran dan diskusi pakar seni lukis dan pendidikan sen lukis,
termasuk praktisi seni lukis dan guru seni lukis di sekolah dasar. Data kuantitatif yang
berupa hasil penilaian pendidik terhadap karya lukis anak diperlukan untuk memperoleh
informasi tentang besarnya koefisien keandalan hasil ukur instrumen.
Kriteria pengembangan konstruk instrumen mencakup aspek proses dan hasil
karya lukis anak. Setiap aspek diurai menjadi sejumlah indikator. Setelah indikator
disusun menjadi item yang dirakit menjadi instrumen utuh. Instrumen diujicobakan
kepada sejumlah pendidik
modifikasi
model
Semmel & Semmel dengan model Plomp, yaitu dimulainya dengan tahap preliminary
investigation yang dikemukakan oleh Plomp dan research & development menurut
Semmel (1974:5). Tahapan pengembangannya meliputi: define, design, develop, dan
dissemination atau yang dikenal dengan 4D.
Pada tahap define, kegiatan yang dilakukan adalah merumuskan definisi
konstruk, dalam hal ini adalah kriteria karya lukis anak, dan mengkaji konsep instrumen
11
karya lukis anak berdasarkan teori dan hasil penelitian yang relevan. Kegiatan yang
dilakukan tahap design adalah telaah konstruk instrumen oleh para pakar dan guru
sekolah dasar seni budaya (seni lukis). Tahap develop, kegiatan yang dilakukan adalah
mengembangkan indikator, deskripsi, kriteria, dan
Terakhir, tahap dissemination, kegiatan yang dilakukan adalah uji coba instrumen
terhadap guru sekolah dasar. Pengujian
konstruk
instrumen dilakukan
melalui
pendapat para pakar bidang seni lukis, pakar bidang penilaian pendidikan, dan para
praktisi lapangan. Pertemuan dengan kelompok yang berbeda dilakukan tiga kali untuk
memperoleh masukan yang lebih banyak sehingga diperoleh hasil yang dapat
diandalkan. Secara rinci model pengembangan instrumen disajikan pada Gambar
berikut ini
P.INVEST
DEFINE
DESIGN
N
DEVELOPE
DISSEMINATE
12
2. Subjek Penelitian
Subjek penelitian adalah peserta didik yang terdiri dari tiga sekolah, Sekolah
Dasar Muhammadiyah Sapen, Sekolah Dasar Negeri Langensari , dan Sekolah Dasar
MIN Tempel, masing-masing kelas, diambil 20 siswa. Dengan demikian secara
keseluruhan jumlah peserta didik ada 180 yang dijadikan subjek penelitian. Ketiga
sekolah tersebut tersebar pada kota Yogyakarta dan kabupaten Sleman, dengan asumsi
bahwa kedua kabupaten/kota tersebut dapat mewakili/representatif DIY. Dari ketiga
sekolah tersebut dipilih kelas satu, dua, dan tiga sebagai subjek ujicoba karena pada
KTSP untuk tingkat Sekolah Dasar dalam mata pelajaran Seni Budaya dan
Keterampilan seni lukis hanya dilaksanakan pada kelas satu, dua, dan tiga. Penentuan
tiga sekolah tersebut didasarkan pada pertimbangan sekolah yang melaksanakan
pembelajaran seni sesuai dengan KTSP dengan didukung tenaga pendidik yang
memiliki latar belakang pendidikan seni rupa.
G-study
digunakan pada D-study. Menurut Brennan (1983: 3), D-study menekankan estimasi,
penggunaan, dan interpretasi dari varians komponen untuk membuat keputusan, dengan
prosedur pengukuran yang baik.
Penelitian ini menggunakan GENOVA yang komponen variansnya adalah
person, rater, item, interaksi person dan rater, dan kesalahan. G study-nya
menggunakan rancangan bersarang (nested design) dan D-study-nya juga menggunakan
rancangan bersarang (nested design). Penelitian ini menggunakan satu facet p x(i: r) Gstudy yang bersarang untuk mengestimasi varians komponen, varians kesalahan,
generalizeability dan koefiesien phi untuk one-facet, nested, i: r D-study. Varians
komponen yang berbaur pada rancangan bersarang (p, r:i,e) adalah jumlah varians
komponen dalam G-study bersarang yang dapat ditulis sebagai berikut.
13
p2 ,r:i ,e 2p r2:i ,e
hasil
pengukuran
dengan
instrumen
yang
besarnya indeks
dikembangkan
peneliti
(p)
E =
(p) + ()
E adalah nilai harapan koefisien keandalan instrumen,
(p) adalah varians person (peserta didik),
() adalah varians kesalahan.
14
Varians kesalahan terdiri atas varians rater, varians item, dan varians
interaksi
15
perlunya
kriteria sebagai pedoman menilai karya seni lukis anak. Hal ini ditunjukkan jawaban
pertanyaan yang diajukan kepada guru-guru tentang penilaian karya seni lukis anak.
Hasilnya menyatakan 40% merasakan adanya kesulitan untuk menilai karya lukis anak
karena belum ada pedoman kriteria untuk menilai seni lukis anak Kemudian 35% guru
mengungkapkan faktor-faktor yang dinilai berasal dari siswa, misalnya kelengkapan
peralatan dan bahan yang dibawa siswa, dan keseriusan siswa. Selanjutnya 20% guru
mengungkapkan
kesulitan.
Hal ini menunjukkan bahwa pembelajaran dan penilaian pendidikan seni lukis
sungguh memprihatinkan. Pendidik yang memiliki pemahaman dan pengetahuan
tentang seni lukis sangat sedikit (hanya 5%) yaitu mereka yang berlatar belakang
pendidikan seni, sehingga kualitas pembelajaran dan penilaian seni lukis masih sangat
rendah. Kenyataan ini merupakan suatu gambaran tentang pembelajaran dan penilaian
seni lukis yang terjadi selama ini, sehingga memerlukan perhatian yang serius dari
semua pihak yang terkait langsung maupun tidak langsung dengan pendidikan seni
lukis.
Berdasarkan uraian hasil studi awal di atas, dapat ditarik kesimpulan bahwa
instrumen penilaian seni lukis anak perlu dikembangkan untuk mempermudah guru
dalam melakukan penilaian yang lebih
perbedaan karakteristik pembelajaran seni yang dilakukan oleh setiap guru. Adanya
perbedaan ini, dikhawatirkan akan memicu terjadinya
penilaian
yang
cenderung
guru.
Langkah selanjutnya adalah tahap pendefinisian, yaitu membuat definisi
konstruk instrumen dan kajian atas konsep instrumen karya lukis anak yang dijabarkan
dari kajian teori. Definisi konstruk instrumen karya seni lukis anak dijabarkan menurut
16
indikator, deskripsi, kriteria dan rubrik penentuan skor. Pendefinisian ini pada dasarnya
dihasilkan dari pendalaman literatur tentang seni dan strategi pendidikannya untuk
menetapkan konstruk instrumen pendidikan seni lukis anak.
Setelah itu dilakukan proses telaah dengan memanfaatkan validasi ahli untuk
menperoleh kesepakatan dalam menentukan konstruk penilaian. Hasil validasi ahli
digunakan sebagai dasar untuk merancang konstruk instrumen secara utuh. Kemudian
dilanjutkan dengan FGD sebanyak tiga kali yang menghadirkan pakar pendidikan, pakar
seni lukis anak,guiru seni lukis di SD untuk menetapkan indikator, deskripsi, kriteria,
dan rubrik penentuan skor. Diperoleh hasil bahwa dimensi penilaian proses adalah
penilaian yang ditunjukkan untuk mengamati kompetensi peserta didik dalam berkreasi
membuat karya seni lukis, sedangkan dimensi penilaian produk adalah penilaian yang
ditunjukkan untuk melihat kompetensi peserta didik dalam membuat karya cipta seni
lukis. Selanjutnya hasil FGD sebagai tindak lanjut diadakan seminar, hasil dari seminar
merupakan instrumen uji coba penilaian karya seni lukis anak berupa lembar penilaian
proses dan produk sebagai berikut:
17
penilaian yang diujicobakan kepada tiga orang guru sebagai rater atau penilai terhadap
penilaian karya seni lukis. Komponen-komponen yang digunakan sebagai acuan untuk
melakukan rating oleh para rater telah diperoleh dari hasil pengembangan pada tahap
sebelumnya dan dikenal dengan produk tentatif instrumen penilaian karya seni lukis.
Instrumen penilaian ini terdiri atas tiga komponen utama
yakni penilaian
proses, penilaian produk, dan pada pengguna di lapangan. Hasil ujicoba instrumen ini
disajikan pada bagian analisis data. Kegiatan uji coba ini dipaparkan data hasil uji coba
pada keempat kawasan tersebut. Data uji coba terdiri dari 2 (dua) komponen yaitu (1)
data uji coba komponen penilaian proses, (2) data uji coba komponen penilaian produk.
Hasil analisis G study digunakan untuk mengetahui
penilaian yang dikembangkan serta
diakibatkan oleh berbagai sumber variansi, dalam pengembangan ini yakni sumber
variansi murid (P), penilai (R) dan item kriteria penilaian (I). Setelah koefisien G dapat
diketahui, maka pada tahapan analisis lanjut (analisis D study) akan didapatkan
informasi tentang keputusan seberapa jauh penggunaan instrumen yang telah diuji
memiliki keberlakuan pada faset yang lebih luas terutama menyangkut kesamaan
kondisi pengukuran, dan dapat diterimanya kondisi faset tersebut bagi rater atau penilai
yang lain.
b. Hasil Analisis Genova Untuk Estimasi Komponen Variansi
1). Analisis Estimasi Komponen Varians Komponen Penilaian Proses
Rangkuman analisis G study dari data uji coba komponen penilaian proses dapat
disajikan
sebagaimana
pada Tabel 9.
18
Tabel 1.
Estimasi Komponen Variansi Siswa, Penilai, Kriteria Penilaian dari Uji Kelompok
Siswa ( n 180 ) untuk Penilaian Proses
Sumber Variansi
Kelas
1
2
3
1
2
3
JK1
193,3
7823,63
7701,29
62,59
226469,95
db
KR
3,28
132,60
130,53
31,29
Penilai (R)
113235,00
103984,9
581347,72 207969,86
2
0
1
8728,20
2854,16
18
158,56
I:R
2
836923,95 204981,29
18
11387,85
3
771345,40 189997,68
18
10555,43
PR (Interaksi Murid
1
6092,29
24,94
118
0,21
dan Penilai)
2
644940,43
5174,14
118
43,85
3
594179,71
5130,71
118
43,48
PI:R ( Interaksi
1
9244,00
297,56 1062
0,28
Murid dan Item
2
868049,00
18127,28 1062
17,07
Nested pada Penilai)
3
800302,00
16124,60 1062
15,18
1
35943,29
3432,55 1259
193,62
124816,4
Total
2
3395152,40 457402,15 1259
0
3
31282540,00 426924,14 1259 114729,60
Catatan: JK1 = sums of squares for mean scores; JK2 = sums of squares for score effects.
Murid (P)
6004,76
413296,33
381079,14
5874,04
631942,66
JK2
59
59
59
2
2
Varian
% Total
Varian
0,14
4,23
4,15
0,00
242,43
4,58
0,93
0,98
0,00
53,04
222,38
2,64
189,51
175,67
0,00
3,83
4,04
0,28
17,07
15,18
3,06
52,77
86,27
41,46
41,69
0,00
0,84
0,96
9,15
3,73
3,60
100,00
457,07
421,42
100,00
100,00
yang terbesar adalah sumber variansi penilai (R) dengan proporsi masing-masing
53,04% dan 52,77%.
Kondisi yang demikian berarti bahwa faset yang berkaitan dengan objek
pengukuran untuk penilaian proses, yang dominan mempengaruhi variansi kesalahan
pengukuran adalah item yang bersarang pada penilai (I:R) dan untuk uji coba di kelas 2
dan di kelas 3 adalah penilai (R). Sumber variansi item yang bersarang pada penilai
(I:R) merupakan komponen varian yang paling dominan; hal ini diduga karena guru
yang menjadi rater atau penilai baru mengenal model dan konstruk alat penilaian yang
dikembangkan. Selain itu penggunaan alat penilaian yang dikembangkan ini merupakan
cara baru yang berbeda dengan cara-cara konvensional sebagaimana yang lazim
digunakan oleh para guru sebelum cara penilaian ini dikenalkan.
Pada uji coba di kelas 2 dan di kelas 3, kondisi semacam itu telah bergeser yakni
bukan lagi komponen varians item yang bersarang pada penilai (I:R) yang dominan
sebagai penentu varians kesalahan pengukuran melainkan penilai atau rater. Hal ini
dapat dipahami karena faktor pemahaman dan latihan atau pengalaman guru sangat
19
dituntut untuk bisa melakukan penilaian yang benar sesuai konstruk yang dikandung
oleh alat penilaian yang dikembangkan.
Sumber variansi komponen yang lain yakni murid (P), interaksi murid dengan
penilai (PR), interaksi murid dan item nested pada penilai (PI:R) proporsinya tampak
lebih kecil terhadap seluruh komponen variansi hasil penilaian proses kualitas karya
seni lukis dibanding proporsi komponen varians penilai (R) dan kriteria penilaian yang
nested pada penilai (I:R).
Hasil uji coba ini menunjukkan bahwa pada penerapan alat penilaian karya seni
lukis untuk komponen proses, peranan penilai (R) merupakan sumber variansi
kesalahan pengukuran terbesar.
menggunakan alat penilaian untuk menilai kualitas karya seni lukis merupakan cara
untuk mengurangi kesalahan pengukuran dan untuk meningkatkan tingkat konsistensi
dan keajegan hasil penilaian.
2). Analisis Estimasi Komponen Varian Komponen Penilaian Produk
Rangkuman analisis G study dari data uji coba komponen penilaian produk
dapat disajikan
sebagaimana
pada Tabel 2.
Tabel 2.
Estimasi Komponen Variansi Siswa, Penilai, Kriteria Penilaian dari Uji Kelompok
Siswa ( n 180 ) untuk Penilaian Produk
Sumber Variansi
Murid (P)
Penilai (R)
I:R
PR (Interaksi Murid
dan Penilai)
PI:R ( Interaksi
Murid dan Item
Nested pada Penilai)
Total
Kelas
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
JK1
118655,00
121393,00
113876,89
207726,25
213078,27
199841,26
241766,02
251512,65
234248,77
219396,33
222531,67
209554,00
262591,00
275197,00
255520,00
1050134,6
0
1083712,6
0
1013040,9
0
JK2
db
KR
Varian
% Total
Varian
6421,25
4733,80
5104,86
95492,50
96419,07
91069,23
34039,77
38434,38
34407,51
5248,83
4719,60
4607,89
9154,90
14230,96
11558,49
59
59
59
2
2
2
6
6
6
118
118
118
354
354
354
108,83
80,23
86,52
47746,25
48209,54
45534,61
5673,29
6405,73
5734,59
44,48
40,00
39,05
25,86
40,20
32,65
7,15
4,45
5,27
233,64
232,24
221,08
94,12
106,09
95,03
6,21
0,00
2,13
25,86
40,20
32,65
1,95
1,16
1,48
63,67
60,64
62,07
25,65
27,70
26,68
1,69
0,00
0,60
7,05
10,50
9,17
150357,25
539
53598,71
366,98
100,00
158537,81
539
54775,70
382,98
100,00
146747,98
539
51427,42
356,16
100,00
Catatan: JK1 = sums of squares for mean scores; JK2 = sums of squares for
score effects.
20
Hasil rangkuman analisis G study untuk penilaian produk di kelas 1, kelas 2 dan di kelas
3 menunjukkan bahwa estimasi varian true skor yang terbesar dari faset yang berkaitan
dengan objek pengukuran (universe of admissible observations) adalah sumber variansi
kesalahan pengukuran komponen penilai
kelas 1 sebesar 63,67%; di kelas 2 sebesar 60,64%, dan di kelas 3 sebesar 62,07%.
Kemudian berikutnya adalah sumber varians kesalahan untuk komponen item yang
bersarang pada penilai (I:R) dengan proporsi komponen varians di kelas 1 sebesar
25,65%, di kelas 2 sebesar 27,70%, dan di kelas 3 sebesar 26,68%.
Hasil analisis di atas menunjukkan bahwa faset yang berkaitan dengan objek
pengukuran untuk penilaian produk, faset yang dominan sebagai variansi kesalahan
pengukuran adalah penilai
variansi yang lain tidak begitu besar proporsinya sebagai komponen varians untuk
penilaian produk.
Sumber variansi komponen yang lain yakni murid (P), interaksi murid dengan
penilai (PR), interaksi murid dan item bersarang pada penilai (PI:R) proporsinya tampak
lebih kecil terhadap variansi hasil penilaian proses kualitas karya seni lukis dibanding
pengaruh kedua sumber variansi penilai (R) dan kriteria penilaian yang bersarang pada
penilai (I:R).
Berdasarkan analisis ini penerapan alat penilaian karya seni lukis untuk
komponen produk, peranan penilai (R) tetap merupakan sumber varians kesalahan
pengukuran yang terbesar seperti halnya pada penilaian proses.
dibutuhkan juga latihan dan pengalaman bagi penilai dalam menggunakan instrumen
penilaian produk untuk menilai kualitas karya seni lukis siswa agar dapat meningkatkan
tingkat konsistensi dan keajegan hasil penilaian serta tingkat kesepakatan pemahaman
terhadap konstruk sasaran penilaian karya seni lukis untuk komponen produk di antara
para penilai.
Hasil analisis komponen varians untuk penilaian proses, produk, di atas
memberi petunjuk bahwa pengembangan alat penilaian kualitas karya seni lukis sudah
menunjukkan indikasi kebermaknaan untuk digunakan sebagai sarana melakukan
observasi. Untuk mengetahui apakah hasil pengembangan tersebut telah memenuhi
standar minimal, dipakai persyaratan minimal koefisien G Sebesar 0,70 (Nunnaly,
1978: 245, Linn,1989:106) agar
lebih luas. Untuk maksud tersebut dilakukan analisis lanjut terhadap hasil Genova
21
(koefisien G) dan analisis tingkat perubahan koefisien G pada level analisis hasil D
study. Hasil Analisis dipaparkan pada uraian berikut.
penilaian pada faset yang lebih luas atau dengan kata lain
Sasaran
Uji
(Faset)
Kelas 1
Kelas 2
Kelas 3
Kelas 1
Kelas 2
Kelas 3
Jumlah
Item
Koefisien
G
7
7
7
3
3
3
0,91*
0,67*
0,67*
0,76*
0,50
0,62
Keterangan
(Linn
0,70)
>persyaratan
<persyaratan
<persyaratan
>persyaratan
<persyaratan
<persyaratan
Rerata
Koefisien
G
0,75*
0,63
Jika dilihat dari karakteristik faset uji coba untuk semua komponen, maka
terapan model penilaian pada faset di kelas 1 sudah memberikan bukti bahwa model
yang dikembangkan dapat digunakan untuk penilaian pada faset yang lebih luas, tetapi
jika memperhatikan koefisien G pada terapan faset di kelas 2 dan di kelas 3, maka
model yang dikembangkan masih memerlukan penyempurnaan dalam hal administrasi
penyelenggaraan yakni harus meningkatkan keterampilan guru sebagai penilai atau
rater agar ada peningkatan pemahaman, keterampilan dan pengalaman agar diperoleh
hasil pengukuran yang konsisten.
22
$P
INF.
SAMPLE SIZE
R
INF
I
INF.
GENERALIZABILITY
COEF.
PHI
001-001
001-002
001-003
001-004
001-005
001-006
001-007
60
60
60
60
60
60
60
3
3
3
3
3
3
3
1
2
3
4
5
6
7
0,60437
0,75341
0,82088
0,85936
0,88424
0,90163
0,91448
0,12791
0,22681
0,30556
0,36976
0,42308
0,46809
0,50659
23
Selisih Koefisien
Genova
0,15
0,07
0,04
0,02
0,02
0,01
didperoleh kaoefisien sebesar 0,82. Berdasarkan kenyataan ini maka dapat dikatakan
bahwa untuk
untuk
faset yang
penilai
cukup
Tabel 5
Estimasi Koefisien Generalizability pada Penilaian Proses Kelas 2
dan Tingkat Perubahannya
D STUDY
DESIGN
NO
$P
INF.
SAMPLE SIZE
R
INF
I
INF.
COEF.
GENERALIZABILITY
PHI
001-001
001-002
001-003
001-004
001-005
001-006
001-007
60
60
60
60
60
60
60
3
3
3
3
3
3
3
1
2
3
4
5
6
7
0,37765
0,50637
0,57128
0,61040
0,63655
0,65527
0,66933
0,02724
0,03500
0,03868
0,04082
0,04223
0,04322
0,04396
Selisih Koefisien
Genova
0,13
0,06
0,04
0,03
0,02
0,01
ditambah, jumlahnya tergantung pada kondisi faset yang bersangkutan, dalam konteks
ini jika 7 (tujuh) indikator digunakan maka akan dicapai koefisien kesepahaman dan
kesepakatan sebesar 91,45%. Penilaian proses hanya dengan satu indikator (D study
design nomor 001-001 dengan P = 60, R = 3 dan I = 1) memiliki tingkat kesepahaman
dan kesepakatan (reliabilitas dalam koefisien G) sebesar 0,38. Artinya penilai memiliki
24
$P
INF.
SAMPLE SIZE
R
INF
I
INF.
COEF.
GENERALIZABILITY
PHI
001-001
001-002
001-003
001-004
001-005
001-006
001-007
60
60
60
60
60
60
60
3
3
3
3
3
3
3
1
2
3
4
5
6
7
0,39277
0,51665
0,57735
0,61338
0,63724
0,65421
0,66689
0,02894
0,03720
0,04111
0,04339
0,04489
0,04594
0,04673
Selisih Koefisien
Genova
0,12
0,06
0,04
0,02
0,02
0,01
jumlah indikator penilaian harus ditambah, jumlahnya tergantung pada kondisi faset
yang bersangkutan
.Pada Tabel 6 memberi gambaran bahwa penilai dalam menggunakan komponen
penilaian proses di kelas 3 jika hanya dengan satu indikator (D study design nomor 001001 dengan P = 60, R = 3 dan I = 1) memiliki tingkat kesepahaman dan kesepakatan
(reliabilitas dalam koefisien G) sebesar 0,39. Jika penilai menggunakan dua indikator
(rancangan D study nomor 001-002, dengan P = 60, R = 3 dan I = 2) yakni indikator 1
dan 2, memiliki tingkat kesepahaman dan kesepakatan sebesar 0,52; begitu seterusnya
untuk design 001-003 didapatkan kaoefisien sebesar 0,58. Berdasarkan kenyataan ini
maka dapat dikatakan bahwa untuk penggunaan komponen penilaian agar dicapai
kesepahaman dan kesepakatan yang memenuhi tingkat observasi yang dapat diterima
untuk faset yang lebih luas,
secara simultan. Jika ingin meningkatkan tingkat kesepahaman dan kesepakatan yang
lebih tinggi maka penggunaan indikator penilaian harus ditambah, jumlahnya
tergantung pada kondisi faset yang bersangkutan, dalam konteks ini jika 7 (tujuh)
25
2)
Tabel 7.
Estimasi Koefisien Generalizability pada Penilaian Produk Kelas 1
dan Tingkat Perubahannya
D STUDY
DESIGN NO
SAMPLE SIZE
001-001
001-002
001-003
GENERALIZABILITY
$P
INF.
R
INF
I
INF.
COEF.
PHI
60
60
60
3
3
3
1
2
3
0,51678
0,68142
0,76238
0,18733
0,31555
0,40882
Selisih Koefisien
Genova
0,16
0,08
26
kesepakatan
Tabel 8
Estimasi Koefisien Generalizability pada Penilaian Produk Kelas 2
dan Tingkat Perubahannya
D STUDY
DESIGN NO
001-001
001-002
001-003
SAMPLE SIZE
GENERALIZABILITY
$P
INF.
R
INF
I
INF.
COEF.
PHI
60
60
60
3
3
3
1
2
3
0,24922
0,39900
0,49896
0,08359
0,15429
0,21486
Selisih Koefisien
Genova
0,15
0,10
$P
INF.
SAMPLE SIZE
R
INF
I
INF.
COEF.
GENERALIZABILITY
PHI
001-001
001-002
001-003
60
60
60
3
3
3
1
2
3
0,35483
0,52380
0,62263
0,12330
0,21953
0,29672
Selisih Koefisien
Genova
0,17
0,10
dapat dicapai tingkat kesepahaman dan kesepakatan yang lebih tinggi. Penambahan
indikator sejenis yang relevan untuk meningkatkan kebermaknaan penilaian produk di
kelas 2 memerlukan telaah lanjut tersendiri.Tabel 9 memberi gambaran bahwa jika
penilai dalam menggunakan komponen penilaian produk di kelas 3 hanya dengan satu
27
proses instrumen pendidikan seni lukis anak untuk kelas 1, kelas 2, dan kelas 3. Pada
penilaian proses ini, ada 7 (tujuh) item yang menjadi objek penilaian. Rangkuman hasil
perhitungan konsistensi dan kesepakatan tiga rater tersebut disajikan pada Tabel 10
untuk kelas 1, Tabel 11 untuk kelas 2, dan Tabel 12 untuk kelas 3.
28
DI
sebesar 0,73.
Tingkat konsistensi
dan
keseluruhan dalam menilai proses kelas 1 dapat diketahui dengan mengambil rata-rata
koefisien kappa tiga pasangan tersebut, yaitu sebesar 0,73.
Tabel 10
Rangkuman Hasil Perhitungan Reliabilitas Antar Penilai
Pada Penilaian Proses Kelas 1
Penilai
UD
DI
1
2
3
4
5
6
7
1
2
3
4
5
6
7
1
0,72
ST
4
UD
4
0,72
0,84
0,81
0,78
0,78
0,63
0,75
0,74
0,68
0,77
0,81
0,71
0,70
0,67
0,68
0,65
0,70
0,79
0,68
0,82
Nilai tersebut memberi gambaran bahwa ketiga penilai tersebut memiliki persepsi dan
pemahaman terhadap konstruk penilaian sebesar 73% . Nilai koefisien tersebut lebih
besar dari kriteria minimal yang digunakan, yaitu 0,70, sehingga instrumen tersebut
memenuhi syarat koefisien reliabilitas.
Tabel 11 di bawah ini, memberi gambaran bahwa koefisien (kappa) antara ST
dengan UD diperoleh dengan mengambil rata-rata koefisien kappa ketujuh item yang
dirating tersebut, yaitu 0,67. Kemudian antara ST dengan DI sebesar 0,70, dan antara
UD dengan DI sebesar 0,64. Tingkat konsistensi dan kesepakatan penilai secara
keseluruhan dalam menilai proses kelas 2 dapat diketahui dengan mengambil rata-rata
koefisien kappa tiga pasangan tersebut, yaitu sebesar 0,67. Nilai tersebut memberi
gambaran bahwa ketiga penilai tersebut memiliki persepsi dan pemahaman terhadap
konstruk penilaian sebesar 67%. Nilai koefisien tersebut mendekati
kriteria
minimal yang digunakan, yaitu 0,70 (Nunally, 1978:245 Linn, 1989:106), sehingga
instrumen tersebut mendekati syarat koefisien reliabilitas.
29
Tabel 11
Rangkuman Hasil Perhitungan Reliabilitas Antar Penilai
Pada Penilaian Proses Kelas 2
Penilai
ST
UD
DI
1
2
3
4
5
6
7
1
2
3
4
5
6
7
1
0,61
UD
4
0,64
0,81
0,77
0,69
0,6
0,57
0,66
0,64
0,9
0,56
0,66
0,7
0,67
0,63
0,65
0,55
0,75
0,73
0,61
tersebut mendekati
0,65
UD
DI
1
2
3
4
5
6
7
1
2
3
4
5
6
7
1
0,63
UD
4
0,69
0,81
0,76
0,68
0,85
0,73
0,67
0,75
0,68
0,46
0,70
0,76
0,62
0,74
0,56
0,71
0,59
0,62
0,57
30
0,71
penilai
secara
keseluruhan dalam menila proses kelas 1 dapat diketahui dengan mengambil rata-rata
koefisien kappa tiga pasangan tersebut, yaitu sebesar 0,73. Nilai tersebut memberi
gambaran bahwa ketiga penilai tersebut memiliki persepsi dan pemahaman terhadap
konstruk penilaian sebesar 73%. Nilai koefisien tersebut lebih besar dari kriteria
minimal yang digunakan, yaitu 0,70, sehingga instrumen tersebut memenuhi syarat
koefisien reliabilitas.
2)
proses instrumen pendidikan seni lukis anak untuk kelas 1, kelas 2, dan kelas 3. Pada
penilaian produk ini, ada 3 (tiga) item yang menjadi objek penilaian. Rangkuman hasil
perhitungan konsistensi dan kesepakatan tiga rater tersebut disajikan pada Tabel 13
untuk kelas 1, Tabel 30 untuk kelas 2, dan Tabel 31 untuk kelas 3.
Tabel 13 memberi gambaran bahwa koefisien (kappa) antara ST dengan UD
diperoleh dengan mengambil rata-rata koefisien kappa ketiga item yang dirating
tersebut, yaitu 0,88. Kemudian antara ST dengan DI sebesar 0,88, dan antara UD
dengan DI sebesar 0,88. Tingkat konsistensi dan kesepakatan
penilai secara
keseluruhan dalam menilai produk kelas 1 dapat diketahui dengan mengambil rata-rata
koefisien kappa tiga pasangan tersebut, yaitu sebesar 0,88.
Tabel 13
Rangkuman Hasil Perhitungan Reliabilitas Antar Penilai
Pada Penilaian Produk Kelas 1
Penilai
ST
1
1
UD
1
2
0,85
0,92
3
DI
UD
0,88
0,85
0,85
0,92
0,92
31
0,88
0,88
persepsi dan pemahaman terhadap konstruk penilaian sebesar 88%. Nilai koefisien
tersebut lebih besar dari kriteria minimal yang digunakan, yaitu 0,70, sehingga
instrumen tersebut memenuhi syarat koefisien reliabilitas.
Pada Tabel 14 menunjukkan
diperoleh dengan mengambil rata-rata koefisien kappa ketiga item yang dirating
tersebut, yaitu 0,96. Kemudian antara ST dengan DI sebesar 0,97, dan antara UD
dengan DI sebesar 0,97. Tingkat konsistensi dan kesepakatan penilai secara keseluruhan
dalam menilai produk kelas 2 dapat diketahui dengan mengambil rata-rata koefisien
kappa tiga pasangan tersebut, yaitu sebesar 0,97. Nilai tersebut memberi gambaran
bahwa ketiga penilai tersebut memiliki persepsi dan pemahaman terhadap konstruk
penilaian sebesar 97%. Nilai koefisien tersebut lebih besar dari kriteria minimal yang
digunakan, yaitu 0,70, sehingga instrumen tersebut memenuhi syarat koefisien
reliabilitas.
Tabel 14
Rangkuman Hasil Perhitungan Reliabilitas Antar Penilai
Pada Penilaian Produk Kelas 2
Penilai
ST
1
1
UD
0,98
DI
0,98
UD
0,93
0,98
2
3
0,95
0,98
0,98
0,95
0,98
konsistensi
dan
kesepakatan
penilai secara
keseluruhan dalam menilai produk kelas 3 dapat diketahui dengan mengambil rata-
32
rata koefisien kappa tiga pasangan tersebut, yaitu sebesar 0,92. Nilai tersebut memberi
gambaran bahwa ketiga penilai tersebut memiliki persepsi dan pemahaman yang sama
terhadap kostruk penilaian sebesar 92%. Nilai koefisien tersebut lebih besar dari
kriteria minimal yang digunakan, yaitu 0,70, sehingga instrumen tersebut memenuhi
syarat koefisien reliabilitas.
Tabel 15
Rangkuman Hasil Perhitungan Reliabilitas Antar Penilai
Pada Penilaian Produk Kelas 3
Penilai
ST
1
1
UD
0,95
DI
0,95
UD
0,93
0,98
0,93
0,93
0,93
0,90
0,82
Bagian revisi produk dalam pengembangan instrumen penilaian seni lukis dalam
penelitian ini mengikuti revisi produk dalam setiap tahap pengembangan. Tahap revisi
dalam setiap tahap pengembangan berkaitan dengan revisi indikator, deskripsi, kriteria
dan rubrik, dan pedoman penggunaan instrumen penilaian seni lukis pada tahap focus
group discussion (FGD) dan seminar.
4. Kajian Produk Penelitian
Penilaian Proses
Penilaian proses instrumen penilaian seni lukis dilakukan oleh 3 (tiga) orang
rater terhadap 60 orang siswa dengan 7 (tujuh) indikator instrumen. Berdasarkan hasil
33
penelitian yang telah dibahas pada bagian sebelumnya, analisis kesepakatan dan
kesepahaman rater terhadap konstruk instrumen digunakan dua pendekatan yaitu
pendekatan Genova dan pendekatan Cohen Kappa. Rangkuman perbandingan koefisien
kedua pendekatan tersebut disajikan pada Tabel 16
Tabel 16
Perbandingan koefisien Genova dan Kappa pada Penilaian Proses
Kelas
Kelas 1
Kelas 2
Kelas 3
Koefisien
Koefisien
Genova
Kappa
0,73
0,67
0,73
0,91
0,67
0,67
Selisih
0,18
0,00
0,04
untuk
menggunakan
koefisien
Genova
sebagai
dasar
dalam
34
4. Penilaian Produk
Penilaian produk instrumen penilaian seni lukis dilakukan oleh 3 (tiga) orang
rater terhadap 60 orang siswa dengan 3 (tiga) indikator instrumen. Berdasarkan hasil
penelitian yang telah dibahas pada bagian sebelumnya, analisis kesepakatan dan
kesepahaman rater terhadap konstruk instrumen digunakan dua pendekatan yaitu
pendekatan Genova dan pendekatan Cohen Kappa. Rangkuman perbandingan koefisien
kedua pendekatan tersebut disajikan pada Tabel 17.
Tabel 17
Perbadingan koefisien Genova dan Kappa pada Penilaian Produk
Kelas
Kelas 1
Kelas 2
Kelas 3
Koefisien
Koefisien
Genova
Kappa
0,76
0,49
0,62
0,88
0,97
0,92
Selisih
0,12
0,48
0,30
koefisien kappa belum diperhatikan sehingga memberikan hasil yang lebih tinggi. Jika
varians kesalahan diperhatikan maka kemungkinan akan memberikan hasil yang kurang
lebih sama dengan yang diperoleh melalui koefisien Genova. Dengan demikian, peneliti
menganjurkan
untuk
menggunakan
koefisien
35
Genova
sebagai
dasar
dalam
D.
item,
komponen produk 3 (tiga) item, komponen penilaian diri 5 (lima) item, dan
komponen penilaian kelompok 5 (lima) item.
b. Karakteristik instrumen penilaian hasil belajar karya seni lukis anak yang
mencakup validitas, reliabilitas, dan keterpakaian di SD telah teruji. Validitas
telah teruji melalui proses focus group discussion sebanyak 3 kali dan seminar
sekali. Reliabilitas telah teruji melalui teknik generalizeability theory (Teori G)
dan interrater Cohens Kappa. Koefisien Genova untuk instrumen ini sebesar
0,71 dan koefisien interrater 0,73 telah memenuhi
Keterbatasan Penelitian
Penelitian ini memiliki beberapa keterbatasan baik dari segi metode maupun
aplikasi.
a.
belum sampai pada tahap diseminasi agar instrumen hasil pengembangan dapat
b.
3.
Saran Pemanfaatan
36
a.
Saran yng diajukan berdasarkan hasil penelitian ini adalah sebagai berikut.
Untuk sekolah hendaknya mengadakan pelatihan penggunaan instrumen
penilaian seni lukis anak bagi guru mata pelajaran seni budaya dan keterampilan di
sekolah dasar, agar guru dapat memberikan penilaian secara objektif hasil seni lukis
anak.
b.
c.
4.
37
Berk, Ronald. A. (1986). Performance assessment: London: The John Hopkins Press
Ltd.
Brennan. Robert L. (1983). Element of generalizability theory. Iowa City: ACT
Publication.
BSNP. (2006). Standar nasional pendidikan. (Jakarta): BSNP.
Conrad, George. (1964). The process of art education in the elementary school.
Amerika: Prentice Hall.Inc.
Eisner, Elliot W. (1997). Educating artistic vision. Reston, VA:NAEA.
Fernandes, H.J.X. (1984). Testing and measurement. Jakarta: National Education
Planning, Evaluation, and Curiculum Development.
Malcom Ross. (1986). Assessment in art education a necessary discipline oer a loss of
happiness? New York: Pergamon Press.
Fernandes, H.J.X. (1984). Testing and measurement. Jakarta: National Education
Planning, Evaluation, and Curiculum Development.
Kellogg, Rhoda and Scott ODell. (1967). The psychology of chidrens art. California:
CRM INC.
Lansing, K.M. (1976). Art, artist and art education. New York: Mcgraw-Hill.
Lowenfeld, Viktor. & Britain, W. Lambert (1982). Creative and mental growth, New
York: Macmillan Publishing Co., Inc.
Ricci, Corrado. Lart de bambini. Leipzig, 1960. Pedagogical Sem.3 (1906);302-307.
Soesatyo, (1994). Apresiasi seni lukis anak-anak. Yogyakarta: Sanggar Melati Suci
Soesatyo, (1994). Sanggar melati suci (1979-1994): Yogyakarta: Aquarius Offset.
Stephen C. Pepper, (1973) Contextualistic criticism.Reinhart and Winston, Inc: New
York.
Thiagarajan, S., Semmel, D. S & Semmel, M. I. (1974). Instructional development for
training teachers of exceptional children: A sourcebook. Minneapolis Indiana
University.
Victor, Heyfron . (1986). Objectivity and assessment in art in assessment in arts
education. Pergamon Press: Toronto.
38