“ON
no soul doth Allah place a burden greater than it can bear. It gets every good
that it earns, and it suffers every ill that it earns,” (Al-Baqarah, ayat 286).
PADA
bulan suci Ramadan ini kita sangat dianjurkan untuk dapat dengan jujur dan
genuine mengevaluasi seluruh prilaku selama 11 bulan terakhir. Soal evaluasi
dan refl eksi individual, mungkin banyak yang sudah melakukannya, sebab jika
sampai terlupakan, ia akan memengaruhi kualitas ibadah puasa yang bersangkutan.
Namun dalam konteks kebijakan publik (domain pemerintah), refleksi dan evaluasi
terhadap efektivitas, termasuk collateral effects kebijakan yang pernah
dikeluarkan, itu semestinya juga menjadi prioritas dan keniscayaan.
Dari
sekian banyak kebijakan yang dikeluarkan pemerintah, pemanfaatan rezim
akuntabilitas pada sistem pendidikan melalui kebijakan pengujian sejenis
high-stake examinations seperti ujian nasional (UN) dan uji kompetensi guru
(UKG) sangat menyedot perhatian publik. Kebijakan itu terus-menerus
diperdebatkan sebagian masyarakat karena dipandang kontroversial.
Karena
itu, sudah sepantasnya para pemangku kebijakan yang memiliki otoritas dalam
meningkatkan kualitas pendidikan di Tanah Air sedikit merefleksikan Ramadan
untuk mengkaji dan mengkritisi kebijakan yang pernah mereka buat. Menguji
kepekaan kebijakan bukanlah suatu dosa, apa lagi dilakukan di bulan suci.
Ujian Nasional
Degradasi
dan deskripsi kualitas pada hampir semua jenjang dan jenis pendidikan,
sebagaimana diindikasikan dari laporan berbagai `survei' internasional, seperti
TIMSS, PIRLS, dan PISA, memaksa pemerintah mencari solusi strategis, terukur,
dan berjangka pendek. Pilihan rasional bagi pemerintah saat ini ialah
pemanfaatan instrumen kebijakan ujian (high-stake examinations). Kementerian
Pendidikan dan Kebudayaan sangat yakin bahwa instrumen kebijakan ujian (UN dan
UKG) akan dapat mendorong perubahan dan peningkatan mutu pendidikan. Karena
itu, mereka tetap keukeuh melaksanakan kedua jenis tes itu meskipun harus
menuai kritik sangat tajam.
Ujian
memang dimungkinkan dapat memengaruhi strategi dan motivasi belajar siswa.
Namun, peningkatan motivasi belajar itu bukan merupakan fungsi tes. Peningkatan
motivasi belajar siswa itu hanya dipandang sebagai sesuatu yang terjadi tanpa
disengaja (collateral effects) dan ia bukan tujuan tes itu sendiri. Seandainya
fungsi tes sebagai peningkatan motivasi belajar siswa harus dipaksakan, para
ahli testing tentunya akan sangat sulit menemukan bukti-bukti validitasnya
(validity evidence).
Secara
umum, pengujian/penilaian pendidikan hanya mempunyai dua fungsi utama, yakni
digunakan untuk merekam hasil pengalaman belajar siswa yang disebut dengan tes
prestasi belajar (achievement test) dan memprediksi kelayakan (potensi)
individual kandidat apabila yang bersangkutan diberi kesempatan untuk belajar,
misalnya di program tertentu di sebuah perguruan tinggi negeri atau ditempatkan
pada suatu jenjang kelas atau pekerjaan tertentu (predictive test).
Hal
lain yang juga menarik untuk disimak dan diperhatikan dari kebijakan pemerintah
ialah menafsirkan hasil UN dengan menggunakan konsep norm referenced
measurement dan criterion-referenced measurement secara simultan. Kementerian
Pendidikan dan Kebudayaan berulang-ulang mengatakan tujuan UN untuk kepentingan
pemetaan, di samping penentuan kelulusan.
UN, Kelulusan, dan Pemetaan
Untuk
kepentingan kelulusan, pihak penyelenggara pastinya akan menafsirkan hasil UN
yang didasarkan pada konsep criterion-referenced measurement sehingga apabila
diperoleh tingkat kelulusan UN yang angkanya melebihi 99%, seperti yang sudah
dilaporkan, kita akan segera paham kenapa itu bisa terjadi. Keputusan kelulusan
tersebut didasarkan pada kriteria atau domain skill yang terdapat pada
kurikulum sehingga kemungkinan sebagian besar siswa dapat lulus atau gagal
secara teoretis bisa dijelaskan.
Keganjilan
akan timbul jika hasil UN (yang sama) juga akan digunakan untuk kepentingan
pemetaan, yang penafsiran skornya berbasiskan normreferenced measurement,
tetapi tetap dipaksakan menjadi salah satu tujuan diseleng garakannya UN.
Desain
soal-soal tes pada ujian nasional yang akan difungsikan untuk kepentingan
pemeta an semestinya berbeda dengan yang akan digunakan untuk kepentingan
kelulusan (criterion referenced) meskipun duplikasi pemanfaatan soal-soal tes
itu masih dimungkinkan untuk dilakukan untuk dilakukan (Nitko, 1996). Namun,
menyusun soal-soal tes yang ber fungsi sebagai penentu kelulusan dan pemetaan
secara bersamaan sangatlah tidak mudah dan penulis sangat meragukan Puspendik/BSNP
(dengan berbagai konstrain waktu dan minimnya tenaga ahli untuk meng-craft
soal-soal tes semacam itu) mampu melakukannya.
Untuk
kepentingan pemetaan, soal-soal tes seharusnya on target. Artinya, desain
soal-soal tes itu harus dapat dengan tepat mengukur kemampuan kandidat sehingga
hasilnya akan dengan jelas dapat diperbandingkan antara kandidat yang sudah
memiliki kemampuan terhadap mata pelajaran yang ditempuh dan kandidat yang
kemampuannya masih kurang. Jadi sebagai fungsi pemetaan, instrumen tes yang
digunakan seharusnya mampu membedakan siswa dengan kinerja baik atau kurang
dalam belajar.
Setiap
individu siswa akan dihargai sesuai dengan usahanya. Dalam bahasa teknis, hal
itu dapat dijelaskan sebagai berikut: tingkat kesukaran (TK) soal-soal tes yang
digunakan berkisar di antara 40-60. Artinya, soal-soal itu dapat dikategorikan
sebagai soal-soal yang tidak mudah, tapi juga tidak terlalu sulit dan
distribusi skornya mendekati bentuk kurva normal. Dengan demikian, itu
dimungkinkan untuk membandingkan skor perolehan siswa dari usaha keras (baik)
dan usaha yang kurang maksimal.
Kutipan
ayat 286 Surah Al-Baqarah di awal tulisan ini menjadi sangat relevan digunakan
sebagai bahan refleksi bagi kita yang berkecimpung di dunia pendidikan,
khususnya dalam penilaian pendidikan. Allah SWT sangat adil dalam memberikan
ujian karena Allah Yang Mahakuasa sangat paham akan perbedaan kemampuan setiap
hamba-Nya. Allah SWT tidak memberikan ujian (spiritual) yang bebannya melebihi
kapasitas seorang hamba untuk memikulnya. Keadilan Ilahi menyebabkan ada
sebagian di antara hamba-Nya yang diberi penghargaan sesuai dengan amal
usahanya dan sebaliknya, di antara hamba-Nya itu ada juga yang harus menerima
hukuman karena kelalaiannya.
Jadi,
kedudukan (attainment) setiap hamba Allah SWT terefleksi dengan sangat jelas
dari kualitas amal usahanya. Ayat 286 Al-Baqarah melukiskan bagaimana praktik
pengujian pendidikan yang berkeadilan seharusnya dilakukan. Yang usaha
belajarnya baik tentu harus diberi penghargaan (certified). Sebaliknya, yang
usahanya minimal atau melalaikan tanggung jawab belajarnya menerima risiko atas
kelalaiannya itu (tidak lulus).
Fenomena
lain yang menarik mengenai pendidikan ialah ditetapkannya nilai sekolah (NS)
sebagai penentu kelulusan meskipun bobotnya hanya sebesar 40%. Kebijakan itu
dinilai tepat karena NS akan dapat melengkapi bukti validitas (validity
evidence) yang dibutuhkan penyelenggara untuk menafsirkan dan menggunakan skor
tes sesuai dengan tujuan tes. Namun, otoritas yang diberikan kepada sekolah
sayangnya belum diikuti dengan bimbingan dan advokasi tentang bagaimana
penilaian sekolah itu seharusnya dirancang. Akibatnya duplikasi konsep materi
dan domain skill yang diujikan pada ujian sekolah dan UN sulit dihindari.
Puspendik
dan BSNP sebenarnya dapat menerapkan konsep balanced assessment system (Khal,
2012) agar konsep materi dan thinking skill di kurikulum dapat didistribusikan
secara tepat pada ujian sekolah dan UN. Kompetensi yang lebih kompleks dan
menuntut kemampuan high-order thinking skills diujikan melalui ujian sekolah,
sedangkan konsep penting tetapi membutuhkan kemampuan yang sedikit lebih
sederhana diujikan pada UN. Dengan demikian, jumlah konsep/materi dan domain
skill kurikulum yang diujikan dapat lebih luas dan tersebar.
Jika
Puspendik/BSNP dapat mengeksekusi program penguatan kapasitas guru/kepala
sekolah dalam bidang penilai an dan konsep balanced assessment system,
peningkatan kualitas pendidikan bukanlah berupa wishful thinking. Lebih dari
itu, pendidikan bermutu (quality education) akan menjadi kenyataan. Sebagaimana
dikemukakan para ahli testing, highstake examinations (semacam UN dan UKG)
tidak akan efektif jika penilaian pada tingkat sekolah luput dari perhatian dan
pembinaan. Gabungan rigorous high-stake exams dan ujian sekolah akan
menciptakan kualitas pendidikan yang genuine dan berkelanjutan.
Syamsir Alam
Mantan Karyawan Pusat Penilaian
Pendidikan (Puspendik)
MEDIA INDONESIA, 13 Agustus 2012
Tidak ada komentar:
Posting Komentar
Beri Komentar demi Refleksi