Menguji Ramadan Menguji Pendidikan


“ON no soul doth Allah place a burden greater than it can bear. It gets every good that it earns, and it suffers every ill that it earns,” (Al-Baqarah, ayat 286).

PADA bulan suci Ramadan ini kita sangat dianjurkan untuk dapat dengan jujur dan genuine mengevaluasi seluruh prilaku selama 11 bulan terakhir. Soal evaluasi dan refl eksi individual, mungkin banyak yang sudah melakukannya, sebab jika sampai terlupakan, ia akan memengaruhi kualitas ibadah puasa yang bersangkutan. Namun dalam konteks kebijakan publik (domain pemerintah), refleksi dan evaluasi terhadap efektivitas, termasuk collateral effects kebijakan yang pernah dikeluarkan, itu semestinya juga menjadi prioritas dan keniscayaan.

Dari sekian banyak kebijakan yang dikeluarkan pemerintah, pemanfaatan rezim akuntabilitas pada sistem pendidikan melalui kebijakan pengujian sejenis high-stake examinations seperti ujian nasional (UN) dan uji kompetensi guru (UKG) sangat menyedot perhatian publik. Kebijakan itu terus-menerus diperdebatkan sebagian masyarakat karena dipandang kontroversial.

Karena itu, sudah sepantasnya para pemangku kebijakan yang memiliki otoritas dalam meningkatkan kualitas pendidikan di Tanah Air sedikit merefleksikan Ramadan untuk mengkaji dan mengkritisi kebijakan yang pernah mereka buat. Menguji kepekaan kebijakan bukanlah suatu dosa, apa lagi dilakukan di bulan suci.

Ujian Nasional

Degradasi dan deskripsi kualitas pada hampir semua jenjang dan jenis pendidikan, sebagaimana diindikasikan dari laporan berbagai `survei' internasional, seperti TIMSS, PIRLS, dan PISA, memaksa pemerintah mencari solusi strategis, terukur, dan berjangka pendek. Pilihan rasional bagi pemerintah saat ini ialah pemanfaatan instrumen kebijakan ujian (high-stake examinations). Kementerian Pendidikan dan Kebudayaan sangat yakin bahwa instrumen kebijakan ujian (UN dan UKG) akan dapat mendorong perubahan dan peningkatan mutu pendidikan. Karena itu, mereka tetap keukeuh melaksanakan kedua jenis tes itu meskipun harus menuai kritik sangat tajam.

Ujian memang dimungkinkan dapat memengaruhi strategi dan motivasi belajar siswa. Namun, peningkatan motivasi belajar itu bukan merupakan fungsi tes. Peningkatan motivasi belajar siswa itu hanya dipandang sebagai sesuatu yang terjadi tanpa disengaja (collateral effects) dan ia bukan tujuan tes itu sendiri. Seandainya fungsi tes sebagai peningkatan motivasi belajar siswa harus dipaksakan, para ahli testing tentunya akan sangat sulit menemukan bukti-bukti validitasnya (validity evidence).

Secara umum, pengujian/penilaian pendidikan hanya mempunyai dua fungsi utama, yakni digunakan untuk merekam hasil pengalaman belajar siswa yang disebut dengan tes prestasi belajar (achievement test) dan memprediksi kelayakan (potensi) individual kandidat apabila yang bersangkutan diberi kesempatan untuk belajar, misalnya di program tertentu di sebuah perguruan tinggi negeri atau ditempatkan pada suatu jenjang kelas atau pekerjaan tertentu (predictive test).

Hal lain yang juga menarik untuk disimak dan diperhatikan dari kebijakan pemerintah ialah menafsirkan hasil UN dengan menggunakan konsep norm referenced measurement dan criterion-referenced measurement secara simultan. Kementerian Pendidikan dan Kebudayaan berulang-ulang mengatakan tujuan UN untuk kepentingan pemetaan, di samping penentuan kelulusan.

UN, Kelulusan, dan Pemetaan

Untuk kepentingan kelulusan, pihak penyelenggara pastinya akan menafsirkan hasil UN yang didasarkan pada konsep criterion-referenced measurement sehingga apabila diperoleh tingkat kelulusan UN yang angkanya melebihi 99%, seperti yang sudah dilaporkan, kita akan segera paham kenapa itu bisa terjadi. Keputusan kelulusan tersebut didasarkan pada kriteria atau domain skill yang terdapat pada kurikulum sehingga kemungkinan sebagian besar siswa dapat lulus atau gagal secara teoretis bisa dijelaskan.

Keganjilan akan timbul jika hasil UN (yang sama) juga akan digunakan untuk kepentingan pemetaan, yang penafsiran skornya berbasiskan normreferenced measurement, tetapi tetap dipaksakan menjadi salah satu tujuan diseleng garakannya UN.

Desain soal-soal tes pada ujian nasional yang akan difungsikan untuk kepentingan pemeta an semestinya berbeda dengan yang akan digunakan untuk kepentingan kelulusan (criterion referenced) meskipun duplikasi pemanfaatan soal-soal tes itu masih dimungkinkan untuk dilakukan untuk dilakukan (Nitko, 1996). Namun, menyusun soal-soal tes yang ber fungsi sebagai penentu kelulusan dan pemetaan secara bersamaan sangatlah tidak mudah dan penulis sangat meragukan Puspendik/BSNP (dengan berbagai konstrain waktu dan minimnya tenaga ahli untuk meng-craft soal-soal tes semacam itu) mampu melakukannya.

Untuk kepentingan pemetaan, soal-soal tes seharusnya on target. Artinya, desain soal-soal tes itu harus dapat dengan tepat mengukur kemampuan kandidat sehingga hasilnya akan dengan jelas dapat diperbandingkan antara kandidat yang sudah memiliki kemampuan terhadap mata pelajaran yang ditempuh dan kandidat yang kemampuannya masih kurang. Jadi sebagai fungsi pemetaan, instrumen tes yang digunakan seharusnya mampu membedakan siswa dengan kinerja baik atau kurang dalam belajar.

Setiap individu siswa akan dihargai sesuai dengan usahanya. Dalam bahasa teknis, hal itu dapat dijelaskan sebagai berikut: tingkat kesukaran (TK) soal-soal tes yang digunakan berkisar di antara 40-60. Artinya, soal-soal itu dapat dikategorikan sebagai soal-soal yang tidak mudah, tapi juga tidak terlalu sulit dan distribusi skornya mendekati bentuk kurva normal. Dengan demikian, itu dimungkinkan untuk membandingkan skor perolehan siswa dari usaha keras (baik) dan usaha yang kurang maksimal.

Kutipan ayat 286 Surah Al-Baqarah di awal tulisan ini menjadi sangat relevan digunakan sebagai bahan refleksi bagi kita yang berkecimpung di dunia pendidikan, khususnya dalam penilaian pendidikan. Allah SWT sangat adil dalam memberikan ujian karena Allah Yang Mahakuasa sangat paham akan perbedaan kemampuan setiap hamba-Nya. Allah SWT tidak memberikan ujian (spiritual) yang bebannya melebihi kapasitas seorang hamba untuk memikulnya. Keadilan Ilahi menyebabkan ada sebagian di antara hamba-Nya yang diberi penghargaan sesuai dengan amal usahanya dan sebaliknya, di antara hamba-Nya itu ada juga yang harus menerima hukuman karena kelalaiannya.

Jadi, kedudukan (attainment) setiap hamba Allah SWT terefleksi dengan sangat jelas dari kualitas amal usahanya. Ayat 286 Al-Baqarah melukiskan bagaimana praktik pengujian pendidikan yang berkeadilan seharusnya dilakukan. Yang usaha belajarnya baik tentu harus diberi penghargaan (certified). Sebaliknya, yang usahanya minimal atau melalaikan tanggung jawab belajarnya menerima risiko atas kelalaiannya itu (tidak lulus).

Fenomena lain yang menarik mengenai pendidikan ialah ditetapkannya nilai sekolah (NS) sebagai penentu kelulusan meskipun bobotnya hanya sebesar 40%. Kebijakan itu dinilai tepat karena NS akan dapat melengkapi bukti validitas (validity evidence) yang dibutuhkan penyelenggara untuk menafsirkan dan menggunakan skor tes sesuai dengan tujuan tes. Namun, otoritas yang diberikan kepada sekolah sayangnya belum diikuti dengan bimbingan dan advokasi tentang bagaimana penilaian sekolah itu seharusnya dirancang. Akibatnya duplikasi konsep materi dan domain skill yang diujikan pada ujian sekolah dan UN sulit dihindari.

Puspendik dan BSNP sebenarnya dapat menerapkan konsep balanced assessment system (Khal, 2012) agar konsep materi dan thinking skill di kurikulum dapat didistribusikan secara tepat pada ujian sekolah dan UN. Kompetensi yang lebih kompleks dan menuntut kemampuan high-order thinking skills diujikan melalui ujian sekolah, sedangkan konsep penting tetapi membutuhkan kemampuan yang sedikit lebih sederhana diujikan pada UN. Dengan demikian, jumlah konsep/materi dan domain skill kurikulum yang diujikan dapat lebih luas dan tersebar.

Jika Puspendik/BSNP dapat mengeksekusi program penguatan kapasitas guru/kepala sekolah dalam bidang penilai an dan konsep balanced assessment system, peningkatan kualitas pendidikan bukanlah berupa wishful thinking. Lebih dari itu, pendidikan bermutu (quality education) akan menjadi kenyataan. Sebagaimana dikemukakan para ahli testing, highstake examinations (semacam UN dan UKG) tidak akan efektif jika penilaian pada tingkat sekolah luput dari perhatian dan pembinaan. Gabungan rigorous high-stake exams dan ujian sekolah akan menciptakan kualitas pendidikan yang genuine dan berkelanjutan.

Syamsir Alam
Mantan Karyawan Pusat Penilaian Pendidikan (Puspendik)
MEDIA INDONESIA,  13 Agustus 2012


Artikel Terkait:

Tidak ada komentar:

Posting Komentar

Beri Komentar demi Refleksi