Pengertian Evaluasi, Pengukuran, Penilaian (Assessment)
Banyak orang mencampur adukkan pengertian antara evaluasi, pengukuran (measurement), penilaian (assessment), padahal ketiganya memiliki pengertian yang berbeda. Evaluasi adalah kegiatan identifikasi untuk melihat apakah suatu program yang telah direncanakan telah tercapai atau belum, berharga atau tidak, dan dapat pula untuk melihat tingkat efisiensi pelaksanaannya. Evaluasi berhubungan dengan keputusan nilai (value judgement). Stufflebeam (Abin Syamsuddin Makmun, 1996) memengemukakan bahwa : educational evaluation is the process of delineating, obtaining,and providing useful, information for judging decision alternatif. Dari pandangan Stufflebeam, kita dapat melihat bahwa esensi dari evaluasi yakni memberikan informasi bagi kepentingan pengambilan keputusan. Di bidang pendidikan, kita dapat melakukan evaluasi terhadap kurikulum baru, suatu kebijakan pendidikan, sumber belajar tertentu, atau etos kerja guru.
Pengukuran (measurement) adalah proses pemberian angka atau usaha memperoleh deskripsi numerik dari suatu tingkatan di mana seorang peserta didik telah mencapai karakteristik tertentu. Pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu standar atau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapat diperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian, atau kepercayaan konsumen.
Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau ketercapaian kompetensi (rangkaian kemampuan) peserta didik. Penilaian menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang peserta didik.Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif dalam kata-kata) dan nilai kuantitatif (berupa angka). Pengukuran berhubungan dengan proses pencarian atau penentuan nilai kuantitatif tersebut. Penilaian hasil belajar pada dasarnya adalah mempermasalahkan, bagaimana pengajar (guru) dapat mengetahui hasil pembelajaran yang telah dilakukan.
Evaluasi berasal dari bahasa Inggris evaluationyang berarti penilaian atau penaksiran (John M. Echols dan Hasan Shadily: 1983). Menurut Stufflebeam, dkk (1971) mendefinisikan evaluasi sebagai “The process of delineating, obtaining, and providing useful information for judging decision alternatives”. Artinya evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan informasi yang berguna untuk merumuskan suatu alternatif keputusan. Evaluasi adalah kegiatan mengukur dan menilai. Mengukur lebih besifat kuantitatif, sedangkan menilai lebih bersifat kualitatif.
Aplikasi Terhadap Proses Belajar Mengajar
Hasil belajar peserta didik dapat diklasifikasi ke dalam tiga ranah (domain), yaitu:
(1) domain kognitif (pengetahuan atau yang mencakup kecerdasan bahasa dan kecerdasan logika – matematika)
(2) domain afektif (sikap dan nilai atau yang mencakup kecerdasan antarpribadi dan kecerdasan intrapribadi, dengan kata lain kecerdasan emosional)
(3) domain psikomotor (keterampilan atau yang mencakup kecerdasan kinestetik, kecerdasan visual-spasial, dan kecerdasan musikal).
Pengajar harus mengetahui sejauh mana pebelajar (learner) telah mengerti bahan yang telah diajarkan atau sejauh mana tujuan/kompetensi dari kegiatan pembelajaran yang dikelola dapat dicapai. Tingkat pencapaian kompetensi atau tujuan instruksional dari kegiatan pembelajaran yang telah dilaksanakan itu dapat dinyatakan dengan nilai.
Sejauh mana masing-masing domain tersebut memberi sumbangan terhadap sukses seseorang dalam pekerjaan dan kehidupan ? Data hasil penelitian multi kecerdasan menunjukkan bahwa kecerdasan bahasa dan kecerdasan logika-matematika yang termasuk dalam domain kognitif memiliki kontribusi hanya sebesar 5 %. Kecerdasan antarpribadi dan kecerdasan intrapribadi yang termasuk domain afektif memberikan kontribusi yang sangat besar yaitu 80 %. Sedangkan kecerdasan kinestetik, kecerdasan visual-spatial dan kecerdasan musikal yang termasuk dalam domain psikomotor memberikan sumbangannya sebesar 5 %
Namun, dalam praxis pendidikan di Indonesia yang tercermin dalam proses belajar-mengajar dan penilaian, yang amat dominan ditekankan justru domain kognitif. Domain ini terutama direfleksikan dalam 4 kelompok mata pelajaran, yaitu bahasa, matematika, sains, dan ilmu-ilmu sosial. Domain psikomotor yang terutama direfleksikan dalam mata-mata pelajaran pendidikan jasmani, keterampilan, dan kesenian cenderung disepelekan. Demikian pula, hal ini terjadi pada domain afektif yang terutama direfleksikan dalam mata-mata pelajaran agama dan kewarganegaraan.
Agar penekanan dalam pengembangan ketiga domain ini disesuaikan dengan proporsi sumbangan masing-masing domain terhadap sukses dalam pekerjaan dan kehidupan, para guru perlu memahami pengertian dan tingkatan tiap domain serta bagaimana menerapkannya dalam proses belajar-mengajar dan penilaian.
Perubahan paradigma pendidikan dari behavioristik ke konstruktivistik tidak hanya menuntut adanya perubahan dalam proses pembelajaran, tetapi juga termasuk perubahan dalam melaksanakan penilaian pembelajaran siswa. Dalam paradigma lama, penilaian pembelajaran lebih ditekankan pada hasil (produk) dan cenderung hanya menilai kemampuan aspek kognitif, yang kadang-kadang direduksi sedemikian rupa melalui bentuk tes obyektif. Sementara, penilaian dalam aspek afektif dan psikomotorik kerapkali diabaikan.
Dalam pembelajaran berbasis konstruktivisme, penilaian pembelajaran tidak hanya ditujukan untuk mengukur tingkat kemampuan kognitif semata, tetapi mencakup seluruh aspek kepribadian siswa, seperti: perkembangan moral, perkembangan emosional, perkembangan sosial dan aspek-aspek kepribadian individu lainnya. Demikian pula, penilaian tidak hanya bertumpu pada penilaian produk, tetapi juga mempertimbangkan segi proses.
Macam-Macam Skala Pengukuran
Skala pengukuran merupakan seperangkat aturan yang diperlukan untuk mengkuantitatifkan data dari pengukuran suatu variable. Dalam melakukan analisis statistik, perbedaan jenis data sangat berpengaruh terhadap pemilihan model atau alat uji statistik. Tidak sembarangan jenis data dapat digunakan oleh alat uji tertentu. Macam-macam skala pengukuran dapat berupa skala nominal, ordinal, interval dan ratio.
Skala Nominal .
Pengukuran dengan skala nominal merupakan tingkat mengkategorikan, memberi nama dan menghitung fakta-fakta dari obyek yang diteliti. Dimana angka yang diberikan pada obyek hanya mempunyai arti sebagai label saja dan tidak menunjukkan tingkatan yang berarti.
Skala Nominal .
Pengukuran dengan skala nominal merupakan tingkat mengkategorikan, memberi nama dan menghitung fakta-fakta dari obyek yang diteliti. Dimana angka yang diberikan pada obyek hanya mempunyai arti sebagai label saja dan tidak menunjukkan tingkatan yang berarti.
contoh, kita dapat menempatkan individu untuk kategori seperti laki-laki dan perempuan tergantung pada jenis kelamin mereka, atau kecerdasan dengan kategori tinggi dan rendah berdasarkan nilai intelijen.
.
Skala Ordina .
Skala (ukuran) ordinal adalah skala yang merupakan tingkat ukuran kedua, yang berjenjang sesuatu yang menjadi ‘lebih’ atau ‘kurang’ dari yang lainnya. Ukuran ini digunakan untuk mengurutkan objek dari yang terendah hingga tertinggi dan sebaliknya yang berarti peneliti sudah melakukan pengukuran terhadap variable yang diteliti. Contohnya adalah: A lebih besar atau lebih baik dari pada B, B lebih besar dari atau lebih baik dari daripada C, dan seterusnya. Hubungan tersebut ditunjuk oleh simbol ‘>’ yang berarti ‘Lebih besar dari’ mengacu pada atribut tertentu. Kita bisa melanjutkan dengan latihan sebelumnya untuk membuatnya lebih jelas. Perlu diingat bahwa hubungan antara kedua peringkat adalah tidak bisa di gambarkan secara rinci bahwa nilai A adalah dua kali lipat dari B atau A empat kali lipat dari C
Skala Ordina .
Skala (ukuran) ordinal adalah skala yang merupakan tingkat ukuran kedua, yang berjenjang sesuatu yang menjadi ‘lebih’ atau ‘kurang’ dari yang lainnya. Ukuran ini digunakan untuk mengurutkan objek dari yang terendah hingga tertinggi dan sebaliknya yang berarti peneliti sudah melakukan pengukuran terhadap variable yang diteliti. Contohnya adalah: A lebih besar atau lebih baik dari pada B, B lebih besar dari atau lebih baik dari daripada C, dan seterusnya. Hubungan tersebut ditunjuk oleh simbol ‘>’ yang berarti ‘Lebih besar dari’ mengacu pada atribut tertentu. Kita bisa melanjutkan dengan latihan sebelumnya untuk membuatnya lebih jelas. Perlu diingat bahwa hubungan antara kedua peringkat adalah tidak bisa di gambarkan secara rinci bahwa nilai A adalah dua kali lipat dari B atau A empat kali lipat dari C
Skala Interval .
Merupakan tingkat pengukuran ke tiga, dimana pemberian angka pada set objek yang memilih sifat ordinal, ditambah dengan satu sifat yang lain, yakni memberikan nilai absolute pada data/ objek yang akan diukur. Ukuran rasio ini mempunyai nilai nol (0) absolute (tidak ada nilainya). Contoh Interval adalah timbangan seperti skala Fahrenheit dan IQ
Merupakan tingkat pengukuran ke tiga, dimana pemberian angka pada set objek yang memilih sifat ordinal, ditambah dengan satu sifat yang lain, yakni memberikan nilai absolute pada data/ objek yang akan diukur. Ukuran rasio ini mempunyai nilai nol (0) absolute (tidak ada nilainya). Contoh Interval adalah timbangan seperti skala Fahrenheit dan IQ
. Skala Rasio .
Merupakan tingkat pengukuran tertinggi, dimana ukuran ini mencakup semua persyaratan pada ketiga jenis ukuran sebelumnya, ditambah dengan satu sifat yang lain, yakni ukuran ini memberikan nilai absolute pada data/objek yang akan diukur. Ukuran rasio ini mempunyai nilai nol (0) .
Contoh : penghasilan pegawai 0 (berarti pegawai itu tidak menerima uang sedikitpun).
Merupakan tingkat pengukuran tertinggi, dimana ukuran ini mencakup semua persyaratan pada ketiga jenis ukuran sebelumnya, ditambah dengan satu sifat yang lain, yakni ukuran ini memberikan nilai absolute pada data/objek yang akan diukur. Ukuran rasio ini mempunyai nilai nol (0) .
Contoh : penghasilan pegawai 0 (berarti pegawai itu tidak menerima uang sedikitpun).
Sebuah bentuk skala akan mengingatkan kita pada alat ukur termometer, penggaris, atau mungkin dipandang sebagai satu item pengukuran, seperti dalam skala Likert. Hal ini menjadikan skala sebagai cara untuk mengukur secara sistematis yang ditetapkan berdasarkan skor atau nilai pada skala yang dipilih.
Meskipun sejumlah skala yang ada dapat dibuat untuk mengukur atribut orang, benda, peristiwa, dan sebagainya, semua skala memiliki empat tipe dasar yaitu: Nominal, Ordinal, Interval dan Rasio.
Skala ini sebenarnya merupakan empat hirarki prosedur pengukuran, terendah dalam hirarki adalah skala nominal dan yang tertinggi adalah skala pengukuran ratio. Itulah sebabnya ‘Tingkat pengukuran’ ini telah digunakan oleh beberapa sarjana dalam pembuatan dan penggunaan skala pengukuran.