| Evaluasi Pembelajaran Matematika

VALIDITAS DAN RELIABILITAS

Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu teknik evalusi dikatakan mempunyai validitas yang tinggi (disebut valid) jika teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur. Seperti yang dikatakan Cronbach :”How well a test or evaluative technique does the job that is employed to do.” Validitas bukanlah suatu ciri yang relatif terhadap tujuan yang hendak dicapai oleh pembuat tes. Teknik yang sama dapat digunakan untuk beberapa tujuan yang berbeda, dan validitasnya dapat berbeda-beda dari yang tinggi kepada yang rendah, bergantung pada tujuan. Suatu tes pengerjaan berhitun, misalnya dapat mempunyai validitas yang tinggi untuk menentukan status siswa-siswa sekarang dalam kecakapannya mengerjakan berhitung. Validitas tes itu mungkin sedang atau cukup untuk mengukur kecakapan murid-murid dalam hitung dagang dan mungkin juga tes tersebut mempunyai validitas yang rendah dalam mengukur atau meramalkan keberhasilan dalam aspek-aspek matematis dari suatu pelajaran ilmu alam yang akan datang.

Hasil yang diperoleh dalam kegiatan evaluasi disebut data evaluasi. Data evaluasi yang sesuai dengan kenyatan disebut data valid. Untuk memperoleh data yang valid diperlukan instrument evaluasi yang valid pula. Terdapat 2 macam validitas, yaitu :

Validitas Logis

Validitas logis menggunakan instrument yang dinyatakan valid berdasarkan penalaran. Hal ini dikarenakan instrumenn tersebut dirancang baik sesuai dengan teori dan ketentuan yang ada. Maka dari itu, instrument tersebut tidak perlu diuji karena sudah sesuai dengan teori yang ada.

Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu :

a. Validitas isi : Validitas isi sudah dicapai oleh instrument jika instrument tersebut disusun berdasarkan isi materi pelajaran yang dievaluasi. Oleh karena materi pelajaran tersebut sudah ada di dalam kurikulum, maka validitas isi disebut juga validitas kurikuler.

b. Validitas konstruksi (construct validity) : Kata konstruksi dalam pembahasan ini bukan diartikan sebagai susunan, namun merupakan suatu rancangan diciptakan oleh para ahli Ilmu jiwa untuk memperdalam ingatan, pemahaman, aplikasi dan lain-lain jiwa seseorang. Bentuk dari rancangan tersebut dalam suatu kegiatan belajar mengajar (KBM) adalah soal-soal dalam tes. Setiap butiran soal dirancang untuk mengukur dan memperdalam setiap aspek berpikir seseorang, apakah sesuai dengan tujuan instruksional.
Validitas Empiris
Validitas empiris menggunakan instrument yang dinyatakan valid berdasarkan pengalaman. Maka dari itu, instrument tersebut harus diuji.
Terdapat dua macam validitas empiris, yaitu :
a. Concurrent validity : Instrument yang memiliki validitas ini adalah instrument yang sudah tersedia dan sudah teruji berdasarkan pengalamannya.
b. Validitas prediksi (predictive validity) : Kata prediksi memiliki arti ramalan. Dengan begitu hal-hal yang dimaksudkan belum terjadi. Dalam validitas prediksi ini, dapat dikatakan berhasil, apabila beberapa waktu yang akan dating kenyataan sesuai dengan yang pernah diramalkan/diprediksikan.

Cara Mengetahui Validitas Alat Ukur

Pearson mengatakan bahwa ada sebuah teknik yang digunakan untuk mengetahui kesejajaran antara hasil tes dengan kriterium, yaitu teknik korelasi product moment. Rumus korelasi product moment terdapat 2 macam cara, yaitu :

1. Korelasi product moment dengan simpangan

2. Korelasi product moment dengan angka kasar

Validitas Butir Soal atau Validitas Item

Validitas butir soal berguna untuk butir-butir soal yang menyebabkan soal secara keseluruhan menjadi jelek karena memiliki validitas yang rendah. Sedangkan validitas item berguna untuk mengetahui validitas item jika mempunyai dukungan besar terhadap skor total. Jadi, sebuah item memiliki validtas yang tinggi jika skor pada item sejajar dengan skor total.

Cara lain untuk menghitung validitas item adalah dengan menggunakan rumus sebagai berikut :

Reliabilitas

Reliabilitas adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu tes atau alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Jadi yang dipentingkan di sini ialah ketelitiannya : sejauh mana tes atau alat tersebut dapat dipercaya kebenarannya.

Reliabilitas suatu tes dinyatakan dengan coefficient of reliability (r), yaitu dengan cara mencari korelasi. Misalnya :

Dengan metode dua tes. Dua tes yang parallel dan setaraf (ekuivalen) diberikan kepada sekelompok anak. Hasil kedua tes tersebut kemudian dicarikan korelasinya. Dalam hal ini dapat juga digunakan metode Pearson dan metode Spearman seperti dikatakan terdahulu.
Dengan metode satu tes: sebuah tes diberikan dua kali kepada sekelompok siswa yang sam, tetapi dalam waktu yang berbeda. Kedua hasil tes itu kemudian dicari korelasinya.
Metode “Split-half”(masih dengan satu tes): suatu tes dibagi menjadi dua bagian yang sama tingkat kesukarannya, sama isi dan bentuknya. Kemudian dilihat skor masing-masing bagian paruhan tes tersebut dan dicari korelasinya.
Cara membagi misalnya dengan jalan semua item yang bernomor genap untuk tes A dan semua yang bernomor ganjil untuk tes B. setelah didapatkan korelasi antara setengah tes yang pertama (tes A) dengan setengah tes yang kedua (tes B), untuk menghitung keandalan seluruh tes itu digunakan rumus sebagai berikut :
Keandalan seluruh tes (r) = 2x (reliability half test)/ 1 + (reliability half test)
Termasuk “split-half method” dengan cara lain yang tidak emmerlukan perhitungan korelasi, yaitu sebagai berikut. Dengan menggunakan standar deviasi masing-masing dari kedua bagian tes dan standar deviasi seluruh tes. Rumusnya :

Ket :

S_I = Standar deviasi dari ½ tes yang pertama

S_II = Standar deviasi dari ½ tes yang kedua
S_t = Standar deviasi seluruh tes
1. Dengan metode kuder –Richardson, yaitu dengan menggunakan rumus yang dikemukakan oleh dua orang ahli measurement yang bernama Kuder dan Richardson. Koefisien korelasinya terkenal dengan KR 21 dan KR 20.
Menurut kuder –Richardson, keandalan suatu tes dihitung dengan mencari :

Faktor-faktor yang Dapat Mempengaruhi Keandalan Suatu Tes

Luas-tidaknya sampling yang diambil. Makin luas suatu sampling, berarti tes semakin andal.
Perbedaan bakat dan kemampuan murid yang dites.
Makin variable kemampuan peserta tes, berarti makin tinggi keandalan koefisien tes. Tes yang diberikan kepada beberapa tingkat kelas yang berbeda lebih tinggi keandalannya daripada yang hanya diberikan kepada beberapa kelas yang sama karena tingkat kelas yang berbeda akan menghasilkan achievement yang lebih luas.
Suasana dan kondisi testing
Suasana ketika berlangsung testing, seperti tenang, gaduh, banyak gangguan, pengetes yang marah-marah dapat mengganggu pengerjaan tes sehingga dengan demikian mempengaruhi pula hasil dan keandalan tes.

Pages

Evaluasi Pembelajaran Matematika

Rabu, 12 Maret 2014

Tidak ada komentar:

Posting Komentar

Daftar Blog Kelompok

Popular Posts

Blogger templates

Blogger news

Blogroll

About