VALIDITAS DAN RELIABILITAS
Validitas merupakan
syarat yang terpenting dalam suatu alat evaluasi. Suatu teknik evalusi
dikatakan mempunyai validitas yang tinggi (disebut valid) jika teknik evaluasi
atau tes itu dapat mengukur apa yang
sebenarnya akan diukur. Seperti yang dikatakan Cronbach :”How well a test or evaluative technique does
the job that is employed to do.” Validitas bukanlah suatu ciri yang relatif
terhadap tujuan yang hendak dicapai oleh pembuat tes. Teknik yang sama dapat
digunakan untuk beberapa tujuan yang berbeda, dan validitasnya dapat
berbeda-beda dari yang tinggi kepada yang rendah, bergantung pada tujuan. Suatu
tes pengerjaan berhitun, misalnya dapat mempunyai validitas yang tinggi untuk
menentukan status siswa-siswa sekarang dalam kecakapannya mengerjakan
berhitung. Validitas tes itu mungkin sedang atau cukup untuk mengukur kecakapan
murid-murid dalam hitung dagang dan mungkin juga tes tersebut mempunyai
validitas yang rendah dalam mengukur atau meramalkan keberhasilan dalam
aspek-aspek matematis dari suatu pelajaran ilmu alam yang akan datang.
Hasil yang diperoleh dalam kegiatan evaluasi
disebut data evaluasi. Data evaluasi yang sesuai dengan kenyatan disebut data
valid. Untuk memperoleh data yang valid diperlukan instrument evaluasi yang
valid pula. Terdapat 2 macam validitas, yaitu :
- Validitas LogisValiditas logis menggunakan instrument yang dinyatakan valid berdasarkan penalaran. Hal ini dikarenakan instrumenn tersebut dirancang baik sesuai dengan teori dan ketentuan yang ada. Maka dari itu, instrument tersebut tidak perlu diuji karena sudah sesuai dengan teori yang ada.Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu :a. Validitas isi : Validitas isi sudah dicapai oleh instrument jika instrument tersebut disusun berdasarkan isi materi pelajaran yang dievaluasi. Oleh karena materi pelajaran tersebut sudah ada di dalam kurikulum, maka validitas isi disebut juga validitas kurikuler.b. Validitas konstruksi (construct validity) : Kata konstruksi dalam pembahasan ini bukan diartikan sebagai susunan, namun merupakan suatu rancangan diciptakan oleh para ahli Ilmu jiwa untuk memperdalam ingatan, pemahaman, aplikasi dan lain-lain jiwa seseorang. Bentuk dari rancangan tersebut dalam suatu kegiatan belajar mengajar (KBM) adalah soal-soal dalam tes. Setiap butiran soal dirancang untuk mengukur dan memperdalam setiap aspek berpikir seseorang, apakah sesuai dengan tujuan instruksional.
- Validitas EmpirisValiditas empiris menggunakan instrument yang dinyatakan valid berdasarkan pengalaman. Maka dari itu, instrument tersebut harus diuji.Terdapat dua macam validitas empiris, yaitu :
a. Concurrent validity : Instrument yang memiliki validitas ini adalah instrument yang sudah tersedia dan sudah teruji berdasarkan pengalamannya.
b. Validitas prediksi (predictive validity) : Kata prediksi memiliki arti ramalan. Dengan begitu hal-hal yang dimaksudkan belum terjadi. Dalam validitas prediksi ini, dapat dikatakan berhasil, apabila beberapa waktu yang akan dating kenyataan sesuai dengan yang pernah diramalkan/diprediksikan.
Cara Mengetahui
Validitas Alat Ukur
Pearson mengatakan bahwa ada sebuah teknik yang
digunakan untuk mengetahui kesejajaran antara hasil tes dengan kriterium, yaitu
teknik korelasi product moment. Rumus
korelasi product moment terdapat 2
macam cara, yaitu :
1. Korelasi product moment dengan simpangan
2. Korelasi product moment dengan angka kasar
Validitas Butir Soal
atau Validitas Item
Validitas butir soal berguna untuk butir-butir soal
yang menyebabkan soal secara keseluruhan menjadi jelek karena memiliki
validitas yang rendah. Sedangkan validitas item berguna untuk mengetahui
validitas item jika mempunyai dukungan besar terhadap skor total. Jadi, sebuah
item memiliki validtas yang tinggi jika skor pada item sejajar dengan skor
total.
Cara lain untuk
menghitung validitas item adalah dengan menggunakan rumus sebagai berikut :
Reliabilitas
Reliabilitas adalah ketetapan atau ketelitian suatu alat
evaluasi. Suatu tes atau alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan
produktif. Jadi yang dipentingkan di sini ialah ketelitiannya : sejauh mana tes
atau alat tersebut dapat dipercaya kebenarannya.
Reliabilitas
suatu tes dinyatakan dengan coefficient
of reliability (r), yaitu dengan cara mencari korelasi. Misalnya :
- Dengan metode dua tes. Dua tes yang parallel dan setaraf (ekuivalen) diberikan kepada sekelompok anak. Hasil kedua tes tersebut kemudian dicarikan korelasinya. Dalam hal ini dapat juga digunakan metode Pearson dan metode Spearman seperti dikatakan terdahulu.
- Dengan metode satu tes: sebuah tes diberikan dua kali kepada sekelompok siswa yang sam, tetapi dalam waktu yang berbeda. Kedua hasil tes itu kemudian dicari korelasinya.
- Metode “Split-half”(masih dengan satu tes):
suatu tes dibagi menjadi dua bagian yang sama tingkat kesukarannya, sama isi
dan bentuknya. Kemudian dilihat skor masing-masing bagian paruhan tes tersebut
dan dicari korelasinya.Cara membagi misalnya dengan jalan semua item yang bernomor genap untuk tes A dan semua yang bernomor ganjil untuk tes B. setelah didapatkan korelasi antara setengah tes yang pertama (tes A) dengan setengah tes yang kedua (tes B), untuk menghitung keandalan seluruh tes itu digunakan rumus sebagai berikut :Keandalan seluruh tes (r) = 2x (reliability half test)/ 1 + (reliability half test)
- Termasuk “split-half
method” dengan cara lain yang
tidak emmerlukan perhitungan korelasi, yaitu sebagai berikut. Dengan
menggunakan standar deviasi masing-masing dari kedua bagian tes dan standar
deviasi seluruh tes. Rumusnya :Ket :SI = Standar deviasi dari ½ tes yang pertamaSII = Standar deviasi dari ½ tes yang keduaSt = Standar deviasi seluruh tes
- 1. Dengan metode kuder –Richardson, yaitu dengan menggunakan rumus yang dikemukakan oleh dua orang ahli measurement yang bernama Kuder dan Richardson. Koefisien korelasinya terkenal dengan KR 21 dan KR 20.Menurut kuder –Richardson, keandalan suatu tes dihitung dengan mencari :
Faktor-faktor yang Dapat Mempengaruhi Keandalan Suatu Tes
- Luas-tidaknya sampling yang diambil. Makin luas suatu sampling, berarti tes semakin andal.
- Perbedaan bakat dan kemampuan murid yang dites.
Makin variable kemampuan peserta tes, berarti makin tinggi keandalan koefisien tes. Tes yang diberikan kepada beberapa tingkat kelas yang berbeda lebih tinggi keandalannya daripada yang hanya diberikan kepada beberapa kelas yang sama karena tingkat kelas yang berbeda akan menghasilkan achievement yang lebih luas. - Suasana dan kondisi testing
Suasana ketika berlangsung testing, seperti tenang, gaduh, banyak gangguan, pengetes yang marah-marah dapat mengganggu pengerjaan tes sehingga dengan demikian mempengaruhi pula hasil dan keandalan tes.
Tidak ada komentar:
Posting Komentar