Lompat ke konten Lompat ke sidebar Lompat ke footer

MAKALAH EVALUASI PEMBELAJARAN DI SD MODUL 5 KUALITAS ALAT UKUR (INSTRUMEN)

TUGAS KELOMPOK EVALUASI PEMBELAJARAN DI SD 

MODUL 5 KUALITAS ALAT UKUR (INSTRUMEN)

Disusun Oleh: DINI LADY PUSPITHA ; HERMIN NURANIFAH ; SEPTIYAN DIAN TRISTIANA ; WIDIANTO HARI WIDODO       

MAKALAH EVALUASI PEMBELAJARAN DI SD MODUL 5 KUALITAS ALAT UKUR (INSTRUMEN)



MODUL 5
KEGIATAN BELAJAR  I
KUALITAS ALAT UKUR (INSTRUMEN)
PENDAHULUAN

Untuk mengetahui perkembangan dan kemajuan belajar siswa, perlu dilakukan suatu penilaian dengan menggunakan berbagai teknik yang tepat. Penilaian dalam pembelajaran dilakukan tidak hanya untuk menilai hasil belajar siswa melainkan juga menilai proses belajar siswa. Dalam melakukan penilaian pembelajaran, ada beberapa hal yang harus diperhatikan guru, terutama yang berhubungan dengan jenis kompetensi yang akan dinilai, tujuan penilaian yang dilakukan, teknik – teknik penilaian yang digunakan, dan jenis penilaian yang akan digunakan. Dengan demikian kegiatan penilaian yang dilakukan menjadi tepet sasaran, terarah, dan terencana.
Secara teoritis terdapat hubungan timbal balik antara tujuan pembelajaran, proses pembelajaran, dan penilaian hasil belajar. Jika tujuan pembembelajaran yang dirumuskan sudah tepat dan proses pembelajaran yang dilakukan sudah maksimal maka salah satu hal yang perlu kita cermati adalah alat penilaian hasil belajar. pengukuran memiliki dua karakteristik utama yaitu pertama penggunaan angka atau skala tertentu, dan kedua menurut suatu aturan atau formula tertentu. Contoh kegiatan pengukuran adalah ketika kita mengukur tinggi atau berat badan seseorang. Kita akan mengetahui berapa tingginya atau beratnya. Atribut atau karakteristik yang kita cari dari contoh pengukuran tersebut yaitu tinggi atau berat, kemudian hasil pengukuran tersebut kita akan memperoleh angka, misalkan tinggi 1,75 meter atau beratnya 70 kilogram.
-benar mampu mengukur kemampuan siswa.
apakah alat ukur yang anda gunakan ( dalam hal ini tes yang anda susun atau instrumen lain yang anda gunakan ) mempunyai kualitas yang baik sehingga dapat digunakan untuk mengukur tujuan pembelajaran yang telah anda tetapkan ?.
Untuk menjawab permasalahan tersebut, kita akan diajak untuk mempelajari lebih rinci berbagai cara yang dapat ditempuh untuk meningkatkan kualitas alat ukur atau instrumen yang anda gunakan agar benar – benar dapat mengukur apa yang ingin anda ukur. Dalam pembahasan ini akan dibahas mengenai pengujian kualitas alat ukur atau instrumen yang akan membahas tentang validitas dan reliabilitas hasil pengukuran dan tentang bagaimana cara menganalisis butir soal dan bagaimana cara meningkatkan kualitas butir soal berdasarkan hasil analisis serta bagaimana meningkatkan kualitas alat ukur non-tes.

   Validitas dan Reliabilitas Hasil Pengukuran
Untuk mengukur sesuatu kita harus dapat memilih alat ukur yang sesuai agar kita dapat memperoleh hasil pengukuran yang tepat. Sebagai contoh, seorang pemanah akan dinyatakan sebagai pemenang jika hasil bidikannya dapat dengan tepat mengenai sasaran yaitu daerah lingkaran yang paling dalam atau yang paling mendekati lingkaran yang paling dalam. Jika hasil bidikan peserta didik dapat mengenai daerah di lingkaran paling dalam maka ia akan memperoleh skor tertinggi dan perolehan skor tersebut semakin berkurang jika hasil bidikannya jauh dari sasaran. Karena anak panah yang harus dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap dapat melepaskan anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran atau juga melesat dari sasaran. Hasil yang sama dapat terjadi pada saat anda mengukur hasil belajar siswa. Jika alat ukur yang anda gunakan tidak anda persiapkan dengan cermat maka skor yang anda peroleh tidak dapat menggambarkan dengan tepat tingkat kemampuan siswa.Dari penjelasan tersebut terdapat dua masalah pokok yang harus diperhatikan dalam menyusun alat ukur hasil belajar yang baik yaitu masalah yang berhubungan dengan ketepatan hasil pengukuran dan ketetapan hasil pengukuran.Masalah yang berhubungan dengan ketepatan hasil pengukuran inilah yang dikenal dengan istilah validitas sedangkan maslah – masalah yang berhubungan dengan ketetapan hasil pengukuran dikenal dengan istilah reliabilitas.

A.      Validitas
Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa yang ingin diukur. Jika kita ingin mengukur panjang sebuah meja maka kita harus dapat memilih alat ukur yang tepat untuk mengukur panjang meja tersebut.Untuk menghitung waktu tempuh pelari cepat dalam perlombaan lari cepat 100 meter maka kita juga harus dapat memilih alat ukur yang tepat untuk digunakan. Demikian juga jika kita ingin mengukur hasil belajar siswa maka kita juga dituntut untuk menggunakan alat ukur ( dalam hal ini tes ) yang dapat dengan tepat mengukur hasil belajar yang kita harapkan.
Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi ( Gronlund dan Linn, 1990). Secra umum validitas ada tiga jenis :
a.       Validitas isi ( concent validity ).
b.      Validitas konstrak ( construct validity ).
c.       Validitas yang dikaitkan dengan kriteria tertentu ( criterion related validity ).
Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh mana item – item yang ada dalam tes dapat mengukur keseluruhan materi yang telah diajarkan “. Tinggi rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi tes tersebut.Hal ini merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu tes dapat dilihat pada perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat mengungkap keseluruhan konstrak yang digunakan sebagai dasar dalam penyusunan tes tersebut.Yang dimaksud dengan konstrak disini adalah konsep hipotesis (hipotetical concept) yang digunakan sebagai dasar dalam penyusunan alat ukur.Validitas konstrak ini banyak digunakan terutama dalam pengukuran – pengukuran psikologi seperti pengukuran sikap, minat, tingkah laku dan sebagainya.Campbell dan Fiske (Demari Mardapi, 2004) mengembangkan satu pendekatan untuk menentukan validitas konstrak dengan menggunakan teknik multi trait-multi method.Validasi dengan multi trait – multi method dilakukan dengan menggunakan lebih dari satu metode untuk mengukur lebih dari satu acam trait ( sifat ). Dengan menggunakan matrik korelasi sehingga interkorelasi antara trait dan metode dapat dilihat dengan jelas.
Jika suatu tes dimaksudkan untuk memprediksi keberhasilan seseorang di masa yang akan datang atau dimaksudkan untuk mengetahui kesesuaian anatar pengetahuan dengan keterampilan yang dimiliki maka alat ukur yang digunakan harus mempunyai criterion related validity yang tinggi.
B..      Reliabilitas
Hasil – hasil pengukuran yang berhubungan dengan aspek – aspek fisik seperti mengukur panjang meja, tinggi almari, berat badan dan tinggi badan biasanya menghasilkan reliabilitas yang sangat tinggi.Artinya walaupun pengukuran dilakukan lebih dari sekali tetapi tetap memberikan hasil yang ridak jauh berbeda. Hasil pengukuran yenag berbeda akan sering kita temukan jika kita melakukan pengukuran terhadap hal – hal yang berhubungan dengan aspek – aspek psikologi dan sosial seperti dalam pengukuran mewakili intelegensi, sikap, dan konsep diri. Aspek – aspek sosial-psikologi seperti itu tidak dapat diukur dengan ketepatan dan konsistensi yang tinggi.Hal ini disebabkan karena hasil pengukuran yang diperoleh tidak dapat lepas dari pengaruh hal - hal diluar maksud pengukuran tersebut misalnya alat ukur itu sendiri bukan merupakan alat ukur yang tepat untuk mengukur aspek yang diinginkan. Disamping itu karena subjek pengukurannya adalah manusia maka cara – cara penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan tes akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek yang ingin kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang diperoleh menjadi kurang reliabel.
Pengertian reliabilitas mengacu pada ketetapan hasil yang diperoleh dari suatu Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu cara untuk mengetahui ketetapan atau reliabilitas suatu pengukuran, dapat diperoleh dengan cara melakukan pengukuran dua kali. Hasil pengukuran dikatakan mempunyai reliabilitas yang tinggi jika hasil pengukuran pertama hampir sama dengan hasil pengukuran kedua. Dan sebaliknya hasil pengukuran dikatakan mempunyai reliabilitas yang rendah jika hasil pengukuran pertama jauh berbeda dengan hasil pengukuran kedua. Hubungan antar skor yang diperoleh pada pengukuran pertama dengan kedua akan menghasilkan angka korelasi bergerak antara -1 sampai dengan +1. Semakin tinggi angka koefisien reliabilitas (mendekati 1) maka semakin tinggi reliabilitas tersebut. Suatu perangkat tes dinyatakan cukup reliabel jika mempunyai reliabilitas lebih besar 0,5 (Fernandes, 1984).
Konsep reliabilitas dalam arti equivalent tes dimaksudkan untuk mengetahui apakah dua set tes yang digunakan paralel atau tidak. Keparalelan dua set tes ini diperoleh dengan cara mengembangkan dua set tes yang paralel dari kisi - kisi tes yang sama kemudian masing - masing tes tersebut diujikan pada dua kelas yang mempunyai tingkat kemampuan yang sama. Hasil kedua tes tersebut dikorelasikan, jika hasil korelasinya tinggi, hal ini menunjukan kedua tes paralel.koefisien korelasinya dapat dihitung dengan menggunakan formula product-moment.
konsep reliabilitas dalam arti konsistensi internal dimaksudkan untuk mengetahui apakah kumpulan butir soal yang ada dalam satu set tes tersebut mengukur dimensi hasil belajar yang sama atau tidak. Konsep reliabilitas dalam asrti konsistensi dapat dihitung menggunakan formula Kuder-Richardson (KR-20 atau KR-21). Jika hasil korelasinya tinggi, hal ni menunjukan bahwa antara butir soal dalam satu set tes tersebut adalah konsisten dengan yang lain.

C.      Hubungan antara validitas dan reliabilitas
Ketepatan hasil pengukuran ( validitas ) sangat diperlukan untuk memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat ( valid ). Walaupun demikian alat ukur yang mempunyai reliabilitas tinggi belum tentu secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas  yang dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan informasi yang salah tentang apa yang ingin kita ukur.

D. Meningkatkan Reliabilitas Tes
Reliabilitas suatu tes dapat ditingkatkan dengan menambah jumlah butir kedalam tes tersebut. Penambahan butir soal pada tes akan meningkatkan reliabilitas jika butir soal yang ditambahkan adalah butir soal yang homogen dengan butir soal – soal yang ada.


KEGIATAN BELAJAR 2
ANALISIS DAN PERBAIKAN INSTRUMEN

A.ANALISIS BUTIR SOAL
Menurut Nitko (1983), analisis butir soal menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang tiap - tiap butir soal terutama tentang respon siswa terhadap setiap butir soal. Lebih Lnjut dikatakan bahwa arti penting penggunaan analisis butir soal adalah sebagai berikut :
1.      Untuk mengetahui apakah butir soal – butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. Untuk menentukan apakah soal – soal yang kita susun telah berfungsi sebagaimana seharusnya maka kita harus memperhatikan hal – hal sebagai berikut :
a.       Apakah soal – soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan instruksional khusus ?
b.      Apakah tingkat kesukaran sudah kita perhatikan ?
c.       Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang kurang pandai ?
d.      Apakah kunci soal yang kita buat sudah benar sesuai dengan maksud soa ?
e.       Jika menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih sudah berfungsi dengan baik ?
f.       Apakah soal tersebut dapat ditafsirkan ganda atau tidak ?
2.      Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi.
3.      Sebagai umpan balik bagi guru untuk mengetahui kesulitan – kesulitan yang dialami siswa dalam memahami suatu materi.
4.      Sebagai acuan untuk merevisi soal.
5.      Untuk memperbaiki kemapuan kita dalam menulis soal.
Pada saat kita engujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajar siswa maka idealnya kita harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set soal dapat diketahui dari kisi – kisi soal sedangkan reliabelitas soala baru dapat diketahui setelah uji coba. Dalam rangka memperoleh reliabilitas set soal inilah analisis butir soal dilakukan. Dalam menganalisis butir soal paling tidak ada dua karakteristik butir soal yang perlu diperhatikan yaitu tingkat kesukaran dan daya beda butir – butir soal.

B. KAPAN ANALISIS BUTIR SOAL DILAKUKAN ?
1)      Tingkat kesukaran butir soal
Besarnya tingkat kesukaran butir soal, dapat dihitung dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap setiap butir soal. Secara matematis tingkat kesukaran butir soal dapat dihitung dengan rumus :
P =
Keterangan :
P adalah indeks kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah peserta tes
Menurut Fernandes (1984), kategori kesukaran butir soal adalah sebagai berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 : sedang
P < 0,24 : sukar
Butir soal yang baik adalah butir soal yang memiliki tingkat kesukaran dalam kategori sedang.

2)     Daya beda
Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta tes. Daya beda butir soal dapat dihitung dengan menggunakan rumus :
D=PA – PB
dimana,
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang menjawab benar
PB = proporsi kelompok bawah yang menjawab salah

Secara teoritis indeks beda soal (D) = 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab benar dan semua siswa dalam kelompok bawah menjawab salah. Indeks daya beda soal (D) = -1 jika semua sisa dalam kelompok atas menjawab salah dan semua siswa dalam kelopok bawah justru menjawab benar. Sedangkan indeks daya beda soal (D) = 0 apabila proporsi siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama. Menurut Fernandes (1984) kategori indeks daya beda butir soal adalah :
D ≥ 0,40 = sangat baik
0,30 ≤ D ≤ 0,40 = baik
0,20 ≤ D < 0,30 = sedang
D < 0,20 = tidak baik
Butir soal yang perlu diperbaiki adalah butir soal yang terlalu sukar atau terlalu mudah dan butir soal yang pengecohnya mempunyai daya beda positif atau kuncinya mempunyai daya beda negatif. Perbaikan butir soal dapat dilakukan pada pokok soal atau pada alternatif jawaban.

C. Menganalisis Tes Uraian
Cara menganalisis tes uraian menurut Whitney dan Sabers (Mehrens dan Lehmann, 1984) adalah : (1) tentukan jumlah siswa yang termasuk kelompok atas (25%) dan kelompok bawah (25%), (2) hitung jumlah skor kelompok atas dan jumlah skor kelompok bawah, dan (3) hitung tingkat kesukaran dan daya beda setiap butir soal dengan rumus berikut : 
Dimana
SA          :  jumlah skor kelompok atas
SB          :  jumlah skor kelompok bawah
N            :  25% peserta didik
Skor maks :  skor maksimal tiap buti tes
Skor min   :   skor minimal tiap butir tes

D. Memperbaiki Butir Soal
Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal antara lain : a) perhatikan tingkat kesukaran soal. Butir soal dianggap baik jika mempunyai tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau mendekati angka tersebut, b) perhatikan daya beda butir soal. Butir soal dianggap baik jika kunci atau jawabannya dianggap benar mempunyai beda positif tinggi dan pengecohnya mempunyai daya beda negatif.


E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument non-tes sama dengan prosedur memperbaiki tes. Penyempurnaan butir yang lemah dapat dilaksanakan dengan memperbaiki butir yang kurang baik atau mengganti butir yang lama dengan butir yang baru. Penyebab butir soal kurang baik, antara lain: a) penggunaan bahasa kurang komunikatif, b) kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan ganda), c) pertanyaan / pernyataan yang dibuat menyimpang dari indikator, dan d) pertanyaan / pernyataan tidak mengukur tarif (sifat) yang akan diukur.