Makalah : Kualitas Alat Ukur Instrumen
BAB
I
PENDAHULUAN
Untuk
mengetahui perkembangan dan kemajuan belajar siswa, perlu dilakukan suatu
penilaian dengan menggunakan berbagai teknik yang tepat. Penilaian dalam
pembelajaran dilakukan tidak hanya untuk menilai hasil belajar siswa melainkan juga
menilai proses belajar siswa. Dalam melakukan penilaian pembelajaran, ada
beberapa hal yang harus diperhatikan guru, terutama yang berhubungan dengan
jenis kompetensi yang akan dinilai, tujuan penilaian yang dilakukan, teknik –
teknik penilaian yang digunakan, dan jenis penilaian yang akan digunakan.
Dengan demikian kegiatan penilaian yang dilakukan menjadi tepet sasaran,
terarah, dan terencana.
Secara
teoritis terdapat hubungan timbal balik antara tujuan pembelajaran, proses
pembelajaran, dan penilaian hasil belajar. Jika tujuan pembembelajaran yang
dirumuskan sudah tepat dan proses pembelajaran yang dilakukan sudah maksimal
maka salah satu hal yang perlu kita cermati adalah alat penilaian hasil
belajar. Penilaian dapat didefinisikan sebagai suatu proses untuk mengambil
keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil
belajar baik yang menggunakan instrumen
tes
maupun non-tes. Jadi maksud penilaian adalah memberikan nilai tentang kualitas
sesuatu. Pengukuran sendiri diartikan sebagai pemberian angka
kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal
atau obyek tertentu menurut aturan atau formulasi yang jelas. Dari definisi
tersebut dapatlah ditarik kesimpulan bahwa pengukuran memiliki dua karakteristik
utama yaitu pertama penggunaan angka atau skala tertentu, dan kedua menurut
suatu aturan atau formula tertentu. Contoh kegiatan pengukuran adalah ketika
kita mengukur tinggi atau berat badan seseorang. Kita akan mengetahui berapa
tingginya atau beratnya. Atribut atau karakteristik yang kita cari dari contoh
pengukuran tersebut yaitu tinggi atau berat, kemudian hasil pengukuran tersebut
kita akan memperoleh angka, misalkan tinggi 1,75 meter atau beratnya 70
kilogram.
Pengukuran
dalam bidang bidang pendidikan bersifat kompleks. Kita hanya mengukur
karakteristik atau atribut tertentu, bukan peserta didik sendiri. Sebagai
contoh kita mengukur kemampuan siswa dalam bidang IPA. Kemampuan ini belum
tentu menggambarkan keseluruhan kepribadian dari siswa sendiri. Kita hanya
mengukur aspek tertentu yang dimiliki oleh siswa. Oleh sebab itu, pengukuran
seperti ini tidaklah sederhana, membutuhkan kemampuan penggunaan alat ukur yang
handal yang benar-benar mampu mengukur kemampuan siswa.
apakah
alat ukur yang anda gunakan ( dalam hal ini tes yang anda susun atau instrumen
lain yang anda gunakan ) mempunyai kualitas yang baik sehingga dapat digunakan
untuk mengukur tujuan pembelajaran yang telah anda tetapkan ?.
Untuk
menjawab permasalahan tersebut, kita akan diajak untuk mempelajari lebih rinci
berbagai cara yang dapat ditempuh untuk meningkatkan kualitas alat ukur atau
instrumen yang anda gunakan agar benar – benar dapat mengukur apa yang ingin
anda ukur. Dalam pembahasan ini akan dibahas mengenai pengujian kualitas alat
ukur atau instrumen yang akan membahas tentang validitas dan reliabilitas hasil
pengukuran dan tentang bagaimana cara menganalisis butir soal dan bagaimana
cara meningkatkan kualitas butir soal berdasarkan hasil analisis serta
bagaimana meningkatkan kualitas alat ukur non-tes.
BAB
II
KUALITAS
ALAT UKUR INSTRUMEN
A.
Validitas
dan Reliabilitas Hasil Pengukuran
Untuk mengukur
sesuatu kita harus dapat memilih alat ukur yang sesuai agar kita dapat
memperoleh hasil pengukuran yang tepat. Sebagai contoh, seorang pemanah akan
dinyatakan sebagai pemenang jika hasil bidikannya dapat dengan tepat mengenai
sasaran yaitu daerah lingkaran yang paling dalam atau yang paling mendekati
lingkaran yang paling dalam. Jika hasil bidikan peserta didik dapat mengenai
daerah di lingkaran paling dalam maka ia akan memperoleh skor tertinggi dan
perolehan skor tersebut semakin berkurang jika hasil bidikannya jauh dari
sasaran. Karena anak panah yang harus dilepaskan tidak hanya satu maka pemanah
dituntut untuk tetap dapat melepaskan anak panahnya tepat mengenai sasaran.
Hasil bidikan
dari peserta bisa tepat mengenai sasaran atau juga melesat dari sasaran. Hasil
yang sama dapat terjadi pada saat anda mengukur hasil belajar siswa. Jika alat
ukur yang anda gunakan tidak anda persiapkan dengan cermat maka skor yang anda
peroleh tidak dapat menggambarkan dengan tepat tingkat kemampuan siswa. Dari
penjelasan tersebut terdapat dua masalah pokok yang harus diperhatikan dalam
menyusun alat ukur hasil belajar yang baik yaitu masalah yang berhubungan
dengan ketepatan hasil pengukuran dan
ketetapan hasil pengukuran. Masalah
yang berhubungan dengan ketepatan hasil pengukuran inilah yang dikenal dengan
istilah validitas sedangkan maslah – masalah yang berhubungan dengan ketetapan
hasil pengukuran dikenal dengan istilah reliabilitas.
1.
Validitas
Alat ukur yang
baik adalah alat ukur yang dapat dengan tepat mengukur apa yang ingin diukur.
Jika kita ingin mengukur panjang sebuah meja maka kita harus dapat memilih alat
ukur yang tepat untuk mengukur panjang meja tersebut. Untuk menghitung waktu
tempuh pelari cepat dalam perlombaan lari cepat 100 meter maka kita juga harus
dapat memilih alat ukur yang tepat untuk digunakan. Demikian juga jika kita
ingin mengukur hasil belajar siswa maka kita juga dituntut untuk menggunakan
alat ukur ( dalam hal ini tes ) yang dapat dengan tepat mengukur hasil belajar
yang kita harapkan.
Pengertian
validitas mengacu pada ketepatan interpretasi yang dibuat dari hasil pengukuran
atau evaluasi ( Gronlund dan Linn, 1990). Secra umum validitas ada tiga jenis :
a. Validitas
isi ( concent validity ).
b. Validitas
konstrak ( construct validity ).
c. Validitas
yang dikaitkan dengan kriteria tertentu (
criterion related validity ).
Validitas
isi diperlukan untuk menjawab pertanyaan “ sejauh mana item – item yang ada
dalam tes dapat mengukur keseluruhan materi yang telah diajarkan “. Tinggi
rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau
pertimbangan ahli terhadap isi tes tersebut. Hal ini merupakan tuntutan yang
harus dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu tes
dapat dilihat pada perencanaan atau kisi – kisi tes. Semakin representatif
materi yang dapat ditanyakan dalam tes tersebut menunjukkan semakin tinggi
validitas isinya.
Validitas
konstrak mengacu pada sejauh mana alat ukur tersebut dapat mengungkap
keseluruhan konstrak yang digunakan sebagai dasar dalam penyusunan tes
tersebut. Yang dimaksud dengan konstrak disini adalah konsep hipotesis (hipotetical concept) yang digunakan
sebagai dasar dalam penyusunan alat ukur. Validitas konstrak ini banyak
digunakan terutama dalam pengukuran – pengukuran psikologi seperti pengukuran
sikap, minat, tingkah laku dan sebagainya. Campbell dan Fiske (Demari Mardapi,
2004) mengembangkan satu pendekatan untuk menentukan validitas konstrak dengan
menggunakan teknik multi trait-multi
method. Validasi dengan multi trait – multi method dilakukan dengan
menggunakan lebih dari satu metode untuk mengukur lebih dari satu acam trait ( sifat ). Dengan menggunakan
matrik korelasi sehingga interkorelasi antara trait dan metode dapat dilihat
dengan jelas.
Jika
suatu tes dimaksudkan untuk memprediksi keberhasilan seseorang di masa yang
akan datang atau dimaksudkan untuk mengetahui kesesuaian anatar pengetahuan
dengan keterampilan yang dimiliki maka alat ukur yang digunakan harus mempunyai
criterion related validity yang
tinggi.
2.
Reliabilitas
Hasil – hasil
pengukuran yang berhubungan dengan aspek – aspek fisik seperti mengukur panjang
meja, tinggi almari, berat badan dan tinggi badan biasanya menghasilkan
reliabilitas yang sangat tinggi. Artinya walaupun pengukuran dilakukan lebih
dari sekali tetapi tetap memberikan hasil yang ridak jauh berbeda. Hasil pengukuran
yenag berbeda akan sering kita temukan jika kita melakukan pengukuran terhadap
hal – hal yang berhubungan dengan aspek – aspek psikologi dan sosial seperti
dalam pengukuran mewakili intelegensi, sikap, dan konsep diri. Aspek – aspek
sosial-psikologi seperti itu tidak dapat diukur dengan ketepatan dan
konsistensi yang tinggi. Hal ini disebabkan karena hasil pengukuran yang
diperoleh tidak dapat lepas dari pengaruh hal - hal diluar maksud pengukuran
tersebut misalnya alat ukur itu sendiri bukan merupakan alat ukur yang tepat
untuk mengukur aspek yang diinginkan. Disamping itu karena subjek pengukurannya
adalah manusia maka cara – cara penyajian tes, emosi, motivasi. Kondisi fisik
dan keadaan ruangan tes akan mempengaruhi hasil pengukuran walaupun sebenarnya
aspek – aspek yang ingin kita ukur tersebut tidak berubah. Dengan demikian
hasil pengukuran yang diperoleh menjadi kurang reliabel.
Pengertian
reliabilitas mengacu pada ketetapan hasil
yang diperoleh dari suatu Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu
cara untuk mengetahui ketetapan atau reliabilitas suatu pengukuran, dapat
diperoleh dengan cara melakukan pengukuran dua kali. Hasil pengukuran dikatakan
mempunyai reliabilitas yang tinggi jika hasil pengukuran pertama hampir sama
dengan hasil pengukuran kedua. Dan sebaliknya hasil pengukuran dikatakan
mempunyai reliabilitas yang rendah jika hasil pengukuran pertama jauh berbeda
dengan hasil pengukuran kedua. Hubungan antar skor yang diperoleh pada
pengukuran pertama dengan kedua akan menghasilkan angka korelasi bergerak
antara -1 sampai dengan +1. Semakin tinggi angka koefisien reliabilitas
(mendekati 1) maka semakin tinggi reliabilitas tersebut. Suatu perangkat tes
dinyatakan cukup reliabel jika mempunyai reliabilitas lebih besar 0,5 (Fernandes,
1984).
Konsep
reliabilitas dalam arti equivalent tes dimaksudkan untuk mengetahui apakah dua
set tes yang digunakan paralel atau tidak. Keparalelan dua set tes ini
diperoleh dengan cara mengembangkan dua set tes yang paralel dari kisi - kisi
tes yang sama kemudian masing - masing tes tersebut diujikan pada dua kelas
yang mempunyai tingkat kemampuan yang sama. Hasil kedua tes tersebut
dikorelasikan, jika hasil korelasinya tinggi, hal ini menunjukan kedua tes
paralel. koefisien korelasinya dapat dihitung dengan menggunakan formula
product-moment.
konsep
reliabilitas dalam arti konsistensi internal dimaksudkan untuk mengetahui
apakah kumpulan butir soal yang ada dalam satu set tes tersebut mengukur
dimensi hasil belajar yang sama atau tidak. Konsep reliabilitas dalam asrti
konsistensi dapat dihitung menggunakan formula Kuder-Richardson (KR-20 atau
KR-21). Jika hasil korelasinya tinggi, hal ni menunjukan bahwa antara butir
soal dalam satu set tes tersebut adalah konsisten dengan yang lain.
3.
Hubungan
antara validitas dan reliabilitas
Ketepatan hasil
pengukuran ( validitas ) sangat diperlukan untuk memperoleh alat ukur yang
dapat memberikan hasil pengukuran yang tepat ( valid ). Walaupun demikian alat
ukur yang mempunyai reliabilitas tinggi belum tentu secara otomatis mempunyai
validitas yang tinggi. Karena tingginya reliabilitas yang dihasilkan oleh suatu alat ukur jika
tidak dibarengi dengan tingginya validitas dapat memberikan informasi yang
salah tentang apa yang ingin kita ukur.
Reliabilitas
suatu tes dapat ditingkatkan dengan menambah jumlah butir kedalam tes tersebut.
Penambahan butir soal pada tes akan meningkatkan reliabilitas jika butir soal
yang ditambahkan adalah butir soal yang homogen dengan butir soal – soal yang
ada.
B.
Analisis
dan Perbaikan Instrumen
Menurut Nitko
(1983), analisis butir soal menggambarkan suatu proses pengambilan data dan
penggunaan informasi tentang tiap - tiap butir soal terutama tentang respon siswa
terhadap setiap butir soal. Lebih Lnjut dikatakan bahwa arti penting penggunaan
analisis butir soal adalah sebagai berikut :
1. Untuk
mengetahui apakah butir soal – butir soal yang disusun sudah berfungsi sesuai
dengan apa yang dikehendaki oleh penyusun soal. Untuk menentukan apakah soal –
soal yang kita susun telah berfungsi sebagaimana seharusnya maka kita harus
memperhatikan hal – hal sebagai berikut :
a. Apakah
soal – soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku
seperti telah dirumuskan dalam tujuan instruksional khusus ?
b. Apakah
tingkat kesukaran sudah kita perhatikan ?
c. Apakah
soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang
kurang pandai ?
d. Apakah
kunci soal yang kita buat sudah benar sesuai dengan maksud soa ?
e. Jika
menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih sudah
berfungsi dengan baik ?
f. Apakah
soal tersebut dapat ditafsirkan ganda atau tidak ?
2. Sebagai
umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu
materi.
3. Sebagai
umpan balik bagi guru untuk mengetahui kesulitan – kesulitan yang dialami siswa
dalam memahami suatu materi.
4. Sebagai
acuan untuk merevisi soal.
5. Untuk
memperbaiki kemapuan kita dalam menulis soal.
Pada saat kita
engujikan suatu set soal untuk mengambil keputusan penting tentang hasil
belajar siswa maka idealnya kita harus yakin bahwa set soal tersebut adalah
valid dan reliabel. Validitas set soal dapat diketahui dari kisi – kisi soal
sedangkan reliabelitas soala baru dapat diketahui setelah uji coba. Dalam
rangka memperoleh reliabilitas set soal inilah analisis butir soal dilakukan.
Dalam menganalisis butir soal paling tidak ada dua karakteristik butir soal
yang perlu diperhatikan yaitu tingkat kesukaran dan daya beda butir – butir
soal.
a)
Tingkat
kesukaran butir soal
Besarnya tingkat
kesukaran butir soal, dapat dihitung dengan memperhatikan proporsi peserta tes
yang menjawab benar terhadap setiap butir soal. Secara matematis tingkat
kesukaran butir soal dapat dihitung dengan rumus :
P
= 

Keterangan
:
P adalah indeks
kesukaran butir soal
B adalah jumlah peserta
tes yang menjawab benar
N adalah jumlah
peserta tes
Menurut
Fernandes (1984), kategori kesukaran butir soal adalah sebagai berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 :
sedang
P < 0,24 : sukar
Butir soal yang
baik adalah butir soal yang memiliki tingkat kesukaran dalam kategori sedang.
b)
Daya
beda
Daya beda butir
soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan
kemampuan individu peserta tes. Daya beda butir soal dapat dihitung dengan
menggunakan rumus :
D=PA – PB
dimana,
D = indeks daya
beda butir soal
PA = proporsi kelompok atas yang
menjawab benar
PB
=
proporsi kelompok bawah yang menjawab salah
Secara teoritis
indeks beda soal (D) = 1 akan tercapai apabila semua siswa dalam kelompok atas
menjawab benar dan semua siswa dalam kelompok bawah menjawab salah. Indeks daya
beda soal (D) = -1 jika semua sisa dalam kelompok atas menjawab salah dan semua
siswa dalam kelopok bawah justru menjawab benar. Sedangkan indeks daya beda
soal (D) = 0 apabila proporsi siswa yang menjawab benar dalam kelompok atas dan
kelompok bawah adalah sama. Menurut Fernandes (1984) kategori indeks daya beda
butir soal adalah :
D ≥ 0,40 =
sangat baik
0,30 ≤ D ≤ 0,40
= baik
0,20 ≤ D <
0,30 = sedang
D < 0,20 =
tidak baik
Butir soal yang
perlu diperbaiki adalah butir soal yang terlalu sukar atau terlalu mudah dan
butir soal yang pengecohnya mempunyai daya beda positif atau kuncinya mempunyai
daya beda negatif. Perbaikan butir soal dapat dilakukan pada pokok soal atau
pada alternatif jawaban.
Menganalisis
Tes Uraian
Cara
menganalisis tes uraian menurut Whitney dan Sabers (Mehrens dan Lehmann, 1984)
adalah : (1) tentukan jumlah siswa yang termasuk kelompok atas (25%) dan
kelompok bawah (25%), (2) hitung jumlah skor kelompok atas dan jumlah skor kelompok
bawah, dan (3) hitung tingkat kesukaran dan daya beda setiap butir soal dengan
rumus berikut :


Dimana,
SA : jumlah
skor kelompok atas
SB : jumlah
skor kelompok bawah
N
: 25% peserta didik
Skor
maks : skor maksimal tiap buti tes
Skor
min : skor minimal tiap butir
tes
Memperbaiki Butir Soal
Beberapa
hal yang perlu diperhatikan dalam memperbaiki butir soal antara lain : a)
perhatikan tingkat kesukaran soal. Butir soal dianggap baik jika mempunyai
tingkat kesukaran (P) antara 0,25 sampai dengan 0,75 atau mendekati angka
tersebut, b) perhatikan daya beda butir soal. Butir soal dianggap baik jika
kunci atau jawabannya dianggap benar mempunyai beda positif tinggi dan
pengecohnya mempunyai daya beda negatif.
Memperbaiki Non-Tes
Prosedur
memperbaiki instrument non-tes sama dengan prosedur memperbaiki tes.
Penyempurnaan butir yang lemah dapat dilaksanakan dengan memperbaiki butir yang
kurang baik atau mengganti butir yang lama dengan butir yang baru. Penyebab
butir soal kurang baik, antara lain: a) penggunaan bahasa kurang komunikatif,
b) kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan ganda), c) pertanyaan
/ pernyataan yang dibuat menyimpang dari indikator, dan d) pertanyaan /
pernyataan tidak mengukur tarif (sifat) yang akan diukur.
BAB III
PENUTUP
Program
pengajaran adalah suatu rencana pelaksanaan proses belajar mengajar yang
didasarkan atas pertimbangan tujuan yang ingin dicapai, bahan, metode, alat,
alokasi waktu dan evaluasi agar siswa menguasai proses belajar dan hasil belajar
yang optimal. Kegiatan belajar mengajar adalah interaksi timbal balik antara
guru dengan siswa, siswa dengan siswa, dan siswa dengan bahan belajarnya. Dan
keberhasilan kegiatan belajar mengajar dipengaruhi oleh kuantitas dan kualitas
interaksi yang terjadi pada kegiatan tersebut.
Analisi item merupakan
suatu proses pengambilan dan penggunaan informasi tentang tiap – tiap butir
terutama informasi tentang respons siswa terhadap setiap butir soal. Informasi
dari hasil analisis item sangat bermanfaat bagi guru dan siswa. Bagi guru,
hasil analisis item dapat memeberi informasi kepada guru tentang kualitas butir
soal itu sendiri dan untuk mengetahui materi yang sudah atau belum dikuasai
oleh siswa. Bagi siswa sendiri hasil analisis item dapat menunjukan sampai
sejauh mana tingkat penguasaan materi yang telah dicapai. Analisis item
dilakukan pada tes pilihan berganda dan dapat pula dilakukan pada tes uraian
khususnya uraian terbatas. Dua karakteristik butir soal yang perlu diketahui
dalam analisis butir soal adalah tingkat kesukaran (P) dan daya beda (D). Butir
soal yang baik adalah butir soal yang mempunyai tingkat kesukaran sedang dengan
daya beda positif. Butir soal yang perlu diperbaiki adalah butir soal yang
terlalu sukar atau terlalu mudah dan butir soal yang pengecohnya mempunyai daya
beda positif atau kuncinya mempunyai daya beda negatif. Perbaikan butir soal
dapat dilakukan pada pokok soal atau pada alternatif jawaban.
oke
ReplyDeletekakak dari univ apa ya kak?
ReplyDelete