Tes psikologis memiliki tingkat validitas dan reliabilitas yang cukup tinggi. Hal ini membedakan dengan tes yang tidak standar seperti tes hasil belajar siswa yang dibuat oleh guru, tes penerimaan mahasiswa baru, tes calon pegawai negeri (PNS), dan sebagainya sejauh tesnya tidak dibakukan.
1. Validitas
Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar, 1997:5). Suatu tes atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut dapat menjalankan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Suatu tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah.
Dari uraian di atas mengandung arti bahwa valid-tidaknya suatu tes sebagai alat ukur tergantung pada mampu tidaknya alat ukur tersebut dapat mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur atribut inteligensi dan kemudian memang menghasilkan informasi mengenai atribut inteligensi (intelligence), dikatakan sebagai alat ukur yang memiliki validitas tinggi. Sebaliknya suatu tes yang dirancang untuk mengukur atribut bakat (aptitude), manun tidak bisa menghasilkan informasi bakat subyek yang telah dites, maka tes tersebut dikatakan tidak memiliki validitas yang tinggi.
Definisi validitas suatu tes sebagai alat ukur dapat dilihat dari sisi kecermatan pengukuran. Artinya suatu alat ukur yang valid, tidak hanya sekedar dapat mengungkap data dengan tepat, akan tetapi harus juga bisa memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu mampu memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subyek yang satu dengan yang lain. Contoh : pengukuran pada aspek fisik, bila kita hendak mengukur berat sebuah cincin emas, maka kita harus menggunakan alat penimbangan berat emas agar hasil penimbangannya valid, yaitu tepat dan cermat.
Dari uraian di atas, kiranya dapat diperoleh informasi yang cukup jelas tentang konsep validitas. Validitas berkenaan dengan kecermatan alat ukur untuk mengukur atribut subyek didik yang dikehendaki, artinya alat ukur yang valid adalah alat ukur yang dapat mengukur atribut yang hendak diukur dengan tepat dan cermat, sehingga hasil pengukurannya dapat menggambarkan atribut yang telah diukur.
Validitas tes psikologis dapat dibedakan menjadi tiga macam berdasarkan tiga sudut pandang (dari arah isi yang diukur, dari arah rekaan teoritis atau disebut contruct atribut yang diukur, dan dari arah kriteria alat ukur), yaitu; (1) validitas isi (content validity), (2) validitas kontruksi (construct validity), dan (3) validitas berdasar kriteria (criterion-related validity).
Validitas Isi (Content Validity)
Validitas isi tes psikologis menunjuk kepada sejauh mana tes psikologis yang merupakan perangkat soal-soal sebagai stimuli, dilihat dari isinya memang mengukur atribut psikologis yang dimaksudkan untuk diukur. Ukuran sejauh mana ini ditentukan berdasar derajat representatifnya isi tes psikologis itu terhadap keseluruhan atribut psikologis yang akan diukur. Validitas isi tes psikologis ditentukan melalui pendapat profesional (professional judgement) dalam proses telaah soal (item review).
Seorang ahli tes psikologis berhati-hati mengembangkan validitas ini melalui tahap pengembangan spesifikasi tes, lalu tahap berikutnya dilakukan analisis logis untuk menetapkan apakah soal-soal tes dimaksud memang mengukur atribut yang diukur. Dilihat dari aspek validitas isi, kegiatan telaah soal-soal tes (item review) merupakan kegiatan yang esensial dalam usaha pengembangan tes psikologis.
Validitas Konstruksi Teoretis (Construct Validity)
Atribut psikologis merupakan atribut yang tidak memiliki eksistensi riil (Suryabrata, 2000:42). Berbeda dengan atribut fisik, yang mempunyai eksistensi riil sehingga model pengukurannya lebih konkret yang berpengaruh dengan ketepatan (akurasi) hasilnya pengukurannya. Dalam atribut psikologis, seorang ahli membuat konstruksi teoritis guna mendeskripsikan atribut yang dipersoalkan, dengan demikian bagaimana kontruksi teoritis ini akan tergantung pada ilmuwan yang mengembangkannya. Oleh karena itu gambaran mengenai sesuatu atribut dapat bermacam-macam tergantung kepada teori siapa yang digunakan sebagai dasar pengembangan tes psikologis.
Sebagai contoh, gambaran mengenai kepribadian menurut Sigmund Freud (Das Es, Das Ich, dan Das Ueber Ich) tidak sama dengan gambaran teoritis kepribadian individu menurut teori Eric Berne (Status Ego Anak, Status Ego Dewasa, dan Status Ego Orang-tua). Begitu juga dalam teori inteligensi, gambaran atribut inteligensi menurut teori Thurstone berbeda dengan gambaran atribut inteligensi menurut teori Guilford.
Validitas Berdasar Kriteria (Criterion-Related Validity)
Validitas berdasar kriteria sering digunakan dalam pengembangan validitas tes psikologis. Hal ini dikarenakan telah tersedianya beberapa tes psikologis yang digunakan mengukur atribut psikologis yang sama. Misalnya untuk mengukur atribut inteligensi siswa sampai saat ini telah tersedia beberapa tes inteligensi, sehingga bila ilmuwan psikologi hendak mengembangkan tes psikologis dengan menggunakan validitas ini, maka koefisien korelasi hasil uji-coba tes inteligensi baru dapat dibandingkan dengan koefisien korelasi tes psikologis yang sudah memiliki validitas yang baik seperti tes PM (progressive matrices), CFIT (cutural fair intelligence test) atau IST (intelligence structure test), dan lainnya. Jadi validitas berdasarkan kriteria ditunjukkan dengan korelasi antara skor pada tes yang hendak dicari validitasnya dengan skor pada tes yang dijadikan kriteria.
Berdasarkan atas kapan kriteria itu dapat dimanfaatkan, validitas berdasar kriteria dapat dibagi menjadi dua macam, yaitu; concurrent validity dan predictive validity. Disebut concurrent validity, jika kriteria itu sekarang atau dalam waktu dekat dapat dimanfaatkan, dan disebut predictive validity bila kriteria itu baru beberapa waktu kemudian dapat dimanfaatkan. Contoh : concurrent validity, yaitu orang menggunakan skor WAIS (Wechsler Adult Intelligence Scale) atau CFIT (Cutural Fair Intelligence Test) sebagai kriteria sama saat. Contoh : predictive validity adalah validitas ujian masuk perguruan tinggi yang menggunakan IPK mahasiswa sebagai kriteria. Hasil belajar itu baru dimiliki oleh mahasiswa dalam waktu satu semester mendatang.
2. Reliabilitas
Reliabilitas merupakan hasil terjemahan dari kata reliability yang berasall dari kata rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel (reliable). Dalam berbagai kepustakaan, konsep reliabilitas memiliki arti yang luas, mencakup; keterpercayaan, keterandalan, keajegan, kestabilan, dan konsistensi hasil pengukuran, namun demikian ide pokok yang terkandung dalam konsep reliabilitas adalah keterpercayaan hasil pengukuran yaitu sejauh mana hasil pengukuran dapat dipercaya.
Sejalan dengan uraian di atas, Suryabrata (2000:29) menyatakan bahwa reliabilitas alat ukur menunjuk pada sejauh mana hasil pengukuran dengan menggunakan alat tersebut dapat dipercaya. Hal ini ditunjukkan oleh taraf keajegan (konsistensi) skor yang diperoleh para subyek yang diukur dengan alat ukur yang sama, atau diukur dengan alat yang setara pada kondisi yang berbeda.
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Dalam hal ini, relatif sama berarti tetap adanya toleransi terhadap perbedaan-perbedaan kecil di antara hasil beberapa kali pengukuran. Bila perbedaan itu sangat besar dari waktu ke waktu, maka hasil pengukuran tidak dapat dipercaya dan dikatakan sebagai tidak reliabel.
Estimasi reliabilitas tes psikologis dapat dilakukan dengan menggunakan tiga pendekatan, yaitu : (1) pendekatan tes ulang (retes), (2) pendekatan dengan tes paralel, dan (3) pendekatan satu kali pengukuran yang disebut teknik belah dua.
Pendekatan Tes Ulang (Retes)
Pendekatan ini dilakukan dengan cara satu perangkat tes psikologis diberikan kepada sekelompok subyek dua kali, dengan selang waktu tertentu, misalnya tiga minggu. Situasi testing pertama dengan testing kedua harus betul-betul sama, untuk menghindari adanya pengaruh faktor lain. Reliabilitas tes dicari dengan menghitung korelasi skor testing pertama dengan skor testing kedua, jadi rt-1 = rt-2.
Secara teoritik, pendekatan ini nampaknya baik, namun di dalam praktik banyak mengalami kelemahan, seperti kondisi subyek pada testing kedua tidak lagi sama dengan kondisi subyek pada testing pertama karena terjadi proses belajar dalam selang waktu testing pertama dengan testing kedua, kemungkinan lain adalah adanya perubahan pengalaman, motivasi, dan sebagainya.
Pendekatan dengan Tes Paralel
Pendekatan ini dilakukan dengan cara membuat tes paralel yaitu tes A dan tes B (keduanya dirancang bentuk paralel). Kedua tes tersebut diberikan kepada sekelompok subyek, lalu hasilnya dikorelasikan, jadi rt-A = rt-B. Suatu tes dinyatakan reliabel bila diperoleh koefisien korelasi yang signifikan antara skor hasil tes A dengan skor hasil tes B. Kelemahan reliabilitas ini terletak pada sulitnya membuat dua tes yang paralel.
Pendekatan Satu Kali Pengukuran
Pendekatan satu kali pengukuran disebut pendekatan belah dua, yaitu seperangkat tes diberikan kepada sekelompok subyek satu kali, lalu skor tes tesebut dibelah menjadi dua bagian, misalnya belahan ganjil genap artinya skor tes bernomor ganjil dijadikan belahan pertama, dan skor tes bernomor genap menjadi belahan kedua. Koefisien reliabilitas ditunjukkan pada signifikansi korelasi dua belahan skor tes bernomor ganjil dan skor tes bernomor genap, setelah koefisien korelasi tersebut dikoreksi dengan rumus Spearman Brown.
Contoh : Suatu tes terdiri atas 60 butir soal, mempunyai koefisien reliabilitas belahan ganjil genap = 0,70. Maka koefisien reliabilitasnya dapat dicari dengan menggunakan rumus Spearman Brown di bawah ini.
2(r-1.2)
r-SB = ――――
1+ r-1.2
Dalam mana :
r-SB = Koefisien reliabilitas Spearman Brown
r-1.2 = Koefisien korelasi kedua belahan
Jadi koefisien reliabilitasnya adalah :
2(r-1.2)
r-SB = ――――
1+ r-1.2
2(0,70) 1,4
r-SB = --------- = ----- = 0,8235
1+0,70 1,7
Koefisien reliabilitas Spearman Brown yang diperoleh = 0,8235 dibulatkan menjadi 0,82.