Kamis, 20 Oktober 2011

Tes Terstandarisasi


A.    PENDAHULUAN
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik; yakni diketahui validitas dan reliabilitasnya baik validitas rasional maupun validitas empirik, reliabilitas dalam arti teruji tingkat stabilitas, maupun homoginitasnya.
Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah yang luas. Untuk mengukur validitas dan reliabilitasnya telah diuji-cobakan beberapa kali sehingga hasilnya dapat dipertanggungjawabkan. Yang dituntut dalam tes standar bukan standar prestasi peserta didik dari penguasaan materi yang diajarkan pada suatu tingkat, lembaga pendidikan tertentu, melainkan adanya kesamaan performance pada kelompok peserta didik atau lembaga pendidikan disebabkan adanya kesamaan tolok ukur. Oleh karena itu dalam tes standar, masalah keseragaman dan konsistensi skoring penting untuk diperhatikan; sehingga tes tersebut dapat dipakai untuk membandingkan peserta didik dari berbagai sekolah.
Standar untuk siswa dapat dimaksudkan seagai suatu tingkat kemampuan yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. jadi standar ini yang dibuat “keras” maupun “lunak” tergantung dari yang menggunakan keijaksanaan.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. sekali lagi tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan peseorangan maupun siswa sebagai anggota dari suatu kelompok.
Apabila pendidik bermaksud menstandarisasikan tes buatannya sendiri, memerlukan perencanaan yang baik, dilakukan uji coba di lapangan beberapa kali, dan ada beberapa yang perlu distandarisasikan, yaitu:
1. Materi yang akan diujikan,
2. Sistem evaluasi yang digunakan,
3. Waktu penyelesaian soalan tes,
4. Tingkat kesukaran tes, dan
5. Cara pengolahan hasil, termasuk skoring yang digunakan.
Sesungguhnya tes standar tidak hanya mecakup achievement test saja tetapi mencangkup personality tes, seperti tes sikap, tes minat, tes bakat, dan tes integelensi.
Anda perlu untuk mengenal berbagai macam tes yang telah dikembangkan. Dengan mengenal ini, Anda akan jauh cenderung untuk memilih tindakan yang paling sesuai untuk proyek penelitian Anda ini. Bab ini memberitahu Anda bagaimana untuk mencari informasi tentang tes dan membahas sepuluh jenis penting dari standar tes. Karena itu akan menjadi usaha besar bagi Anda untuk meninjau semua langkah-langkah yang tersedia, bab ini berisi informasi tentang menggunakan the Mental Measurements Yearbooks serta sumber utama informasi tentang langkah-langkah yang belum dipublikasikan. Para Buku Tahunan berisi deskripsi dan meninjau tes hampir semua diterbitkan dalam psikologi dan pendidikan dan sangat menyederhanakan tugas seleksi.

B.     PEMBAHASAN
JENIS TES YANG TERSTANDARISASI
I.                   CaraMenemukan Informasi Tentang Tes
Sebelum memilih tes tertentu, sebaiknya terlebih dahulu mengumpulkan informasi sebanyak mungkin mengenai hal itu. Mahasiswa sering buru-buru memutuskan tes dalam perencanaan penelitian dan kemudian menemukan kesulitan dalam menggunakan tes dan menafsirkan temuan.
Pedoman tes menyediakan banyak informasi yang dibutuhkan dalam mengevaluasi tes yang terstandarisasi. Pertanyaan dalam pedoman tersebut yang dapat membantu adalah sebagai berikut:
Apa konstruksi teori atau alasan yang mendasari tes ini?
Apa yang direkomendasikan menggunakan tes ini?
Validitas data apa yang tersedia? Apa jenis validitas telah dipelajari?
Apakah bukti validitas telah cukup untuk digunakan dalam penelitian yang direncanakan?
Reliabilitas data apa yang tersedia? Apakah ukuran reliabilitas cukup untuk memenuhi kebutuhan penelitian yang direncanakan?
Untuk jenis subyek seperti apates tersebut sesuai?
Bagaimanakah kondisi administrasi yang diperlukan untuk menggunakan tes?
Apakah memerlukan pelatihan khusus untuk menginterpretasikan tes?
Adakah bentuk pendek dari tes yang tersedia yang hasilnya akan sama secara substansial?
Meskipun pedoman tes dapat memberikan informasi yang berguna pada mahasiswa dalam mengevaluasi tes yang terstandarisasi tertentu, mahasiswa harus mampu mengevaluasi pedoman tes itu sendiri. Sebagai contoh, pedoman tes kadang-kadang tidak menyertakan bukti mengenai validitas dan reliabilitas yang tidak menguntungkan bagi penguji.
Beberapa tes yang terstandarisasi, terutama yang telah diteliti secara luas, cenderung melewati beberapa revisi. Anda harus yakin bahwa pedoman tes Anda sesuai untuk versi tes yang akan Anda evaluasi.

II.                Sumber Informasi tentang Tes dari Berbagai Referensi
Berikut ini adalah sumber informasi tentang tes yang dapat diakses:
1.      The Mental Measurements Yearbooks
Sebuah sumber informasi yang sangat penting pada tes standar,the Mental Measurements Yearbooks yang diterbitkan secara berkala, sebagian besar serinya adalah the Ninth Mental Measurements Yearbooks, yang diterbitkan pada tahun 1985. Ini benar-benar baru yang merupakan tambahan dari edisi sebelumnya. Edisi saat ini ada 1.409 tes dan mengandung 1.266 tinjauan uji kritis dan lebih dari 20.000 referensi pada pembangunan, penggunaan, dan keterbatasan tes khusus termasuk dalam edisi ini.
The Mental Measurements Yearbooks dapat digunakan untuk memperoleh informasi tentang tes khusus yang ditemukan di tempat lain, atau mereka dapat membantu anda menemukan tes yang tersedia dalam bidang tertentu. The Yearbooks ini juga alat yang sangat berharga untuk memeriksa tes yang digunakan orang lain pada penelitian mereka. The Yearbooks memiliki tiga indeks: untuk mendapatkan informasi pada tes tertentu, dengan mencari Indeks Judul; untuk menemukan tes yang tersedia di wilayah subjek tertentu, berkonsultasi dengan indeks Subjek Baris, untuk mengidentifikasi tes yang mengukur variabel tertentu, Indeks Skor ini tempat terbaik untuk memulai.
Bila anda menemukan tes di salah satu indeks yang menarik minat anda, perhatikan jumlah tes dan memeriksa setiap nomor dalam Tes dan bagian Ulasan buku ini. Di bawah nomor tes, anda akan menemukan daftar singkat informasi praktis, seperti jenis subyek yang dapat diberikan pengujian, nilai yang dihasilkan oleh tes, waktu administrasi, biaya, dan penerbit. Setelah data-data yang biasanya anda temukan sejumlah referensi yang berisi informasi tentang tes. Beberapa ratus referensi tersebut dapat tersedia untuk tes yang lebih banyak digunakan. Pemeriksaan cepat dari referensi ini seringkali akan mengungkapkan beberapa yang memiliki relevansi khusus untuk proyek penelitian anda. Ulasan tersedia untuk banyak tes yang tercantum. Evaluasi tersebut mungkin alat yang paling berharga dari the Mental Measurements  Yearbooks karena mereka menyediakan evaluasi tes oleh satu atau lebih otoritas di lapangan. Mereka biasanya ditulis oleh orang-orang yang telah bekerja secara ekstensif dalam lapangan dengan menguji yang bersangkutan dan dirancang khusus untuk memberikan tes dengan penilaian yang dapat membantu mereka dalam mengevaluasi tes. Ulasan umumnya yang kritis dan mengatasi sebagian besar bagian-bagian yang penting dalam evaluasi tes, sehingga anda diberikan evaluasi yang lebih sehat dari yang anda buat untuk diri sendiri.
2.      Kumpulan Tes ETS
Jika anda menemukan langkah-langkah yang anda butuhkan dalam the Mental Measurements Yerbooks, langkah berikutnya anda harus mencari bagian-bagian yang relevan dari kumpulan Educational Testing Service (ETS). Ini adalah Koleksi yang paling luas dari tes dan perangkat pengukuran lain yang tersedia, terdiri atas lebih dari 14.000 instrumen, baik dipublikasikan dan tidak dipublikasikan. ETS koleksi ini didirikan untuk membantu peneliti dan lainnya yang membutuhkan informasi tes. anda dapat memperoleh informasi spesifik dengan menulis atau menelpon ETS. Dalam kebanyakan kasus, bagaimanapun, cara terbaik untuk menggunakan koleksi ini adalah untuk membeli Bibliografi Koleksi yang berhubungan dengan minat anda dan kemudian salinan mikrofis urutan langkah yang paling menjanjikan dijelaskan dalam bibliografi. Bibliografi terus-menerus diperbarui dan lebih cenderung berisi informasi terbaru dari the Mental Measurements Yearbooks.
Saat ini, dijelaskan ETS bibliografi yang tersedia di lebih dari 200 daerah. Deskripsi setiap ukuran dalam bibliografi mencakup judul, penulis, tanggal publikasi, kelompok sasaran, dan penerbit atau sumber. Karena banyak tes dikutip dalam literatur penelitian pendidikan tidak tersedia secara komersial, ETS membuat mereka tersedia di mikrofis. mikrofis dapat dibeli untuk tindakan individu atau untuk set 50 sampai 100 langkah. Banyak perpustakaan universitas telah membeli set ini, jadi cek dengan pustakawan referensi anda sebelum membeli microfiches.
3.      Kritik Tes
Kritik Tes, Jilid ketujuh karya Keyser dan Sweetland sekitaran 1984-1988, berisi kritik tes dipilih oleh spesialis di bidang tertentu, oleh karena itu penggunaan pengukuran yang lebih luas biasanya di review. Setiap review meliputi lima bagian: Sebuah Pengantar, yang menjelaskan secara rinci tes dengan latar belakang perkembangan yang relevan; Aplikasi Partical / Menggunakan bagian, yang memberikan informasi tentang administrasi, skor, dan tafsiran; bagian tentang Aspek Teknis, yang berkaitan dengan reliabilitas dan validitas, sebuah kritik secara keseluruhan, yang sangat berguna dalam membantu anda mengevaluasi tes; dan daftar singkat Referensi yang berhubungan dengan ukuran dan topik terkait. Rata-rata, tujuh sampai delapan halaman yang dikhususkan untuk mengukur masing-masing, dan banyak informasi yang disediakan. Buku Jilid tujuh ini tersedia lebih dari 700 ukuran, dan jilid berikutnya yang direncanakan pada interval enam sampai sembilan bulan lagi. Dalam menggunakan jilid ini, pendekatan terbaik adalah untuk memeriksa jilid terbaru, karena mengandung indeks kumulatif yang mencakup semua jilid. Jika anda mencari data evaluasi pada tes yang berada di tempat lain, gunakanlah indeks tes judul. Jika anda mencoba untuk mencari tes di daerah subjek tertentu, gunakanlah indeks subjek.
Buku jilid ini, bersama dengan the Mental Measurements Yearbooks, adalah sumber informasi terbaik evaluasi tes yang tersedia. Keuntungan utama dari Kritik Test adalah ketelitian informasi yang diberikannya untuk setiap ukuran. Keterbatasan utamanya adalah tindakan yang kecil tertutupi sejauh ini. Sebagai buku jilid baru menjadi lebih tersedia, keterbatasan ini akan sangat diatasi.

4.      Tes-Sebuah Referensi Penilaian Komprehensif dalam Psikologi, Pendidikan, dan Bisnis Edisi kedua
Tests-Sebuah Referensi Komprehensif (disunting oleh Sweetland dan Keyser, 1986) menyediakan informasi mengenai lebih dari 3.000 tes. Informasi pada setiap tes termasuk pernyataan tujuan tes, deskripsi tes, waktu administrasi, kisaran kelas, informasi penilaian, biaya, dan penerbit. Tes terdaftar di bawah tiga judul utama: Psikologi, Pendidikan, dan Bushiness dan Industri. Setiap bagian tersebut pada gilirannya dibagi menjadi beberapa subbagian yang spesifik. Sebagai contoh, subbagian di bawah Pendidikan meliputi bidang-bidang seperti Subjek Akademik, Prestasi dan Bakat, Kecerdasan, Membaca, dan Pendidikan Khusus.
Untuk menggunakan referensi ini pada suatu tes di bidang tertentu, periksa daftar isi dan menemukan subbagian yang relevan. Kemudian beralih ke seksi ini dan memindai informasi yang diberikan. Sebagai contoh, jika anda sedang mencari langkah yang dirancang untuk mengidentifikasi kelas pertama anak-anak dengan ketidakmampuan belajarnya anda akan memeriksa "kesulitan Belajar" dalam tabel contens. Pengujian di bidang ini dijelaskan pada halaman 576-589 dalam referensinya. Anda kemudian bisa mengidentifikasi ukuran tertentu yang akan memenuhi kebutuhan anda dengan memindai informasi yang disediakan pada halaman ini. Buku ini juga berisi beberapa indeks, termasuk indeks judul tes, indeks penulis, dan daftar out-of-print tes. Sayangnya, tidak ada indeks atau indeks subjek skor.
Buku ini merupakan sebuah sumber yang sangat baik untuk mencari tes yang relevan dengan kebutuhan anda. Namun, tidak berguna dalam mengevaluasi tes, karena tidak ada informasi mengenai reliabilitas, validitas, atau norma yang disertakan.

5.      Pengembangan Tes
Sumber informasi baru yang terbaik pada tes adalah sering menjadi pengembangan tes. Karena ada jeda yang cukup besar antara penyelesaian penelitian dan publikasi, pengembangan tes sering memiliki informasi tentang tes yang belum dicetak dan mungkin juga untuk mengetahui peneliti lain yang baru saja digunakan untuk mengukur. Menghubungi pengembang tes sangat berguna dalam mendapatkan data terbaru pada tes baru-baru ini yang dikembangkan, yang mungkin ada data yang diterbitkan yang sangat sedikit pada validitas dan karakteristik penting lainnya, tetapi data tidak dipublikasikan banyak. Jadi, kami menyarankan anda untuk menulis ke pengembang tes dan meminta informasi yang belum muncul di media cetak. Jika surat anda menjelaskan tujuan dimana anda ingin menggunakan tes, pengembang tes berkemungkinan besar akan bersikap kooperatif. Salah satu alasan kerjasama ini adalah agar para pengembangan tes dapat menambahkan temuan dari proyek penelitian anda untuk dikumpulkan.

6.      Tes itu sendiri
Salah satu sumber informasi yang paling penting tentang standar tes adalah tes itu sendiri, terutama jika anda prihatin tentang masalah validitas muka, validitas isi, atau ketepatan tes untuk sampel anda. Pedoman tes dapat di klaim, misalnya, bahwa tes tertentu cocok untuk siswa kelas lima. Pemeriksaan anda dari salinan test yang menampakkan kemampuan membaca berada di luar yang ada pada kelima kelas yang sedang  anda rencanakan untuk menguji. Kami menganggap bahwa penelitian anda memerlukan evaluasi dari dua metode untuk bacaan pengajaran. Dalam memilih tes prestasi membaca untuk mengevaluasi efektivitas dua metode, anda mungkin menemukan bahwa pedoman tes dan the Mental Measurements Yearbooks tidak memberikan informasi yang cukup tentang isi bacaan yang dicakup oleh tes. Sumber informasi yang terbaik untuk menentukan apakah isi bacaan dicakup oleh pengujian perwakilan yang termasuk dalam bahan pelatihan anda ini adalah salinan dari tes itu sendiri.

7.      Sumber-sumber lainnya

Selain sumber-sumber informasi tes yang tercantum di atas, kompilasi lainnya dimasukkan dalam Referensi Beranotasi di akhir bab ini. Lihat ini jika anda mencari sumber yang disebutkan di atas tidak menemukan suatu ukuran yang cocok untuk penelitian anda.
Jika sumber-sumber tambahan juga gagal untuk mengubah sebuah ukuran yang cocok, anda dapat merancang dan melakukan pencarian komputer dari basis data yang paling relevan, menggunakan prosedur yang diuraikan dalam bab 4. ERIC clearinghouse untuk tes dan pengukuran di Educational Testing Service di Princenton, New Jersey, feed yang banyak informasi ke dalam sistem ERIC. Jika pencarian komputer gagal, alternatif terakhir anda adalah untuk mengubah topik riset anda atau untuk pengukuran pengembangan anda sendiri.
8.      Cara Memperoleh copyan tes
Begitu anda telah memutuskan pada tes standar (atau tes) yang ingin Anda gunakan, Anda perlu mendapatkan sejumlah salinan dari setiap tes. Jika tes ini didistribusikan melalui penerbit seperti Science Research Associates atau Corporation Psikologis, anda harus membeli salinan dari mereka. Penerbit dan harga pembelian tes tertentu dapat ditemukan dalam edisi terbaru the Mental Measurements Yearbooks. Kampus bimbingan dan pusat pengujian sering memiliki katalog yang diterbitkan oleh penerbit tes yang menyediakan juga informasi tersebut. Dalam situasi apa pun anda mendapatkan satu salinan ujian dan kemudian menduplikasi atau memfotokopi salinan, ini merupakan pelanggaran hak cipta dan ilegal. Kadang-kadang tes dengan semua item yang akan muncul awalnya dalam publikasi profesional, jika tidak ada referensi hak cipta, Anda mungkin duplikat seperti tes dengan izin penulis untuk digunakan dalam proyek penelitian. Dalam kasus apapun, kami menyarankan Anda untuk menulis pengembang tes dalam memberikan informasi tentang proyek Anda dan untuk meminta informasi apapun tidak dalam artikel yang diterbitkan berkaitan dengan validitas tes, reliabilitas, administrasi, dan penilaian.
            Kualifikasi yang diperlukan untuk mengatur, skor, dan menafsirkan tes sangat bervariasi dari tes. Beberapa memerlukan sedikit lebih dari kemampuan untuk membaca dan memahami buku manual, yang lainnya memerlukan cukup banyak pelatihan khusus dan berlatih dengan pengawasan. Standar untuk Pengujian Pendidikan dan Psikologis menentukan bahwa pengguna harus menyatakan setiap kualifikasi khusus yang diperlukan untuk administrasi dan menafsirkan tes. Dalam rangka untuk memastikan tes yang digunakan oleh personel yang berkualitas, penerbit tes memiliki tanggung jawab etis untuk memeriksa persyaratan calon pembeli. Penerbit tes mungkin memerlukan sponsor oleh seorang psikolog atau pendidik memegang gelar doktor jika seorang mahasiswa pascasarjana berencana untuk membeli tes tertentu. Ketua Tesis Anda atau para anggota komite adalah kandidat kemungkinan besar untuk menjadi penjamin.

III.             Jenis Tes Yang Terstandarisasi
Istilah standar dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan–pertanyaan yg sama dari sejumlah besar pertanyaan dikerjakan dengan mengikuti petunjuk yang sama dan dalam batas waktu yang sama pula.
Tes terstandarisasi dikembangkan dengan upaya untuk sejauh mungkin mengikuti prosedur dan memenuhi persyaratan secara ketat. Dalam pengembangan tes terstandarisasi, ciri-ciri pokok dan persyaratan tes yang baik dikaji secara sadar dan terecana dan diusahakan pemenuhannya.Semua itu dilakukan untk memperoleh tes yang baik mutunya, sesuai dengan tujuan penuyusunan memiliki tingkat reliabilitas yang tinggi dan dapat digunakan secara praktis.
Tes terstandar biasaya dilengakapi dengan sebuah pedoman. Pedoman berisi keterangan-keterangan, petunjuk-petunjuk yang menjelaskan tentang pelaksanaan. Menskor dan membuat interpretasi serta memberikan saran-saran. Secara garis besar pedoman tes terstandar ini memuat:
a.              Ciri-ciri mengenai tes, misalnya menyebutkan tingkat validitas,reliabilitas, dan sebagainya.
b.              Tujuan serta keuntngan – keuntungan tes, misalnya untuk siapa tes tersebut diberikan dan tujuannya apa.
c.              Proses standarisasi tes, misalnya mengenai hal-hal yang berhubungan dengan sampel.
Dalam bab ini, tes standar diklasifikasikan menjadi 10 jenis utama dan beberapa contoh dari setiap jenis yang sering digunakan dalam penelitian.
1.      Tes kecerdasan
Teskecerdasanmemberikan perkiraantingkatintelektual umumdengan samplingkinerja seseorangpada berbagaitugas. Tugas-tugas inidapat mencakupdefinisikata,pemecahanmasalah matematika, pengetahuan umum, dan memori jangka pendek. Tes kecerdasanmenghasilkanskor globaltunggalkinerja padatugas-tugas. Skor inidisebutIQ(intelligence quotient). Beberapa teskecerdasan juga menghasilkansubscoresuntuk fungsiintelektualtertentu,seperti hubunganspasial, kemampuan verbal, penalarannumerik, dan penalaranlogis.
Tes kecerdasansangat dijunjung tinggioleh para penelitipendidikan danpersonil sekolahkarena keberhasilan merekadalam memprediksiprestasi sekolah. Bahkan sering disebuttes bakatskolastikkarenamayoritas dari tes tersebutmengukuraspek-aspekkecerdasan yangtampaknyadiperlukan untuk suksesdalam belajardi sekolah.
Ukurankecerdasan bisadiberikan dengan mengambil bentukkelompok atauindividu.Keduanya memiliki kelebihan dan kelemahan tersendiri.Tes kelompokmemiliki keuntungan daribiaya rendah dibandingkan tes individu, sertamemberikan ukurankecerdasanscolasticyangmemuaskanuntuk tujuan penelitian.Sedangkan kelemahantes kelompokadalah ketidakmampuanuntuk mengidentifikasisiswadalam kelompokyang sakit,negatif terhadaptes,atau mengalamicacatyang akan menyebabkanmereka membuat skorrendah.Tesindividumengatasi kesulitantersebut.
Contoh untuk tes kecerdasan individual yang paling dikenal adalah skala kecerdasan Standford-Binet.Skala ini lebih cocok untuk pengujian anak-anak, remaja akhir dan dewasa.Selain itu ada WechslerAdultIntelligenceScale (WAIS) cocokuntuk pengujianremajaakhir dan orang dewasa.WechslerIntelligenceScale for Children (WISC) ​​adalah perpanjanganke bawah dariWAISdan cocokuntuk pengujiananak-anakberusia antara5 sampai15. Tes yang palingterakhir diseri iniadalahWechslerPreschooldan Primary Scale ofIntelligence(WPPSI), yang diterbitkanpada tahun 1967. Ini dirancanguntuk pengujiananak-anakantara usiaempat dan enamsetengah.
Tes kecerdasan kelompok juga banyak tersedia, diantaranya yang sering digunakan adalah School and College Ability Tests (SCAT), tes Kuhlmann-Anderson, tes kecerdasan Lorge-Thorndike, dan tes Otis-Lennon School Ability.

2.      Tes bakat
Tes bakat ditujukan untuk prediksi kinerja siswa dalam perilaku spesifik.Tes yang tersedia untuk mengukur bakat bagi banyak mata pelajaran tertentu seperti bahasa asing, seni, musik, dan matematika.Contoh tes tersebut Orleans-Hanna Algebra Prognosis Test, dan Metropolitan Readiness Tests.Tes bakat untuk mengukur keterampilan yang diperlukan dalam berbagai pekerjaan juga tersedia.Ini termasuk tes sensorik kapasitas, bakat mekanik, dan bakat untuk menjual.
Sebuah kecenderungan utama dalam pengujian pendidikan adalah perkembangan dari pengujian yang mengukur berbagai macam bakat yang berkaitan dengan keberhasilan kejuruan dan skolastik. Sebagai contoh, General Aptitude Test Battery (GATB) yang dikembangkan oleh Layanan Ketenagakerjaan US langkah-langkah tersebut mencatat bakat: intelijen; verbal, numerik, spasial, dari persepsi, koordinasi motorik, ketangkasan jari, dan ketangkasan manual. Differential Aptitude Test (DAT) yang lain adalah tes yang sering digunakan untuk konseling dan penelitian dengan siswa sekolah menengah dan orang dewasa. Delapan bakat diukur oleh DAT: penalaran verbal, kemampuan numerik, penalaran abstrak, kecepatan dan ketepatan administrasi, penalaran mekanik, hubungan ruang, ejaan, dan penggunaan bahasa. Tes bakat yang sering digunakan dalam penelitian pendidikan awalnya untuk menyamakan kelompok yang menerima dua perlakuan eksperimen yang berbeda.Sebagai contoh, jika ingin membandingkan efektivitas dua metode pengajaran aljabar kelas sembilan. Jika siswa yang akan digunakan dalam percobaan berbeda dalam hal bakat aljabar, kelompok dengan kemampuan yang lebih tinggi mungkin belajar lebih terlepas dari metode ini. Oleh karena itu, dalam rangka untuk mengevaluasi efektivitas dua metode, kita menyamakan dua kelompok pada bakat aljabar atau untuk membuat penyesuaian statistik untuk perbedaan awal ditemukan oleh tes bakat.Tes bakat juga digunakan dalam penelitian untuk mengidentifikasi siswa dari tingkat kecerdasan tertentu untuk studi khusus. Sebagai contoh, Anda mungkin ingin untuk mengidentifikasi siswa yang memiliki bakat sangat rendah untuk belajar bahasa asing dalam rangka untuk menentukan metode apa yang dapat dikembangkan untuk mengajarkan bahasa asing secara efektif untuk siswa tingkat ini.

3.      Tes prestasi
Tes prestasi banyak tersedia.Beberapa tes dimaksudkan untuk mengukur pengetahuan siswa mengenai fakta yang spesifik, pemahaman siswa dan penguasaan prinsip-prinsip dasar.Meskipun tes prestasi telah dikritik atas dasar sosial, tes tersebut  mungkin yang paling valid, dapat diandalkan, dan berguna untuk peneliti pendidikan.
Administrasi waktu untuk tes prestasi yang berbeda sangat bervariasi, beberapa  tes mengambil sedikitnya 30 menit, sedangkan yang lain memerlukan dua hari pengujian. Tes prestasi juga berbeda dalam subjek-materi cakupan.Uji Beragam Prestasi (wide range achievement) berisi tes dalam bidang membaca, mengeja, dan berhitung membutuhkan kurang dari 30 menit untuk mengelola.Sebaliknya tingkat menengah Metropolitan Achievement Test menyediakan 7 nilai yang berhubungan dengan membaca, 6 nilai berhubungan dengan bahasa, dan 8 nilai berkaitan dengan matematika dan memerlukan waktu selama 10 jam untuk menyelesaikannya.
Dalam memilih suatu tes prestasi untuk proyek penelitian, harus terlebih dahulu memutuskan bidang prestasi yang akan diukur dan kemudian mengevaluasi tes yang dimaksudkan untuk mengukur prestasi di bidang ini.

4.      Tes diagnostik
Kadang-kadangtujuandari proyekpenelitian adalahuntuk mengevaluasiefektivitas programperbaikan. Dalam situasiini penelitimungkin akanbermanfaat untukmenggunakan salah satu dariberbagai tes diagnostikyang tersediauntuk mengidentifikasisiswayang membutuhkanremedial.
Tes diagnostikadalah bentuktes prestasi. Namun,tes prestasibiasanyamenghasilkanskor tunggalmenunjukkan tingkatumumprestasi siswa dalammata pelajaran tertentu.Beberapates diagnostikdigunakanumum adalahStanfordDiagnosticReading Test,StanfordDiagnosticMathematics Test, danDiagnostic Skreening Test: Ejaan. Adabeberapa keuntungan untukadministrasites diagnostikdalam programpenelitian atauperbaikan.Pertama, siswa yang memilikikekurangantertentu dalamsubjekdapat diidentifikasi.Kedua,penggunaantes diagnostiksangat membantu dalamperencanaanperbaikaninstruksiindividual, pendekatanyang dianjurkan olehbanyak pendidik. Kerugian daribeberapa tesdiagnostik adalahbahwasubscoresmemilikireliabilitasyang rendahdan sangatsalingberkorelasi dengansatu sama lain.
5.      Mengukur kreatifitas
Cara untuk mengidentifikasi dan melatih kreatifitas seseorang merupakan masalah utama dalam penelitian pendidikan selama dua dekade ini. Sangat mengejutkan bahwa ternyata telah banyak berkembang pula cara untk mengukur kreatifitas pada waktu yang dua dekade ini. Alasan mendasar dalam melakukan penelitian dalam kreativitas adalah meningkatnya ketertarikan para pendidik terhadap factor-faktor non-intelektual, seperti kreatifitas dan personalitas, dalam pencapaian siswa di sekolah.
Kebanyakan pengukuran tentang kreativitas ditekankan pada penilaian terhadap kemampuan belajar siswa dan sifat-sifat siswa yang dapat berkontribusi pada pencapaian kreatif siswa.Hal tersebut tidak mengukur secara langsung tingkat krativitas siswa. Salah satu orang yang memberi kontribusi terbesar pada masalah ini adalah J.P. Guilford, seseorang yang membuat beberapa tes untuk mengukur proses berfikir divergen seseorang. Salah satu tesnya dinamakan Word Fluency (seseorang diperintahkan menuliskan sebanyak mungkin kata yang memiliki huruf-huruf tertentu); tes lainnya adalah Brick Uses (seseorang diperintahkan untuk menuliskan sebanyak mungkin kegunaan sebuah batu bata); Expresional Fluency (seseorang diberikan 4 huruf depan dari sebuah kalimat); Plot Title (seseorang diharapkan untuk menulis sebuah cerita dari sebuah judul yang telah diberikan). Penelitian lain yang juga berpengaruh besar adalah penelitian yang dilakukan oleh E.P. Torrance; salah satu hasil dari penelitian yang dikembangkannya adalah Torrance Tests of Creative Thinking. Karena penelitian tersebut di kembangkan pada lingkungan sekolah maka tes ini biasa digunakan oleh para peneliti pendidikan untuk melihat kemampuan kreatif siswa pada seluruh tingkatan kelas.Selain itu, terdapat pula banyak tipe tes ekperimental yang terkait tentang kreativitas.Salah satu tes terbaik yang dapat menghasilkan pengukuran terhadap tingkat kreativitas seseorang secara lebih komperhensif adalah koleksi tes ETS yang bertajuk “Creativity and Divergent Thinking”.

6.      Self-report dalam pengukuran kepribadian
Pengukuran ini digunakan secara berkelanjutan dalam penelitian pendidikan untuk menggambarkan karakteristik kepribadian kelompok yang sesuai dengan kebutuhan peneliti; seperti kelompok minoritas, kelompok anak-anak kurang beruntung dsb. Mereka juga menggunakan cara tersebut dalam penelitian yang dilakukannya untuk melihat keterkaitan antara karakteristik seseorang dengan faktor-faktor lainnya, seperti tingkat kecerdasan, prestasi dalam kelompoknya atau popularitas.
Beberapa pengukuran inidisebut “general inventories” karena hanya menggunakan satu alat ukur untuk melihat karakteristik seseorang.Alat tersebut dirancang untuk melihat kepribadian seseorang dengan menganalisis bagaimana individu menjawab pertanyaan yang ada atau bagaimana individu memberikan respon pada sebuah pernyataan yang ada.Karena banyaknya variabel yang dinilai pada saat yang sama, biasanya terdapat ratusan pertanyaan atau pernyataan yang diberikan. Akibatnya, kebanyakan individu membutuhkan waktu 1 jam atau lebih untuk menyelesaikan tes tersebut. Keuntungan dari tes tersebut adalah murah dan mudah untuk diatur dan dinilai.Pertanyaan yang dikemukakan pada tes tersebut sebagian besar berupa pertanyaan objektif; seperti pertanyaan ya-tidak atau pertanyaan berbentuk pilihan ganda. Kekurangan dari tes ini adalah tes ini biasanya merupakan self-report dari individu yang dites. Seperti self-report pada umumnya, tes tersebut akan akurat apabila persepsi diri dari individu tersebut juga akurat dan juga terkait dengan kejujuran individu tersebut dalam mengisi tes tersebut. Hal tersebut merupakan masalah bagi banyak penelitian di bidang pendidikan dan psikologi.
Beberapa badan pembuat tes mengantisipasi hal tersebut dengan menambahkan “lie scale” atau “carelessness” indeks untuk mengidentifikasi jawaban yang tidak jujur. Sebagai contoh, O’Dell mengembangkan “carelessness” indeks untuk 16 Faktor Pesonality Quesioner. Banyak contoh yang menunjukkan bahwa pengukuran self-report dipalsukan sendiri oleh subjek. Beberapa pengembang tes mengurangi indikasi kecurangan tersebut dengan menambahkan soal yang terkait. Tetapi penelitian membuktikan bahwa  penggunaan cara tersebut tidak terlalu signifikan untuk mengurangi kecurangan-kecurangan yang terjadi.
Variabel lain yang menimbulkan respon yang tidak sesuai disebut dengan “response set”. Terdapat tiga jenis “response set”, yakni: selalu memberikan hasil yang baik, respon yang selalu “true” apapun pertanyaannya dan merespon deviantly Jika Anda berkeyakinan bahwa sampel yang diambil mungkin akan memberikan respon yang tidak benar, maka Anda jangan menggunakan self-report tes.
General Inventories
MMPI mengembangkan 550 item perbedaan secara empiric antara grup psychiatric dengan grup orang normal. Terdapat beberapa hal yang dapat diukur dengan alat ini antara lain: ego, kecemasan dan sensitifitasnya.MMPI merupakan alat ukur yang baik untuk digunakan saat Anda ingin mengukur berbagai aspek personality pada orang dewasa.
CPI bertujuan untuk mengukur cara berfikir yang relevan dengan sikap terhadap orang lain dan fungsi intellectual. CPI digunakan untuk menilai orang yang normal.Beberapa skala yang digunakan adalah dominansi, sociability, tanggungjawab, good impression, fleksibilitas, efisiensi intelektual dan ketercapaian melalui kemandirian.CPI dapat digunakan untuk siswa sekolah menengah atas dan orang dewasa.
EPPS digunakan untuk mengontrol respon baik dari seseorang dengan menggunakan pasangan pernyataan yang terkait.Beberapa aspek yang dilihat pada instrument ini adalah autonomy, dominansi, intraception, dan abasment.EPPS dapat digunakan pada mahasiswa dan orang dewasa.
16 PF. Beberapa personality yang dapat dilihat adalah antara  dipengaruhi oleh emosi vs stabil, practical vs imaginative, relax vs tegang dll. Alat ini dapat digunakan oleh subjek dengan usia 16 tahun ke atas.
Specific Personality Variables
Rokeach Dogmatism Scale.Alat ini didesain untuk mengukur variabel yang terkait dengan ketertutupan-pikiran, biasanya digunakan pada penelitian pendidikan dan psikologi. Contoh itemnya adalah “ ketika tejadi pembicaraan tentang agama kita harus tidak terpengaruh oleh orang yang memiliki kepercayaan yang berbeda dengan kita”
Fundamental Interpersonal Relations Orientation Behaviour (FIRO-B).Alat ini berdasarkan teori William Schutz’s tentang kecendrungan grup kecil.Alat ini dapat mengukur kekuatan subjek dalam tindakan (inclution), control dan afeksi.FIRO-B ini dapat digunakan oleh siswa SMA ke atas.Terdapat pula jenis FIRO-BC yang digunakan untuk subjek pada sekolah tingkat 4 hingga 8.
Study of Values.Alat ini untuk menentukan system predominant pada subjek. Alat ini juga mempertimbangkan enam aspek yang dapat membentuk personality seseorang, antara lain: theoretical, economics, aesthetic, social, political and religious.
Locus of Control.Variabel ini digunakan pada subjek yang percaya bahwa hanya mereka yang dapat mengontrol semua kejadian dalam hidupnya (locus control internal).Sejumlah penelitian eksperimental dilakukan untuk mengeksplorasi konsep ini.Academic Achievement Accountability Scale yang dikembangkan oleh Margaret Clifford sangat berguna karena alat tersebut di desain utnuk mengukur locus of control yang terkait dengan pencapaian akademik siswa.Alat tersebut dapat digunakan oleh siswa kelas 3 hingga 8 dan hanya membutuhkan waktu 20 menit.
JikaAnda tertarik padaukuranhanyasatu karakteristikkepribadian,periksa dulubuku tahunanmental yangKesembilanpengukuranuntuk melihat apakahukuranditerbitkantersedia. IndeksSchoredariYearbookberguna dalammenemukanlangkah-langkahyang menghasilkannilaipadavariabeltertentu.Jika Anda tidak dapatmenemukanukuranvariabelbunga,memeriksapersediaanumum untukmelihat apakah adamengukurvariabeldi manaAnda tertarik. Jika demikian, Anda dapatmengelolainventorityseluruh atau, menggunakan tombolangka, ekstrak itemyang mengukurdan mengelolavariabelhanyaitem. Anda harus mendapatkanizin penerbitnyasebelum menggunakanpendekatan yang terakhir, untuk inipersediaanbiasanyahak cipta. Gunakannormates untukvariabeldengan hati-hatijikaAnda mengelolahanya bagian daripersediaan,untuk inimungkinada beberapaperbedaan dalam responketika itemmengukurvariabel tunggalyang diambilkeluar darikonteksseluruh persediaan.
Jika Anda tidakdapat menemukanukuranyang cocokdari variabel dalampersediaanumum,periksa daftarbibliografiETSdan buku-bukusumber laindijelaskan sebelumnya dalambab ini, serta yang tercantum dalamReferensiBeranotasi.
Jika semuastrategi inigagal untuk menghasilkanukuranyang memuaskan, melakukan pencariankomputerdari membangunkepribadian tertentu, menggunakanERICatauPsycologicalAbstrakdata base.
Checklist(*Daftar-pembanding *)

Beberapa ukuran laporan diri kepribadian mengambil bentuk checklist. Sebuah koleksi item ini disajikan untuk individu, yang diminta untuk memeriksa barang-barang yang berlaku untuk dirinya sendiri.Sebuah daftar periksa yang besar telah digunakan dalam penelitian pendidikan.
Adjective Checklist (ACL).Ini langkah-langkah terdiri dari 300 kata sifat.Orang cek sebagai banyak dari kata sifat sebagai adalah self-deskriptif.Data ACL dapat digunakan untuk membandingkan kelompok-kelompok pada frekuensi yang mereka mendukung kata sifat tertentu. ACL juga dapat mencetak gol pada skala 37 yang menilai variabel kepribadian seperti agresi, dominasi kepercayaan diri,, dan penyesuaian pribadi. ACL adalah instrumen penelitian yang berguna, karena menghasilkan sejumlah besar informasi dalam waktu yang relatif singkat (dapat diselesaikan dalam 15 atau 20 menit). Juga, ACL dapat digunakan oleh subjek untuk menggambarkan diri sendiri atau untuk menggambarkan orang lain atau kelompok.
Mooney masalah daftar.Ukuran ini berisi daftar masalah bahwa seorang siswa dapat memiliki.Mahasiswa hanya memeriksa dari masalah tersebut berlaku untuk dirinya sendiri.Daftar ini dapat diberikan kepada siswa di kelas 7 dan ke atas.
7.      Teknik proyektif
Istilah teknik-teknik proyektif ini dipopulerkan oleh Frank LK. Itu adalah anggapan bahwa penggunaan instrumen seperti noda tinta Rorschach Teknik,dengan rangsangan amorf dan kebebasan respon, akan mengungkapkan pikiran batin individu, fantasi, dan penataan istimewa realitas. Salah satu keuntungan yang diklaim sebagai teknik proyektif atas diri sendiri-laporan persediaan adalah bahwa mereka kurang tunduk pada berpura-pura.
Teknik-teknik proyektif yang paling banyak digunakan adalah Uji Rorschach dan Test Apperception Tematik (TAT). Di Rorschach, subjek menanggapi satu set percikan tinta, sedangkan dalam TAT subjek menanggapi satu set gambar. Mengukur telah banyak digunakan dalam penelitian psikologis.Para Pengukuran Mental Buku Tahunan daftar lebih dari 5.000 penelitian yang telah digunakan Test Rorschach.
Terlepas dari popularitas tes proyektif kami akan merekomendasikan bahwa mereka akan digunakan dengan hati-hati dalam proyek penelitian karena, sebagai aturan, ukuran ini membutuhkan pelatihan yang ekstensif dan pengalaman untuk mengelola, skor, dan menafsirkan. Jika Anda memutuskan untuk menggunakan Rorschach atau teknik proyektif serupa dalam proyek Anda, Anda harus mempekerjakan orang-orang yang memenuhi syarat untuk mengelola, skor dan menginterpretasikan hasil.
Sebuah perkembangan baru dalam bidang teknik proyektif adalah pembangunan kelompok-diberikan instrumen untuk mengukur variabel Rorschach klasik. Yang paling banyak digunakan instrumen ini adalah Teknik Boltzmann noda tinta (HIT), yang, dari sudut pandang psikometri, jauh lebih unggul Rorschach tersebut. Berbeda dengan Rorschach, di mana subyek dapat memberikan beberapa
tanggapan sebagai banyak atau untuk setiap stimulus yang mereka pilih, jumlah tanggapan bahwa subjek dapat memberikan kepada setiap kartu Boltzmann dikendalikan.Sebagian dari variabel-variabel penilaian Boltzmann memiliki keandalan yang memuaskan.Kelemahan HIT adalah bahwa pelatihan diperlukan untuk menginterpretasikan variabel penilaian dan bahwa beberapa variabel-variabel tampaknya mencerminkan produktivitas lisan bukan bahwa karakteristik kepribadian dasar.
8.      Mengukur konsep diri
9.      Skala sikap
10.  Mengukur minat kejuruan

IV.             Kesalahan-kesalahan dalam Menggunakan Tes Terstandarisasi
1.      Penelitimemilihtes pertamayang ditemukanbukansistematismemilihtes yang palingtepat untukmasalah penelitian.
2.      Menggunakansubscoresdari ujitanpamemeriksavaliditasdan kehandalan.
3.      Apakahtidak memeriksaisidari sebuahtes prestasiuntuk menentukan apakahitu sesuaidengan isitercakup dalamsekolah-sekolahyang akan digunakandalam penelitian.
4.      Memilihalat tes,sepertiMinnesota MultiphasicPersonality Inventory, bahwa penelititidak memenuhi syaratuntuk mengeloladan menafsirkan.
5.      Gagaluntuk memeriksaisi dariteskepribadian untukmenentukan apakahitumungkin menyebabkankesulitanpublic relations.

C.    PENUTUP
DAFTAR PUSTAKA

Millan, James H Mc dan Sally Schumacher. 1997. Research in Education “Penelitian dalam Pendidikan”. Addison Wesley Longman. INC New York San Francsco
Borg, Walter R dan Meredith Damien Gall. 1989. Educational Research. Longman: New York