Ders 17: Ölçme ve Değerlendirme 2 — Geçerlik, Güvenirlik, Kullanışlılık ve Test Geliştirme İlkeleri
Bu derste ölçme araçlarının kalitesini belirleyen en kritik başlıklara geçiyoruz. Amaç; geçerlik, güvenirlik, kullanışlılık, objektiflik ve test geliştirme ilkelerini birbirine karıştırmadan öğrenmek. Ölçme aracın iyi görünse bile gerçekten doğru şeyi ölçmüyorsa, tutarlı sonuç vermiyorsa ya da uygulanabilir değilse öğretim kararların da bozulur.
Ders hedefleri
Bu dersin sonunda şunları net biçimde yapabiliyor olman gerekiyor:
- Geçerlik ve güvenirlik arasındaki farkı açık biçimde kurabilmek,
- Kapsam, görünüş, ölçüt ve yapı geçerliği gibi başlıkları ayırt edebilmek,
- Bir testin neden güvenirliği düştüğünü veya geçerliğinin zedelendiğini örnek olaylarda görebilmek,
- Test geliştirme sürecinin temel mantığını sınav mantığıyla anlayabilmek.
Konu neden önemli?
Öğretmen sınav yapabilir ama yaptığı sınav gerçekten kazanımları ölçmüyorsa, puanlar tutarsız çıkıyorsa ya da puanlama çok öznel kalıyorsa doğru karar veremez. Yani ölçme aracı sadece “soru kâğıdı” değildir; öğretim sürecini yönlendiren karar aracıdır.
Ölçme-değerlendirme konularında en temel dönüşüm noktası burasıdır: artık sadece ölçme sonucu değil, ölçme aracının niteliği konuşulur. Bu yüzden geçerlik ve güvenirlik, bütün ünitenin merkezinde yer alır.
Geçerlik
Geçerlik, bir ölçme aracının ölçmek istediği özelliği ne derece doğru ölçtüğünü anlatır. Başka bir ifadeyle, “bu test gerçekten ölçmesi gereken şeyi mi ölçüyor?” sorusunun cevabıdır.
Örneğin matematik başarısını ölçmek için hazırlanmış bir sınav, öğrencinin daha çok okuduğunu anlama becerisine yükleniyorsa geçerlik sorunu doğabilir. Çünkü görünüşte matematik sınavıdır ama baskın olarak başka bir niteliği etkiliyor olabilir.
Geçerlik türleri
1. Kapsam geçerliği
Testin, ölçülmek istenen konu ya da davranış alanını ne kadar temsil ettiğini anlatır. Eğer öğretilecek kazanımların önemli bir kısmı testte yer almıyorsa ya da test sadece dar bir bölgeye yığılıyorsa kapsam geçerliği zayıflar.
2. Görünüş geçerliği
Testin dışarıdan bakıldığında ölçüyor gibi görünmesidir. Bu tür geçerlik daha çok ilk izlenim düzeyindedir. Bilimsel anlamda tek başına güçlü bir geçerlik kanıtı sayılmaz.
Yani test öğrenciler, veliler ya da öğretmenler tarafından “uygun görünüyor” olabilir; ama bu tek başına gerçekten geçerli olduğu anlamına gelmez.
3. Ölçüt geçerliği
Test puanlarının dışarıdaki bir ölçütle ilişkisini temel alır. Eğer test sonuçları, aynı özelliği gösteren başka güçlü bir ölçütle uyumluysa ölçüt geçerliği desteklenmiş olur.
Burada özellikle bir testin gelecekteki başarıyı yordaması ya da mevcut güçlü bir ölçütle benzer sonuç vermesi önem kazanabilir.
4. Yapı geçerliği
Ölçme aracının kuramsal olarak ölçmek istediği yapıyı gerçekten ölçüp ölçmediğiyle ilgilidir. Özellikle doğrudan gözlenemeyen özelliklerde, örneğin tutum, ilgi, kaygı, kişilik gibi alanlarda daha çok önem kazanır.
| Geçerlik türü | Temel soru | Ayırt edici nokta |
|---|---|---|
| Kapsam geçerliği | Kazanımları yeterince temsil ediyor mu? | İçeriğin dengeli dağılımı |
| Görünüş geçerliği | Dışarıdan uygun görünüyor mu? | İlk izlenim düzeyi |
| Ölçüt geçerliği | Başka bir ölçütle uyumlu mu? | Dış ölçüte dayalı ilişki |
| Yapı geçerliği | Kuramsal yapıyı gerçekten ölçüyor mu? | Soyut özellikler için önemli |
Güvenirlik
Güvenirlik, bir ölçme aracının tutarlı sonuç verme derecesidir. Yani benzer koşullarda tekrarlandığında sonuçların ne kadar kararlı olduğu ile ilgilidir.
Eğer bir sınav bugün çok yüksek, yarın anlamsız derecede düşük sonuç veriyor; puanlayana göre aşırı değişiyor ya da öğrencinin gerçek düzeyiyle ilgisiz dalgalanmalar gösteriyorsa güvenirlik düşüktür.
Güvenirliği artıran etkenler
- Soru sayısının yeterli olması
- Soruların açık ve anlaşılır olması
- Uygulama koşullarının standartlaştırılması
- Puanlamanın nesnel yapılması
- Ayırt edici maddelerin kullanılması
Güvenirliği düşüren etkenler
- Az sayıda soru
- Belirsiz ya da çift anlamlı maddeler
- Uygulama ortamındaki gürültü ve düzensizlik
- Puanlayıcı yanlılığı
- Aşırı kolay ya da aşırı zor, ayırt ediciliği düşük maddeler
Geçerlik ve güvenirlik ilişkisi
Bu iki kavram çok yakındır ama aynı şey değildir. Geçerlik, doğru şeyi ölçme; güvenirlik ise tutarlı ölçme ile ilgilidir.
Genel sınav mantığında şu ilişki kabul edilir: Güvenirlik, geçerlik için gerekli ama tek başına yeterli değildir. Çünkü tutarsız bir ölçüm zaten doğru yorumlanamaz; ama tutarlı olması da otomatik olarak doğru şeyi ölçtüğü anlamına gelmez.
| Durum | Ne anlama gelir? |
|---|---|
| Güvenirlik düşük | Sonuçlar tutarsızdır; geçerlik de zayıflar. |
| Güvenirlik yüksek, geçerlik düşük | Test tutarlı ama yanlış özelliği ölçüyor olabilir. |
| Hem güvenirlik hem geçerlik yüksek | İstenen ideal duruma yaklaşılır. |
Kullanışlılık
Kullanışlılık, ölçme aracının hazırlanma, uygulanma, puanlanma ve yorumlanma bakımından pratik olma derecesidir. Bir ölçme aracı çok teorik olarak iyi görünebilir; ama aşırı uzun, çok maliyetli, uygulanması güç veya puanlaması aşırı zaman alıcıysa kullanışlılık düşer.
Eğitim ortamında sadece ideal ölçme aracı değil, uygulanabilir ölçme aracı da gerekir. Çünkü öğretmenin zamanı, öğrenci düzeyi, okul koşulları ve sınıf büyüklüğü gerçektir.
Objektiflik
Objektiflik, ölçme ve puanlama sonuçlarının kişiden kişiye değişmemesiyle ilgilidir. Aynı cevap farklı puanlayıcılarda ciddi biçimde değişiyorsa objektiflik sorunu vardır.
Özellikle açık uçlu sorularda ve performans değerlendirmelerinde puanlama ölçütlerinin açık tanımlanması, rubrik kullanılması ve puanlama sürecinin standartlaştırılması objektifliği artırır.
Test geliştirme ilkeleri
İyi bir test tesadüfen oluşmaz. Önce neyin ölçüleceği netleştirilir, sonra bu amaca uygun kapsam belirlenir, soru yazılır, gözden geçirilir ve gerektiğinde düzeltilir.
Test ne için kullanılacak? Başarı, hazırbulunuşluk, seçim, yerleştirme ya da süreç izleme mi?
Hangi davranışlar, konular ve bilişsel düzeyler ölçülecek?
İçerik ile hedef davranışlar dengeli biçimde eşleştirilir.
Açık, anlaşılır, amaca uygun sorular hazırlanır.
Dil, kapsam, güçlük, ifade ve teknik hatalar kontrol edilir.
Test sonuçlarına göre madde ve test kalitesi değerlendirilir.
İyi bir testte aranacak temel nitelikler
- Geçerli olmalı
- Güvenilir olmalı
- Kullanışlı olmalı
- Öğrenci düzeyine uygun olmalı
- Amaca hizmet etmeli
- Madde dağılımı dengeli olmalı
- Anlaşılır dil kullanılmalı
Sık karıştırılanlar
1. Kapsam geçerliği ve görünüş geçerliği
Kapsam geçerliği testin içeriği temsil etmesiyle ilgilidir. Görünüş geçerliği ise dışarıdan bakıldığında uygun görünmesiyle ilgilidir.
2. Güvenirlik ve geçerlik
Güvenirlik tutarlılıktır, geçerlik doğruluktur. Tutarlı olmak tek başına doğru şeyi ölçmek anlamına gelmez.
3. Kullanışlılık ve geçerlik
Çok pratik bir test kullanışlı olabilir; ama yanlış şeyi ölçüyorsa geçerli değildir. Tersine çok geçerli görünen ama uygulanması imkânsıza yakın bir test de eğitim pratiğinde sorun yaratır.
4. Objektiflik ve güvenirlik
Objektiflik arttıkça puanlama daha tutarlı hâle gelir ve bu durum çoğu zaman güvenirliği destekler; ama ikisi birebir aynı kavram değildir.
Henuz yorum yapilmamis. Ilk yorumu siz yapin!
Yorum yapmak icin giris yapin veya uye olun.