Ders 19: Ölçme ve Değerlendirme 4 — Madde Analizi, Ortalama, Ortanca, Mod, Standart Sapma, Dağılım, Test ve Madde İstatistiklerine Giriş
Bu derste ölçme sonuçlarını yorumlamada kullanılan temel istatistik kavramlarına giriş yapıyoruz. Amaç; merkezi eğilim ölçüleri, dağılım ölçüleri, standart sapma, test puanlarının yayılması, madde güçlüğü ve ayırt edicilik gibi başlıkları sınav mantığıyla oturtmak. Bu konu ilk bakışta sayısal görünür; ama asıl mesele formül ezberi değil, neyin neyi anlattığını doğru yorumlamaktır.
Ders hedefleri
Bu dersin sonunda şunları net biçimde yapabiliyor olman gerekiyor:
- Ortalama, ortanca ve mod kavramlarını birbirinden ayırabilmek,
- Standart sapma ve dağılımın test puanları hakkında ne söylediğini yorumlayabilmek,
- Madde güçlüğü ve ayırt ediciliğin temel mantığını kavrayabilmek,
- “Bu test kolay mı, zor mu, seçici mi, puanlar birbirine yakın mı?” gibi sorulara veri üzerinden cevap verebilmek.
Konu neden önemli?
Öğretmen sınav yaptıktan sonra elinde bir sürü puan olur. Ama bu puanları sadece yan yana görmek yetmez. Sınıfın genel başarısı nasıl, puanlar birbirine yakın mı, öğrenciler arasında büyük fark var mı, test aşırı kolay mı, maddeler seçici mi? Bu sorulara cevap verebilmek için temel test istatistiklerini bilmek gerekir.
Ölçme-değerlendirme konularında bu bölüm çok önemlidir; çünkü iyi test geliştirme yalnızca madde yazmakla bitmez, elde edilen sonuçları okuyabilmeyi de gerektirir.
Merkezi eğilim ölçüleri
Merkezi eğilim ölçüleri, puanların genel olarak hangi noktada toplandığını gösterir. Bir başka deyişle, grubun “merkezi” hakkında bilgi verir.
Aritmetik ortalama
En sık kullanılan merkezi eğilim ölçüsüdür. Tüm puanların toplamının, puan sayısına bölünmesiyle elde edilir.
Ortalama, grubun genel düzeyi hakkında güçlü bilgi verir; ancak aşırı uç değerlerden etkilenebilir.
Ortanca (medyan)
Puanlar küçükten büyüğe sıralandığında tam ortada kalan değerdir. Uç değerlerden aritmetik ortalamaya göre daha az etkilenir.
Mod
En sık tekrar eden puandır. Özellikle hangi puanın grupta daha yaygın olduğunu görmek için kullanılabilir.
| Ölçü | Temel soru | Güçlü yanı | Sınırlılığı |
|---|---|---|---|
| Aritmetik ortalama | Genel düzey ne? | En yaygın kullanılan ölçüdür | Uç değerlerden etkilenir |
| Ortanca | Ortadaki puan ne? | Uç değerlerden az etkilenir | Tüm puanları eşit ölçüde yansıtmaz |
| Mod | En sık görülen puan ne? | Yaygın puanı gösterir | Her dağılımda belirgin olmayabilir |
Dağılım ve yayılma
Merkezi eğilim ölçüleri puanların ortalama olarak nerede toplandığını söyler; ama puanların birbirinden ne kadar uzaklaştığını söylemez. İşte dağılım ve yayılma ölçüleri burada devreye girer.
Aynı ortalamaya sahip iki sınıf olabilir; fakat birinde puanlar birbirine çok yakınken, diğerinde çok dağınık olabilir. Bu yüzden sadece ortalamaya bakmak çoğu zaman yeterli değildir.
Standart sapma
Standart sapma, puanların ortalama etrafında ne kadar yayıldığını gösteren temel dağılım ölçüsüdür. Puanlar ortalamaya yakın kümelenmişse standart sapma düşük olur. Puanlar geniş alana yayılmışsa standart sapma yükselir.
Düşük standart sapma ne anlatır?
- Puanlar birbirine görece yakındır.
- Öğrenciler arası fark daha sınırlıdır.
- Dağılım daha dardır.
Yüksek standart sapma ne anlatır?
- Puanlar daha dağınıktır.
- Öğrenciler arası fark daha belirgindir.
- Dağılım daha geniştir.
Dağılımın genel görünümü
Puanların hangi bölgede yoğunlaştığı, simetrik olup olmadığı ya da belirli tarafa yığılıp yığılmadığı da yorumlamada önemlidir. AGS düzeyinde çoğu zaman senden ileri istatistik beklenmez; ama dağılımın genel mantığını bilmen gerekir.
- Puanlar üstte toplanıyorsa test kolay olabilir.
- Puanlar altta toplanıyorsa test zor olabilir.
- Puanlar orta bölgede dengeli yayılıyorsa test daha ayırt edici olabilir.
Madde analizi nedir?
Madde analizi, testteki her bir sorunun ne kadar işlevsel olduğunu inceleme sürecidir. Amaç, maddelerin kolay mı zor mu olduğunu, iyi öğrencilerle zayıf öğrencileri ayırıp ayıramadığını ve teknik olarak sorun taşıyıp taşımadığını görmektir.
İyi bir test sadece toplam puanı değil, içindeki soruların niteliğini de göz önüne alır.
Madde güçlüğü
Madde güçlüğü, bir sorunun öğrenciler tarafından ne ölçüde doğru yapıldığını gösterir. Genel mantık şudur: Bir soruyu doğru yapan kişi sayısı arttıkça madde daha kolay kabul edilir; azaldıkça madde zorlaşır.
Yani “madde güçlüğü” ifadesi ismen zorlayıcı gelebilir; ama teknik olarak aslında maddenin kolaylık-zorluk düzeyine işaret eder.
Yorum mantığı
- Doğru yapan çoksa: madde kolaydır.
- Doğru yapan azsa: madde zordur.
- Orta düzeyde doğru yapılıyorsa: madde seçicilik açısından daha verimli olabilir.
Madde ayırt ediciliği
Madde ayırt ediciliği, bir sorunun başarılı öğrencilerle başarısı düşük öğrencileri ne kadar ayırabildiğini gösterir. İyi bir madde, konuyu bilenlerle bilmeyenleri ayırt edebilmelidir.
Yüksek ayırt edicilik ne anlatır?
- Madde işlevseldir.
- Başarılı öğrenciler soruyu daha çok doğru yapmıştır.
- Madde testin seçiciliğine katkı sağlar.
Düşük ya da sorunlu ayırt edicilik ne düşündürür?
- Madde çok kolay ya da çok zor olabilir.
- Madde yanlış anlaşılmış olabilir.
- Çeldiriciler işlevsiz olabilir.
- Hatta doğru cevap anahtarında sorun olabilir.
Test istatistiklerine giriş
Tek tek maddeler kadar, testin bütününe ait göstergeler de önemlidir. Bir testin ortalaması, standart sapması, genel güçlük düzeyi ve puanların yayılması o test hakkında yorum yapmayı sağlar.
| Gösterge | Ne anlatır? | Temel yorum sorusu |
|---|---|---|
| Ortalama | Genel başarı düzeyi | Sınıf genel olarak nasıl yapmış? |
| Standart sapma | Puanların yayılması | Öğrenciler arasında fark ne kadar? |
| Madde güçlüğü | Maddenin kolaylık-zorluk düzeyi | Bu soru kaç kişi tarafından yapılmış? |
| Madde ayırt ediciliği | Seçicilik | Madde başarılı ve başarısız öğrencileri ayırıyor mu? |
yayılma = standart sapma
kolay-zor = madde güçlüğü
seçicilik = ayırt edicilik
Yorum örnekleri
Bu durumda sınıf genel olarak iyi yapmış ve puanlar birbirine yakındır. Test kolay olmuş olabilir ya da grup homojen olabilir.
Sınıf genel olarak düşük yapmış ve puanlar yine birbirine yakındır. Test aşırı zor olmuş olabilir.
Puanlar geniş yayılmıştır. Test öğrenciler arası farkı daha görünür kılmış olabilir.
Madde çok kolay olabilir; ayırt ediciliği düşük kalabilir.
Madde çok zor olabilir; yine ayırt edicilik sorunu oluşabilir.
Sık karıştırılanlar
1. Ortalama ve ortanca
Ortalama tüm puanları hesaba katar; ortanca ise sıralamadaki orta değere bakar. Uç değerler olduğunda ikisi farklı sonuç verebilir.
2. Standart sapma ve ortalama
Ortalama başarı düzeyini, standart sapma ise puanların yayılmasını gösterir. Aynı ortalamaya sahip iki grubun standart sapması farklı olabilir.
3. Madde güçlüğü ve ayırt edicilik
Madde güçlüğü sorunun kaç kişi tarafından yapıldığını; ayırt edicilik ise sorunun bilenle bilmeyeni ne kadar ayırdığını anlatır.
4. Kolay madde ve iyi madde
Bir madde kolay olabilir ama çok seçici olmayabilir. İyi madde sadece kolay ya da zor olmasıyla değil, işlevsel olmasıyla değerlendirilir.
Henuz yorum yapilmamis. Ilk yorumu siz yapin!
Yorum yapmak icin giris yapin veya uye olun.