İstatistikte 1. ve 2. Tip Hata Üzerine

1. Tip ve 2. Tip Hata: Yalancı Çoban Örneği

Bu kavramları anlamak için bilinen örnekler üzerinden gitmek faydalı olacaktır diye düşünüyorum.

Yalancı çoban hikayesini hatırlayalım. Çoban koyunları kurtlardan korumaktadır. Bir süre hiç kurt saldırısı olmayınca çoban sıkılır. Eğlence için kurt saldırıyor sürüye diye köye haber salar. Burada boş hipotez (H0) kurtların olmaması, alternatif hipotez (Ha) ise kurtların olmasıdır. Köylüler koşarak yalan habere gelirler. H0 doğru iken H0'ı yanlış sanmışlardır. Bu durum istatistikte "1. Tip hata" durumuna örnektir (Type I errror).



Çoban bu şekilde köylüleri çok defa kandırır, köylüler gelirler ama kurt olmadığını görürler, her defasında çoban onlara güler. Bir gün sürüye gerçekten kurtlar saldırır ve çoban yine köylüleri çağırır. Köylüler haberi yalan sanıp gelmezler. Bu sefer köylüler H0 yanlışken H0'ı doğru sanmışlardır. Bu durum ise istatistikte "2. Tip hata" durumuna örnektir (Type II error).

1. Tip Hata ve 2. Tip Hata Arasındaki Ödünleşme

Bir cinayet yargılamasını düşünerek bu kavramları iyice anlamaya çalışalım.

Bilindiği üzere hukukta aksi ispatlanmadıkça herkes suçsuzdur. Aslında istatistik testleri de hukuktaki suçlu-suçsuz değerlendirmesi yapısındadır. Bir cinayet davasında boş hipotez (yani aksi ispatlanmadıkça doğru kabul edilen durum) sanığın suçsuz olduğudur.

H0: sanık suçsuzdur (gerçekleşen durum neyse rastlantısal olarak gerçekleşebilir, sanığın bunu kendisinin yaptığınına ikna olacak kanıt yok)

Şöyle bir örnek verelim: bir sanığı maktülün yanında buldunuz ve elinde bıçak var, sanık bıçağı tutarken üzerinde kanlar varken yakalanıyor ve savunması şu şekilde olsun:

"Ben sokakta yürüyordum, bir apartmanın önünden geçiyordum, 4. kattaki dairenin (!?) balkonundan yardım diye sesler duydum (!?), ben de hemen apartmana girdim (!?), yukarı çıktım (!?), dairenin kapısı açıktı (!?) içeri girdim (!?), salonda yürüdüm orada bıçaklanmış bir adam vardı (!?), yanına gittim elime bıçağı aldım (!?) o sırada üzerime kan damladı (!?), tam da o sırada odaya maktulün karısı girdi (!?) beni öyle gördü. Ben suçsuzum (!?)."

Açıkcası bu olayın bu şekilde gerçekleşme ihtimali matematiksel olarak sıfır değildir, gerçekleşme olasılığı çok ama çok düşük olmasına rağmen şanssız bir insan kara mizah da olsa bu durumu yaşayabilir (belki milyonda 1 olasılıkla). Ancak mahkemelerde bu kadar düşük olasılıklı bir durumun doğru kabul edilmesi kafamıza yatmaz ve H0'ı yani sanığın suçsuz olma durumunu reddederiz. Hipotez testlerinde gerçekleşme olasılığı hangi olasılık düzeyinin altına inince H0'ı reddetmeye karar veriyorsak o olasılık değeri bizim alfa (𝞪) değerimizdir. Burada kara mizah durumu gerçekleşip sanık gerçekten suçsuz olsaydı da sanığın anlattığı olayın gerçekleşme olasılığı bu alfa değerinin altına indiğinde H0 reddedilecekti. Bu sebeple alfa değeri aynı zamanda ilk başta anlattığımız 1. Tip hata olasılık değerine karşılık gelmektedir. 

Eğer alfa değerini düşürürseniz H0'ı reddetmek (yani sanığı suçlu bulmak) zorlaşır: çünkü bu sefer de her söylenileni kabul eder hale gelirsiniz. Örneğin alfa değerini çok düşürdüğünüzü varsayalım: alfayı yüzde 5 yerine milyarda 1'e düşürdünüz. Bu durumda sanığın anlattığı durumun gerçekleşme ihtimali milyonda 1 ise, milyarda 1'den daha düşük olmadığı için H0 reddedilmez. Yani alfanın çok düşürülmesi bu kadar abartılı bir hikayeyi anlatan bir adamın suçsuz olarak değerlendirilmesine sebep olur. Görüldüğü gibi bu karar günlük hayatta benimseyeceğimiz bir durum değildir. Bu sebeple istatistik testlerini yaparken alfa değerini çok düşürmek önerilmez. Çünkü bu durumda H0 yanlış olmasına rağmen onu reddetmeme (doğru sanma) durumu (2. Tip hata) fazlasıyla artacaktır.

Diğer taraftan alfayı çok yükselttiğinizi düşünelim. Bu durumda da tersi bir hatanın gerçekleşme düzeyi artacaktır. Alfanın çok yükseltilmesi (yani H0'ın kolaylıkla reddedilir hale getirilmesi) deminki verdiğimiz örnek için düşünürsek; 4. katta ölü bulunan adamdan 5 km ilerdeki bir sokakta birinin sokakta yürüyor diye katil olarak cezalandırılmasını mantıklı ve doğru bulmamız anlamına gelir. Dolayısıyla alfanın çok yüksek kabul edilmesi durumunda H0 doğru olmasına rağmen onu reddetme (yanlış sanma) durumunun gerçekleşme olasılığı (1. Tip hata) fazlasıyla artmıştır. 

Görüldüğü üzere alfanın çok arttırılması da çok azaltılması da sorun yaratmaktadır. O sebeple istatistikte genelde 3 farklı alfa değeri kullanılır bunlar: %10, %5 ve %1'dir. Biz bu 3 değerden en iyi seçimin %5 olduğunu düşünüyoruz. Kanaatimizce bir şeyin rastlantısal olarak kendi kendine gerçekleşme olasılığı %5'in altındaysa bu durum H0 hipotezinin (H0: bu durum rastlantısal olarak gerçekleşebilir, sanığın bunu yaptığınına ikna olacak kanıt yok) reddedilmesi için uygun bir olasılık düzeyidir (Bazıları %1'i bazıları %10'u benimseyebilir).

Görüldüğü üzere alfanın arttılması 1. Tip hatayı arttırken alfanın düşürülmesi de 2. Tip hatayı arttıracaktır. Bu sebeple bu iki hata tipi arasında bir ödünleşme (trade-off) vardır. Aşağıdaki grafiklerde bu ödünleşme gösterilmektedir. Bu ödünleşmeyi animasyon olarak da görebiliriz (tıklayınız)




Umarım bu kısa blog yazım bu kavramların daha kolaylıkla anlaşılmasına katkıda bulunmuştur. 

Sevgiler

oe


Yorumlar

  1. Kafa karışıklığı yaşatabilecek bir konuyu oldukça detaylı anlatmışsınız. Keyifle okudum. Elinize sağlık.

    YanıtlaSil

Yorum Gönder