Hipotezler

Taner Sayın
4 min readOct 4, 2020

--

Merhabalar bugün sizlere normal yollardan sonuçlara elde edebileceğimiz bilgileri oluşturacağımız hipotezler ile sağlamalarını göstereceğim.

Gerekli kütüphaneleri dahil ettikten sonra veri setimizi düzenledik. Burada fatura kısmına bahşiş kısmı da eklenmiş haldedir. Yanlış çıkarımlar oluşma durumu olmasını istemediğimizden toplam ödenen hesap kısmından dahil edilen bahşiş kısmı çıkarılmadır.

Veri setimizi düzenledikten ve genel tablo halinde gördükten sonra birde kategorik ve sayısal değerlere ayrı ayrı bakalım. Öncelikle sayısal değişkenler için bakacak olursak;

Kategorik değişkenler için;

Güven Aralıkları

“Bizim değerimiz bu şekilde” demektense “Bu değer ile şu değer arasında” demek resmin görünmeyen kısımlarını bizlere gösterir. Dolayısıyla güven aralığı kullanılabilir. Buradaki aralık küçük olabilir ama başka durumlarda çok önemli yorumlar katabilir.

Hipotez

Ortalama olarak 16.78 civarı gözükebilir fakat ortalamanın şans eseri oluşup oluşmadığını göstermemiz gerekmektedir. Bunun içinde hedefler doğrultusunda hipotezler kurup bunları test etmemiz gerekmektedir.

Normallik varsayımındaki H0 hipotezimiz bizlere örnek dağılımı ile teorik normal dağılım arasında fark yoktur derken H1 hipotezimiz ise örnek dağılımı ile teorik normal dağılım arasında fark vardır der .

Öncelikle Normallik varsayımımıza uyup uymadığına bakalım;

Normallik varsayımımızın sağlanabilmesi için gerek ve yeter şart mavi noktalar kümesinin kırmızı çizgi doğrultusunda ilerlemesi gerekir. Grafikten de göreceğimiz üzere mavi noktalar kümemiz kırmızı çizgiler doğrultusunda ilerlemiyor ve bu demektir ki Normallik sağlanmamaktadır. Bunu sayısal olarak da görebiliriz;

Düzenlersek;

p -value değeri 0.05'’ten küçük olduğundan dolayı H0 hipotezi reddedilir. Bu demek olur ki Normallik varsayımımız sağlanmamaktadır.

Normallik varsayımımız reddedildiğinden dolayı Python’da dahil olan sign test kullanılabilir;

p-value < 0.05 olduğundan dolayı H0 hipotezi reddedilir. Denemek istediğimiz ortalama ödenen fatura miktarı 19 değildir. Ortalama 16 makul bir durumdur.

AB Testi

AB Testi; iki grup ortalaması arasında karşılaştırılma yapılmak istenildiğinde kullanılır. Bizde burada kadınları ile erkeklerin ortalama ödedikleri ücretleri karşılaştırabiliriz;

Groupby işlemine göre ortalamaların farklı olduğunu görebiliriz. Fakat yine de test etmemiz gerekir;

Kadın ve erkek eleman sayıları eşit olmadığından birleştirip bir Dataframe haline getiremiyoruz.

AB testinde Normallik Varsayımı ve Varyans Homojenliğine bakmamız gerekir. Her iki grup içinde Normallik varsayımına bakalım;

Her iki durumda da p-value < 0.05'ten olduğu için Normallik sağlanmamaktadır. Grafiklerden de bunu görebiliriz.

Varyans Homejenliğine bakacak olursak; bunu test edebilmek için Levene Testi kullanılabilir;

p-value > 0.05 olduğundan H0 hipotezi kabul edilir.Yani varyanslar homojendir.

Şimdi elimizde Normallik varsayımını sağlamayan fakat Varyans homojenlik durumunu sağlayan bir durum var bunun sonunca Non-parametrik Testlerden biri olan ManWithneyU Testi kullanılır.

ManWithneyU Testi sonucuna göre; en başta belirlediğimiz H0 ve H1 hipotezlerinden H0 hipotezi reddedilip H1 hipotezi kabul edilir yani kadınlar ile erkeklerin harcamalarının ortalamaları birbirine eşit değildir.

Kolerasyon Analizi

Merak ettiğimiz verilen bahşişler ödenen miktarı etkiliyor mu ? Aralarında bir ilişki var mı yok mu bunu ölçmek için öncelikle Hipotezlerimizi oluşturup p-value değerlerine bakmamız gerekir.

Shapiro Testi ile Normallik varsayımımız sağlanmadığını gördük. Normallik varsayımı sağlansaydı Pearson Kolerasyon Katsayısı kullanacaktık fakat sağlanmadığından Spearman Kolerasyon Katsayısı kullanmalıyız.

Spearman Testi sonucunda H0 hipotezi reddedilir.H1 hipotezimiz doğrudur. Fatura değişkeni ile bahşiş değişkeni arasında anlamlı bir ilişki vardır.

Fatura ile bahşiş arasında pozitif orta yönlükolerasyon “ vardır.

Değerli vaktinizi ayırdığınız için teşekkürler.

--

--

No responses yet