If you're seeing this message, it means we're having trouble loading external resources on our website.

Bağlandığınız bilgisayar bir web filtresi kullanıyorsa, *.kastatic.org ve *.kasandbox.org adreslerinin engellerini kaldırmayı unutmayın.

Ana içerik

Büyük Örneklem Oranında Hipotez Testi

Sal büyük bir örneklem kullanarak ABD.'deki evlerin %30'undan fazlasının internet bağlantısı olup olmadığını test ediyor. Orijinal video Sal Khan tarafından hazırlanmıştır.

Tartışmaya katılmak ister misiniz?

Henüz gönderi yok.
İngilizce biliyor musunuz? Khan Academy'nin İngilizce sitesinde neler olduğunu görmek için buraya tıklayın.

Video açıklaması

merhaba Bu videoda yüzde Beşlik bir anlamlılık düzeyi ile Amerika Birleşik devletleri'ndeki evlerin yüzde 30'undan fazlasının da internet erişimi bulunduğu hipotezini test edeceğiz 150 evden oluşan bir örneklemin 50 7'sinde internet erişimi olduğunu belirliyoruz hipotez testi ni yapmak için 0 ve karşı hipotezleri belirlememiz lazım 0i protezi hipotezin doğru olmadığı yönünde olacak hemen yazıyorum sıfır hipotezi Amerika Birleşik Devletleri'nde internet erişimi olan evlerin oranı yüzde 30'a eşit ya da küçüktür karşı hipotez ise hipotezinde iddia ettiği yönde yani internet erişimi olan oranının yüzde 30'dan büyük olduğunu destekleyecek Aynen burada yazdığı gibi Amerika Birleşik devletleri'ndeki evlerin yüzde 30'undan fazlasının da internet erişimi bulunduğu hipotezi Evet biz de bunu bu şekilde ifade ettik karşıt hipotezi test ediyoruz ve bunu sıfır hipotezine dayalı bir p ne yapacağız Evet popülasyonu için 0 hipotezine dayalı bir oran belirlememiz lazım bu varsayıma dayanarak 150'den 57 Senin internet erişimi olmasının olasılığı nedir bu olasılık Eğer yüzde beşten yani anlamlılık düzeyinde en küçük s0 hipotezini reddedip karşıt hipotezi helal alacağız şimdi biraz düşünelim işe sıfır hipotezinin doğru olduğunu varsayarak başlayacağız bu varsayım da bir popülasyon oran ya da popülasyon ortalaması için seçeceğiz bunu Bernoulli dağılımlarında hatırlıyoruz Ve ben bunu elde etmemiz in olasılığının maksimize eden bir oran seçeceğiz bu sayının gerçekte ne olduğunu bilmiyoruz ve konuya biraz daha mantıklı bir açıdan yaklaşmak için isterseniz örneklem oranının ne olduğunu hesaplayalım 150 evden el 7'sinde İnternet varmış 150 Evden 57'si mi Evet örneklem oranı 0,38 Bunu hemen not edelim örneklem oranı bu virgül 38'e eşit sıfır ipoteğinin doğru olduğunu varsaydığımız da buradaki olasılığı maksimize eden bir popülasyon oranı düşünmemiz lazım Tam da yüzde 30'da iken bunu elde etmenin olasılığını maksimize eden sıfır İbo tezine uygun en yüksek popülasyon oranı şöyle yazayım bunun doğru olduğunu var sayacağız Evet bunun 0,3 yada yüzde 30 eşit olduğunu var sayacağız bu noktanın iyice anlaşıldığından emin olmak istiyorum yüzde yirmi dokuz da sıfır ipoteğine uygun bir oran aynı şekilde 128d ama yüzde yirmi dokuz yada yüzde yirmi sekiz için bunu elde etmenin olasılığı daha düşük olacaktır yani kuvvetli bir test yapamamış oluruz sıfır hipotezini sağlayan Maximum oranı değerlendirirsek bunu elde etmenin olasılığını da maksimize etmiş oluruz bu rakamda düşükse yani eğer yüzde beşten düşükse karşı hipotezden Emin olabiliriz kısa bir Tekrar yapacak olur isek yüzde 30'luk bir popülasyon oranı ele alacağız O da düşünelim zaman zaman çizim yapmak işlerimizi kolaylaştırır buradaki varsayımı ele alırsak popülasyon dağılımı buna benzeyen bir şey olur popülasyon dağılımında yüzde 30'unda internet var Bunu bir ile tanımıyorum geriye kalanların ise interneti yok yani Yüzde yetmişinde internet yok Bu bir Bernoulli dağılımı ve ortalamanın interneti olan oranla aynı olacağını biliyoruz Evet ortalamayı bu şekilde 0,3 yani yüzde 30 olarak yazıyorum Bu popülasyon ortalaması aslına bakarsanız şu şekilde yazsam Belki de daha iyi olacak sıfır hipotezinin doğru olduğunu varsayarsak popülasyon ortalaması 0,3 sonra bir de popülasyon standart sapması var Onu da sarıyla şuraya yazayım sıfır hipotezin doğru olduğunu var sayınca popülasyon standart sapma ve bunu berenari dağılımlarını öğrendiğimizde de görmüştük hemen yazıyorum karekök içinde popülasyonun internet erişimi olan oranı yani 0,3 çarpı popülasyonun internet erişimi olmayan oranı yani 0,7 Burası 0,21 eder Öyle değil mi tam sonucu hesap makinesiyle hesaplayabiliriz Şimdi de 0,38 de sahibi olan bir örneklem oranı elde etmenin olasılığına bakmamız lazım örneklem oranlarının dağılımına Bir bakalım bundan 150 tane ev almanın tüm kombinasyonlarını değerlendirdiğimizde bir binom dağılımı elde ederiz burada daha önce görmüştük bir 10 dağılımında birden fazla Çubuk vardır ve Eren değeri yeteri kadar büyükse bunu test etmenin yolu da en çarpıp Eğer buradaki peynir yüzde 30 olduğunu bir kere daha hatırlatayım Evet en çarpı B 5 çok büyükse ve en çağırdı bir eksi pde5 ten büyükse örneklem oranının dağılımının normal olduğunu kabul edebiliriz bu popülasyondan 150 tane ev seçmenin tüm olası kombinasyonlarına bakarsak Tüm bu çubukları elde ederiz ve en değeri de büyük olduğuna göre 150 çarpı 0,3 ve 150 çarpı 0,7 de beşten büyüktür O halde bunun normal bir dağılımı olduğunu var sayabiliriz abi Bak bunun normal bir dağılım olduğunu başlayabiliriz Evet bu normal bir dağılır Bu arada Tüm bunları yaparken sıfır İbo tezinde doğru olduğunu varsaydığımız aklınızdan çıkarmayın olur ortalama örneklem oranın ortalaması popülasyon ortalaması ile aynı olacak bu 0,3 olacak Bunun aynısı standart sapmada Merkezi limit Teoremi nden gelecek örneklem oranlarının standart sapması karekök içinde var ya da şöyle yazayım popülasyon standart sapması sıfır hipotezin doğru olduğundan yola çıkarak elde ettiğimiz standart sapma bölü karekök içinde elimizdeki örneklemin boyutu örnekten boyutu muz 150'ye eşit bunun eşit olduğunu da hesaplayabiliriz buradaki değerin karekök içinde 0,21 eşit olduğunu bulmuştuk hemen yazıyorum karekök içinde 0,21 bölümü karekök içinde 150 hesaplamak için hesap makinesini alalım buraya yazdığımı sülale hesaplayacağım karekök içinde 0,21 ve bunu bir de karekök içinde 150'ye böleceğiz ve sonuç 0,0 37 örneklem oranının dağılımının standart sapmasının şuraya yazayım ekranı da biraz sağa Kaydır İyiyim Evet 0,0 37 eşit olduğunu bul bu ekranın dışına da çıkmasam yoktur Evet 0,0 37 şimdi 0,38 lik bir popülasyon oranı elde etmenin olasılığı hesaplamak için de bunun ortalamadan kaç standart sapma uzakta olduğunu bulmamız başka bir değişle örnekleme miz için bir Z değeri hesaplama mız lazım Z değerinin ya da z-skoru nun ortalamadan kaç standart sapma uzakta olduğumuzu verdiğini hatırlıyorsunuz dur sonra bir de bu Z değerini elde etmenin Olasılığın yüzde beşten büyük mü yoksa küçük mü olduğuna bakmamız gerekiyor isterseniz önce ortalamadan kaç tandarts atma uzakta olduğumuzu bulalım burada elde ettiğimiz örneklem oranının buradaki olası örneklem oranlarının dağılımından elde ettiğimiz oranlardan biri olduğunu düşünebiliriz Peki bu ortalamadan kaç standart sapma uzaktadır örneklem organımızdan örneklem oranlarının dağılımının ortalamasını çıkarıp bir de örneklem oranlarının dağılımının Stan bu yapmasına bölersek 0,38 eksi 0,3 ve bölü 0,0 37 den Bir bakalım pay 0,0 8 olur paydada 0,0 37 var Hemen Hesap makinesini alalım 0,0 8 bölü Şimdi burada bulduğumuz sonucu Çağırayım Evet 0,0 37 den bahsediyorum ve sonuç 2,1 de yuvarlayalım 2,14 standart sapma bundan.ote değil bu 2,14 standart sapmaya eşitmiş ve bu da ortalamadan kaçsan dart sapma uzakta olduğumuzu veren Z değerini Ya da z-skoru dur ortalamanın 2,14 standart sapma üzerinde site kuyruklu bir dağılım düşünmemiz lazım Peki bunu elde etmenin olasılığı yüzde çok küçük müdür yoksa büyük Eğer yüzde beşten küçük s0o tezini reddetti edeceğiz ve karşıt hipotezi destekleyeceğiz Nasıl yapacağız diye soruyorsanız normalize edilmiş normal bir dağılım düşünelim isterseniz bunun Z'ye dağılımı olduğunu da düşünebilirsiniz normal bir dağılıma normalize edilmiş normal bir dağılıma baktığımızda ortalaması sıfırdır buradaki değerlerde Aslında bakarsanız E değerleridir neden diyecek olursanız Mesela bir buradaki ortalamadan bir sandared sapma uzakta olduğumuzu belirtir O halde buradaki kritik Z değerine ihtiyacımız var not ediyorum kritik Z değeri ya da z-skor bundan daha büyük bir Z değer elde etmenin olasılığı yüzde beşe eşit olacak Buradaki alan yüzde 5 Anlaştık mı bunun sebebi de anlamlılık düzeyi mizin yüzde beşe eşit olması olasılığı yüzde beşten düşük olan her şey sıfır hipotezi nerede bilmemiz için gerekli zemini Ne olacak bu alan Eğer yüzde Besse yarıya kalan alanda 195 eşittir öyle değil Bu arada sadece buradaki değerlerle ilgilendiğimiz için Bunun tek kuyruklu bir test olduğunu bir kere daha söylemek istiyorum bundan büyük Z değerleri sıfır hipotezini Redd etmemizi sağlayacak buzey değerini belirlemek için de bir Z tablosu kullanacağız ve aradığımız Ee değerinden küçük olma Olasılığın yüzde 95 olduğu duruma bakacağız bu tabloda zaten bize belirli bir değerden küçük olmanın Kümülatif olasılığını verir bakalım 100'de 95'i arıyoruz burada 0,94 95 Burada da 0,95 05 var biraz daha yakın olduğu için bunu seçeceğim önce satıra bakıyorum 1,6 sonra da suçuna Evet beş Kredi x değeri 1,65 1,65 ten küçük bir Z değer elde et Bu hastalığı ya da tamamen normalize edilmiş normal bir dağılımda 1,65 ten küçük bir değer elde etmenin olasılığı ya da herhangi normal bir dağılımda ortalamadan 1,65 standart sapma uzakta olmanın olasılığı 0,95 Mişka RTX değeri işte bulur örnekle menzehe değeri ise bir bakalım 2,10 dörtlü ve bu da buralarda bir yerlerde bir o halde bum elde etmenin olasılığı gerçekten de yüzde beşten küçüktür bunu ya da bundan daha uç bir sonuç elde etmenin olasılığını değerlendirecek olur isek Evet bu alanı Eğer olmuş olsaydık bize tablosuyla bulabiliriz bu sonucun p değerini elde etmiş olduk Her neyse sorular bizden yüzde beşlik ve anlamlılık düzeyi ile sıfır Lipo tezini reddetti bir edemeyeceğimizi bulmamız isteniyordu ve biz de Redd edebileceğimizi bu kritik Z değerimiz den daha büyük bir Değerdir ve biz de Buna dayanarak sıfır hipotezini reddedip bu pratik o tezi destekleyebiliriz