Eğer bu mesajı görüyorsanız, web sitemizde dış kaynakları yükleme sorunu yaşıyoruz demektir.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Ana içerik

Referans: Ortalamaya Müdahaleyi Etkileyen Koşullar

Ortalama hakkında çıkarım yapmak istediğimizde (güven aralığı oluşturmak veya anlamlılık testi yapmak), yöntemlerimizin doğruluğu birkaç koşula bağlıdır. Aralığın veya testin hesaplamalarını yapmadan önce bu koşulların sağlanıp sağlanmadığını kontrol etmek önemlidir. Aksi takdirde hesaplamalar ve sonuçlar doğru olmayabilir.
Ortalamayla ilgili çıkarım yapmak için gerekli koşullar:
  • Rassallık (rasgelelik): Verileri elde etmek için rasgele bir örnek veya rasgeleleştirilmiş bir deney kullanılmalıdır.
  • Normallik: Örneklem ortalaması olan x¯'in örnekleme dağılımı yaklaşık normal olmalıdır. Eğer ana popülasyon normal dağılıma sahipse veya örneklem büyük oalrak kabul edilebilecek bir örneklemse (n30) bu durum geçerlidir.
  • Bağımsızlık: Bireysel gözlemler bağımsız olmalıdır. Örneklem yerine koyma olmadan alınıyorsa, örneklemin büyüklüğü popülasyonun %10'undan fazla olmamalıdır.
Şimdi bu koşulların tümünü biraz daha derinlemesine inceleyelim.

Rassallık koşulu

Rasgele örneklemler, bir popülasyonla ilgili yansız veri sağlarlar. Rasgele seçimi kullanmadığımızda, ortaya çıkan veriler genellikle bir yönüyle yanlı olurlar. Bu verileri kullanarak popülasyon hakkında çıkarım yapmak riskli olabilir.
Daha net olmamız gerekirse, örneklem ortalamalarının, popülasyon ortalaması için yansız tahminler olduklarını söyleyebiliriz. Örneğin, 0'dan 30'a kadar numaralandırdığımız bir çanta dolusu pinpon topumuz olsun. Bu çantanın popülasyon ortalaması 15'tir. Çantada bulunan toplardan rasgele örneklemler seçebilir ve her örneklemden yola çıkarak ortalamayı hesaplayabilirdik. Bazı örneklemlerin ortalaması 15'ten büyük, bazılarınınki 15'ten küçük olabilirdi. Ancak ortalama olarak, her örneklemin ortalaması 15'e eşit olacaktır. Bu özelliği, μx¯=μ olarak ifade ederiz. Özellik rasgele örneklem aldığımız sürece geçerlidir.
Rasgele olmayan örneklem kullandığımızda bu özellik her zaman gerçekleşmez. Yansız olmayan örneklemler kesin olmayan sonuçlara yol açabilir. Bu nedenle güven aralıklarında veya anlamlılık testleri yaparken kullanılmamalıdırlar.

Normallik koşulu

Örneklem ortalaması olan x¯'in örnekleme dağılımı birkaç farklı durumda yaklaşık olarak normaldir. x¯'in örnekleme dağılımının şekli, çoğunlukla ana popülasyonun şekline ve örneklemin büyüklüğüne (n) bağlıdır.

Durum 1: Ana popülasyon normal dağılıma sahip

Ana popülasyonun normal dağılıma sahip olduğu durumda, x¯'in örnekleme dağılımı da, örneklem büyüklüğünden bağımsız olarak yaklaşık normal olur. O halde, ana popülasyonun normal olduğunu bilmemiz durumunda, örneklem büyüklüğü küçük olsa bile bu koşulun sağlandığını kabul edebiliriz. Yine de, gerçekte popülasyon dağılımının normal olup olmadığını, çoğu durumda bilmediğimizi aklınızdan çıkarmamalısınız.

2. Durum: Dağılımı normal olmayan ya da ne bilinmeyen ana popülasyon; örneklem büyüklüğü büyük (n30)

x¯'in örnekleme dağılımı, örneklem büyüklüğü oldukça büyük olduğu sürece yaklaşık olarak normaldir. Merkezi limit teoremine dayalı olarak, n30 olduğunda, ana popülasyonun şekline bakmadan x¯'in örnekleme dağılımının yaklaşık normal olduğunu kabul edebiliriz.
Ana popülasyonun alışılmadık şeklinden ötürü, örneklem ortalaması olan x¯'in örnekleme dağılımının, 30'a yakın örneklem büyüklükleri için normal olmadığı birkaç nadir durum vardır. Bu durumlar ender oldukları için n30 olduğunda, genel olarak örnekleme dağılımlarının yaklaşık olarak normal olduklarını kabul etmek güvenli olacaktır.

3. Durum: Dağılımı normal olmayan veya bilinmeyen ana popülasyon; örneklem büyüklüğü küçük (n<30)

Ana popülasyon aykırı değerlere ya da kuvvetli derecede çarpıklığa sahip olmadığı sürece, büyüklüğü küçük olarak kabul edilebilecek örneklemlerle bile x¯'in örnekleme dağılımını yaklaşık olarak normal yapar. Pratikte, ana nüfusun şeklini çoğu zaman bilmeyiz ancak örneklemdeki verinin dağılımından yola çıkarak şekli hakkında çıkarımlarda bulunabiliriz. Örneklem verisinin aykırı değere sahip olması ya da çarpıklık göstermesi durumunda, ana popülasyonun yaklaşık normal olduğundan şüphe duymalıyız. Bu, x¯'in örnekleme dağılımının da normal olmayacağı anlamına gelir. Örneklem verisinin kabaca simetrik olduğu, aykırı değere ya da çarpıklığa sahip olmadığı durumlarda, x¯'in örnekleme dağılımlarının da yaklaşık normal olduklarını varsayabiliriz.
Ana fikir, n<30 olduğunda örneklem verisinin grafiğine ihtiyacımızın olduğu ve normallik koşulunun sağlanıp sağlanmadığına karar vermek için örnek verinin görüntüsünü kullanmamız gerektiğidir.

Bağımsızlık koşulu

x¯'in standart sapma formülünü kullanmak için bağımsız gözlemlere ihtiyacımız vardır. Bir deneyin iyi tasarlanmış olması, deneklerin bağımsız olmalarına (kontrol grubu, farklı uygulamalar ve rasgeleleştirme) yardımcı olur.
Yerine koymadan örnekleme yapılan gözleme dayalı bir araştırmada, bireysel gözlemler, gözlemlerin yok sayılması her defasında popülasyonu değiştirdiğinden dolayı, teknik olarak bağımsız değillerdir. Ancak, %10 koşuluna göre: Eğer örneklemin büyüklüğü, popülasyonun %10'undan azsa, her bir gözlemden elde edilen sonuç, örnekleme yaparken popülasyonu büyük ölçüde değiştirmez ve bu yüzden bireysel gözlemlerin bağımsız olduklarını kabul edebiliriz. Örneğin, eğer örneklemin büyüklüğü n=30 ise, örneklemin bağımsızlık koşulunu karşılaması için popülasyonda en az N=300 üye olmalıdır.
Gözlemlerin arasındaki bağımsızlığı varsaymamız, güven aralığı belirlerken veya anlamlılık testi yaparken x¯'in standart sapması için aşağıdaki formülü kullanabilmemizi sağlar:
σx¯=σn
Çoğu durumda popülasyonun standart sapmasını (σ) bilmediğimiz için, σ için bir tahmin olarak örneklem satandart sapması olan sx'i kullanabiliriz. Bunu yaptığımızda, standart sapmadan ayırt etmek için x¯'in standart hatası adını veririz.
x¯'in standart hatası için olan formül:
σx¯sxn

Özet

Tüm bu koşulların üçü de sağlanırsa, bir güven aralığı oluşturmak veya anlamlılık testi yapmak için t dağılımlarını kullanmak iyi bir fikirdir. Bu koşulların sağlanması, hesaplamaları doğru ve sonuç adına güvenilir kılar.
Rasgelelik koşulu, koşullar arasında en önemli olanıdır. Rasgelelik koşulunun göz ardı edilmesi durumunda veriler muhtemelen yanlılık içereceklerdir. Yansız olmayan bir deneyi düzeltmenin tek güvenilir yolu, verileri yansız bir şekilde toplamaktır.
Diğer iki koşul da önemlidir fakat eğer normallik veya bağımsızlık koşulları sağlanmazsa, baştan başlamamıza gerek olmaz. Örneğin, örneklemin büyüklüğü, popülasyonun %10'dan fazla olursa, bağımsızlık koşulunu düzeltmenin bir yolu vardır ancak bu, şu an öğrenmekte olduklarımızın kapsamının dışında kalıyor.
Ana fikir, güven aralığı oluşturmadan veya anlamlılık testi yapmadan önce belirli koşulların sağlanıp sağlanmadığını kontrol etmektir.

Tartışmaya katılmak ister misiniz?

Henüz gönderi yok.
İngilizce biliyor musunuz? Khan Academy'nin İngilizce sitesinde neler olduğunu görmek için buraya tıklayın.