Bir nokta grafiğinde kümelenmenin ne olduğunu öğrenin! 

Serpme grafiklerinde kümelenmeler nedir?

Bazen bir serpme grafiğindeki veri noktaları farklı gruplar oluşturur. Bu gruplara kümelenme denir.
19861986'da var olan 1616 sosisli markasına ait besin değerlerini gösteren sağdaki dağılım grafiğine bakın. (Her nokta bir markayı temsil etmektedir.) Bu noktalar, biri solda ve biri de sağda olmak üzere iki kümelenme oluşturur.
Soldaki kümelenme, dşk kalorili ve dşk sodyumluu¨u¨u¨u¨\greenD{\text{düşük kalorili ve düşük sodyumlu}} markalara aittir.
Sağdaki kümelenme yksek kalorili ve yksek sodyumluu¨u¨\blueD{\text{yüksek kalorili ve yüksek sodyumlu}} markalardan oluşur.

Alıştırma problemleri

Kümelenme fikrini daha iyi anlamak için, birkaç alıştırma sorusu deneyelim.

1. Soru: Erkek ve dişi balıklar

Yetişkin erkek Lamprologus callipterus (bir balık türü) dişisinden çok daha büyüktür. Erkeklerin ağırlıkları dişilerin yaklaşık 1313 katıdır. Ayrıca, dişilerin boyu 66 santimetreye ulaşırken, erkeklerin boyu 1515 santimetreye kadar ulaşır.

2. Soru: SAT sınav puanları

ABD'deki bazı lise öğrencileri üniversitelere başvurmadan önce SAT adında bir sınava girerler. Aşağıdaki serpme grafiği her eyaletteki üniversiteye gidecek mezunların yüzde kaçının 2009-20102009\,\text{-}\,2010'da SAT'ye girdiğini ve eyaletin matematik bölümündeki ortalama puanını gösterir.
Dşk katılımu¨u¨\greenD{\text{Düşük katılım}} olan eyaletlerde bir kümelenme ve yksek katılımu¨\blueD{\text{yüksek katılım}} olan eyaletlerde başka bir kümelenme var.

Verilerde kümelenmeler neden olur?

Belli bir veri kümesi üzerinden kümelenmelerin neden ortaya çıktığını açıklamak zor olabilir. Bu makalede gerçek dünyadan veriler kullanan üç veri kümesi sunulmuştur. Sadece balık veri kümesinde kümelenmelerle ilgili net bir açıklama vardır.
Diğer veri kümelerindeki kümelenmeleri açıklayan bir teoriniz varsa, lütfen fikirlerinizi aşağıdaki yorumlar kısmında paylaşın.