(COMPREHENSIVE AND COMPARATIVE EXPERT REPORT ON COMMON DISCRETE PROBABILITY DISTRIBUTIONS)
Ayrık Olasılık Dağılımları, sonuçları sayılabilir (countable) bir kümeden gelen rastgele değişkenleri (Random Variables) modellemek için kullanılır. Bu sonuçlar genellikle tam sayılardır (örn: bir madeni paranın iki kez atılmasında Tura gelme sayısı X = {0, 1, 2}). Bu yapı, ayrık dağılımları, sayım verilerinin (count data) analizinde temel araç haline getirir.
Sürekli dağılımların aksine, ayrık dağılımlarda her bir spesifik sonuç için net bir olasılık atanır.
Ayrık rastgele değişkenlerin tanımlanmasında kullanılan temel fonksiyon, Olasılık Kütle Fonksiyonu (Probability Mass Function - PMF) olarak adlandırılır. PMF,
Kritik Koşul: Rastgele değişkenin alabileceği tüm olası değerler kümesi üzerindeki PMF değerlerinin toplamının kesinlikle 1'e eşit olması gerekir.
- Beklenen Değer (Expected Value - μ): Rastgele değişkenin uzun vadede alması beklenen ortalama değerdir. Merkezi eğilimin temel ölçüsüdür.
-
Varyans (Variance -
$\sigma^2$ ): Rastgele değişkenin beklenen değer etrafında ne kadar yayıldığının (belirsizlik veya risk) bir ölçüsüdür. Karekökü Standart Sapmayı verir.
Kısım II: Temel Ayrık Dağılımların Matematiksel Anatomisi (Mathematical Anatomy of Key Discrete Distributions)
Tek bir denemenin sonucunu (Başarı=1, Başarısızlık=0) modeller.
| Parametre | PMF | Beklenen Değer ( |
Varyans ( |
|---|---|---|---|
|
|
|
Sabit sayıda (
| Parametreler | PMF | Beklenen Değer ( |
Varyans ( |
|---|---|---|---|
|
|
Bir Bernoulli sürecinde ilk başarının elde edilmesi için gereken toplam deneme sayısını (
| Parametre | PMF | Beklenen Değer ( |
Varyans ( |
|---|---|---|---|
|
|
- Temel Özellik: Ayrık alandaki tek "hafızasız" (memoryless) dağılımdır.
Binom'un aksine, örnekleme işlemi yedeklemesiz (without replacement) yapılır, bu nedenle denemeler bağımlıdır.
| Parametreler | PMF | Beklenen Değer ( |
Varyans ( |
|---|---|---|---|
|
|
-
Özellik: Varyans formülündeki
$\frac{N-n}{N-1}$ terimi, Sonlu Popülasyon Düzeltme Faktörü olarak bilinir.
Belirli bir zaman aralığında veya mekanda meydana gelen nadir olayların sayısını (
| Parametre | PMF | Beklenen Değer ( |
Varyans ( |
|---|---|---|---|
|
|
-
Ayırt Edici Özellik: Beklenen Değer (
$\mu$ ) ve Varyans ($\sigma^2$ ) birbirine eşittir ($\mu = \sigma^2 = \lambda$ ). -
Aşırı Yayılım (Overdispersion): Gerçek veride
$\sigma^2 > \mu$ ise, Poisson varsayımlarının (bağımsızlık, sabit oran) ihlal edildiği ve Negatif Binom gibi modellere geçilmesi gerektiği anlaşılır.
| Dağılım (Distribution) | Kurucu (Founder) | Ana Eser (Key Publication) | Yayım Yılı (Publication Year) | Kronolojik Sıra (Order) |
|---|---|---|---|---|
| Bernoulli / Binom | Jacob Bernoulli | Ars Conjectandi | 1713 | 1. (Temel) |
| Poisson | Siméon Denis Poisson | Recherches sur la probabilité des jugements... | 1837 | 2. |
| Hipergeometrik | (Teorik Gelişim) | (Örnekleme Teorisi Kaynakları) | 19. Yüzyıl Başları | 3. |
| Kriter | Binom Dağılımı | Hipergeometrik Dağılım |
|---|---|---|
| Örnekleme | Yedeklemeli (With Replacement) | Yedeklemesiz (Without Replacement) |
| Bağımlılık | Bağımsız Denemeler | Bağımlı Denemeler |
| Kullanım Zorunluluğu |
|
|
| Varyans Etkisi | Daha yüksek risk/belirsizlik tahmini | FPC Faktörü nedeniyle daha düşük varyans ve gerçekçi tahmin |
- İlişki: Poisson, Binom dağılımının bir limit durumudur.
-
Yakınsama Koşulları: Deneme sayısı
$n \rightarrow \infty$ , başarı olasılığı$p \rightarrow 0$ iken, ortalama olay oranı$\lambda = np$ sabit kalır. -
Üstünlük: Sonsuz potansiyel denemenin olduğu (nadir olaylar) ve olay oranının (
$\lambda$ ) sabit olduğu durumlarda Poisson daha basit ve uygundur.
-
Binom: Sabit
$n$ denemesi içindeki başarı sayısını sayar. -
Geometrik: İlk başarıya ulaşana kadar gereken toplam deneme sayısını sayar. (Negatif Binom'un
$r=1$ özel hali) -
Negatif Binom:
$r$ sayıda başarı elde edilene kadar geçen toplam deneme sayısını sayar.
| Dağılım | Parametreler | PMF | Beklenen Değer ( |
Varyans ( |
Temel Varsayım |
|---|---|---|---|---|---|
| Bernoulli | Tek Bağımsız Deneme | ||||
| Binom | Sabit |
||||
| Geometrik | İlk Başarıya Kadar Geçen Deneme, Bağımsızlık | ||||
| Poisson | Bağımsız Olaylar, Sabit Oran |
||||
| Hipergeo. | Yedeklemesiz Örnekleme, Bağımlılık |
-
Bağımlılık ve Örnekleme Mekanizması Kontrolü:
- Eğer
$N$ sonluysa ve$n/N > 0.05$ ise, Hipergeometrik dağılım kullanmak zorunludur. Yanlış model seçimi (Binom) risk tahminlerinin hatalı olmasına yol açar.
- Eğer
-
Varyansın Ortalama İle Karşılaştırılması (Aşırı Yayılım Analizi):
- Poisson varsayımı
$\mu = \sigma^2$ 'dır. Eğer verilerde$\sigma^2 > \mu$ (Aşırı Yayılım) gözlemlenirse, Poisson varsayımları ihlal edilmiştir; Negatif Binom gibi daha esnek dağılımlara geçiş yapılmalıdır.
- Poisson varsayımı
-
Yaklaşım Koşullarının Doğrulanması (Konverjans):
- Binom'dan Poisson'a geçiş yapmadan önce
$n$ yeterince büyük ve$p$ yeterince küçük (nadir olay) koşullarının sağlandığından emin olun.
- Binom'dan Poisson'a geçiş yapmadan önce
-
The Python code snippets illustrate how to compute and visualise these distributions using scipy.stats.
-
Colab Notebook: Common Discrete Distributions (Google Colab)