In probability theory, a discrete probability distribution describes the likelihood of outcomes for a random variable (
A random variable is a formal way to assign numerical values to the outcomes of a random experiment.
Given a random experiment with a sample space
A random variable
- There are a finite number of possible outcomes of
$X$ , or - There are a countably infinite number of possible outcomes of
$X$ .
As shown in the examples below, the number of all possible outcomes for a discrete variable must be countable.
Consider flipping a fair coin. Let the random variable
-
$X = 1$ if the outcome is Heads -
$X = 0$ if the outcome is Tails
This is an example of a Bernoulli random variable, which takes only two distinct values.
Probabilities:
The sum of probabilities equals 1:
Imagine rolling a single six-sided die. Let
Each side of the die has an equal probability of
Probabilities:
This summary provides an overview of the core concepts, types, and importance of discrete probability distributions, based on technical and financial analysis.
| Feature | Description |
|---|---|
| Definition | A discrete probability distribution counts occurrences for a random variable that can only take on a finite or countably infinite set of distinct, specific values (e.g., |
| Contrast | It contrasts with continuous distributions, where outcomes can fall anywhere on a continuum (e.g., all real numbers in a range). |
| Core Concept | These distributions often involve statistical analysis of "counts" or "how many times" an event occurs. |
| Example | The Binomial Distribution evaluates the probability of a "yes" or "no" outcome over a given number of trials (e.g., coin flips). |
- Modeling Countable Data: They are essential because they provide the mathematical framework for modeling data that consists only of distinct, countable outcomes.
- Statistical Differentiation: Unlike the continuous Normal Distribution, a discrete distribution is specifically designed for data that cannot take on infinite values between two points (e.g., you can't have 1.5 coin flips or 3.7 customers).
- Finance Applications: In finance, they are critical for applications like options pricing (using binomial tree models) and forecasting market shocks or recessions.
The most common types used in statistics, data science, and finance include:
| Distribution Type | Characteristic | Primary Use |
|---|---|---|
| Binomial | Only two possible outcomes (success/failure) over repetitive trials. | Modeling outcomes of repeatable binary events (e.g., success rate in A/B testing). |
| Bernoulli | Similar to binomial, but for only a single trial. Outcomes are |
Viewing the probability that a single investment or event will succeed or fail. |
| Poisson | Expresses the probability of a given number of events occurring over a fixed period or space. Outcomes are integers ( |
Modeling rare event frequency, like the number of transactions per minute or the number of claims received. |
| Multinomial | Occurs when there is a probability of more than two outcomes with multiple counts. | Estimating the probability that a specific set of financial events (e.g., stock price moves up, down, or stays flat) will occur. |
| Feature | Discrete Distribution | Continuous Distribution |
|---|---|---|
| Outcomes | Countable values (integers, binary). | Any value within a range (real numbers, fractions). |
| Graph | Represented by separate bars because there are gaps between possible values. | Represented by a continuous curve or line (e.g., the bell curve) because all values are possible. |
| Function | Probability Mass Function (PMF): Gives the probability of a specific point. | Probability Density Function (PDF): Gives the probability over an interval. |
Ayrık olasılık dağılımlarının temel önemi, sayılabilir ve belirli sonuçlara sahip gerçek dünya olaylarını modellemek ve analiz etmek için gerekli matematiksel çerçeveyi sağlamalarından kaynaklanmaktadır.
Ayrık dağılımlar, ara (kesirli) değerlerin mantıksal olarak imkansız olduğu verileri doğru bir şekilde temsil ettikleri için hayati öneme sahiptir.
-
Doğru Temsil: Gerçek dünyadaki birçok sonuç tam, negatif olmayan sayılar (tamsayılar) olmak zorundadır. Örneğin,
$2.5$ arabanız veya$3.3$ arızanız olamaz. - Özel Araçlar: Poisson ve Binomial dağılımları gibi ayrık dağılımlar, bu sayılabilir veri noktalarını işlemek üzere özel olarak tasarlanmıştır, bu da yüksek doğrulukta ve eyleme geçirilebilir tahminler sağlar.
-
Temel Veri Türü: Yalnızca iki sonucu olan olaylar (Başarı/Başarısızlık, Evet/Hayır,
$0/1$ ), ayrık verinin en temel türüdür. - Temel Modeller: Bernoulli ve Binomial dağılımları, tek bir yazı tura denemesinden, çok sayıda denemede bir web sitesinin dönüşüm oranını hesaplamaya kadar her şeyi modellemek için zorunludur.
Ayrık dağılımlar, örnek verilere dayanarak popülasyonlar hakkında kanıta dayalı kararlar almak ve teorileri titizlikle test etmek için temel oluşturur.
- Hipotez Testi: İstatistikçiler bir oran veya sayı hakkındaki iddiayı test ederken (örneğin, "Kusur oranı %1'den yüksek mi?"), örnek sonuçları gözlemleme olasılığını hesaplamak için Binomial dağılımı gibi dağılımlara güvenirler. Bu süreç, bulgunun istatistiksel olarak anlamlı olup olmadığını belirler.
- Popülasyon Parametrelerini Çıkarım: Bir örneklemdeki sayılabilir sonuçları gözlemleyerek, bu dağılımlar daha büyük popülasyonun özelliklerini çıkarmamıza ve tahmin etmemize olanak tanır (örneğin, tüm ürün grubu için gerçek başarı olasılığını tahmin etmek).
Modern veri odaklı alanlarda, ayrık olasılık, güçlü sınıflandırma algoritmaları ve olay sıklıklarını modelleme açısından kritiktir.
- Naive Bayes Sınıflandırıcısı: Makine öğrenimindeki en ünlü algoritmalardan biri olan Naive Bayes Sınıflandırıcısı, doğrudan ayrık olasılık kullanarak Bayes Teoremi prensipleri üzerine inşa edilmiştir. Metin sınıflandırma (spam filtreleme, duygu analizi) görevlerinde, özellikler kelime sayıları gibi ayrık veriler olduğu için son derece etkilidir.
- Nadir Olayların Modellenmesi (Poisson): Poisson dağılımı, sabit bir aralıkta nadir olayların sıklığını tahmin etmek için hayati öneme sahiptir. Bu, aşağıdaki durumları modellemek için kullanılır:
- Bir çağrı merkezine dakikada gelen müşteri çağrısı sayısı.
- Bir günde meydana gelen sunucu çökmelerinin sayısı.
- Belirli bir dönemde açılan sigorta taleplerinin sıklığı.
Risk miktarının belirlenmesinin çok önemli olduğu finansta, ayrık dağılımlar potansiyel kazanç ve kayıpları değerlendirmek için yapılandırılmış yollar sunar.
- Opsiyon Fiyatlandırması (Binomial Ağaç Modeli): Binomial Ağaç Modeli, opsiyon değerlemesi için temel bir araçtır. Bir hisse senedi fiyatının yalnızca iki farklı, ayrık değere (yukarı veya aşağı) hareket edebileceği varsayımına dayanarak karmaşık fiyat hareketlerini basitleştirir ve sağlam bir risk analizi yöntemi sağlar.
- Portföy Riski: Ayrık dağılımlar, bir şirketin temerrüde düşme veya ani bir piyasa şoku olayı gibi, bir portföy içinde meydana gelen ayrık risklerin olasılığını ölçmeye yardımcı olur.
Özetle: Ayrık dağılımlar, sayıları, sıklıkları ve ikili kararları analiz etmek için matematiksel bir temeldir. Bu dağılımlar, bizi basit sayılabilir sonuçları gözlemlemekten, hemen hemen her nicel alanda karmaşık ve rasyonel çıkarımlar yapmaya taşır.
Bu dağılımlar, sayılabilir sonuçlara sahip rastgele olayları analiz etmek için kullanılan en önemli matematiksel araçlardır.
Bernoulli Dağılımı - Vikipedi (Ayrıntılı Teknik Bilgi)
| Özellik | Açıklama |
|---|---|
| Tanım | Bir deneyin yalnızca iki olası sonucu olduğunda (başarı veya başarısızlık) kullanılır. Tek bir denemeyi modeller. |
| Sonuçlar |
|
| Parametre | Başarı olasılığı ( |
| Olasılıklar |
|
| Kullanım Alanı | Atılan bir paranın sonucu veya tek bir müşteri işleminin başarılı olup olmadığı gibi ikili (binary) sonuçlu durumlar. |
Binomial Dağılım - Vikipedi (Ayrıntılı Teknik Bilgi)
| Özellik | Açıklama |
|---|---|
| Tanım | Bernoulli deneyinin ardışık, bağımsız |
| Koşullar | Deneme sayısı ( |
| Parametreler | Deneme sayısı ( |
| Kullanım Alanı |
|
Poisson Dağılımı - Vikipedi (Ayrıntılı Teknik Bilgi)
| Özellik | Açıklama |
|---|---|
| Tanım | Belirli bir zaman aralığında veya sabit bir alanda nadir olayların kaç kez gerçekleşeceğini modeller. |
| Koşullar | Olaylar bağımsızdır, gerçekleşme hızı ( |
| Sonuçlar | Sonsuz sayıda olası sonuç ( |
| Parametre | Beklenen olay sayısı ( |
| Kullanım Alanı | Bir çağrı merkezine bir saat içinde gelen çağrı sayısı veya bir web sitesine bir dakikada gelen ziyaretçi sayısı gibi sıklık veya hız ile ilgili olayları modellemek. |
Geometrik Dağılım - Vikipedi (Ayrıntılı Teknik Bilgi)
| Özellik | Açıklama |
|---|---|
| Tanım | Bir Bernoulli deneyi dizisinde, ilk başarının elde edilmesi için gereken deneme sayısını modeller. |
| Sonuçlar |
|
| Parametre | Başarının olasılığı ( |
| Kullanım Alanı | Bir ürünün kalite kontrolünden ilk geçtiği deneme sayısını bulmak. |
Bu tablo, dört temel ayrık dağılımın ne zaman (Koşullar), ne işe yaradığı (Amaç) ve nerede (Uygulama Alanı) kullanıldığını özetlemektedir.
| Dağılım Adı | Temel Amaç (Ne İşe Yarar) | Temel Koşullar (Ne Zaman Kullanılır) | Uygulama Alanları (Nerede Kullanılır) |
|---|---|---|---|
| 1. Bernoulli | Tek bir denemede başarı olasılığını modellemek. | Deney sadece bir kez yapılır ve sonuç iki değerden biri olmalıdır ( |
İkili (Binary) Testler: Tek bir kullanıcının reklama tıklayıp tıklamaması, bir test sonucunun pozitif ya da negatif çıkması. |
| 2. Binomial | Bağımsız |
Deneme sayısı ( |
Kalite Kontrol: Üretilen |
| 3. Poisson | Sabit bir zaman, alan veya hacim biriminde nadir olayların ( |
Olayların gerçekleşme hızı ( |
Hizmet Sektörü/BT: Çağrı merkezine dakikada gelen çağrı sayısı. Bir sunucuda ayda meydana gelen hata sayısı. Finans: Belirli bir günde yapılan işlem sayısı. |
| 4. Geometrik |
İlk başarının elde edilmesi için gereken deneme sayısını ( |
Denemeler bağımsızdır. Başarı olasılığı ( |
Kalite Kontrol: Bir makineden ilk hatasız ürün çıkana kadar kaç deneme yapılması gerektiği. Oyun Teorisi: Bir şans oyununda ilk kez kazanmak için gereken oyun sayısı. |