Verallgemeinerte Binomialverteilung |
Wahrscheinlichkeitsfunktion
|
Verteilungsfunktion
|
Parameter | – Erfolgswahrscheinlichkeiten für jeden der n Versuche |
Träger | |
Dichtefunktion | |
Verteilungsfunktion | |
Erwartungswert | |
Varianz | |
Schiefe | |
Wölbung | |
Momenterzeugende Funktion | |
Charakteristische Funktion | |
Die Verallgemeinerte Binomialverteilung (gelegentlich auch Poissonsche Verallgemeinerung der Binomialverteilung, oder Poisson-Binomialverteilung genannt) ist eine Wahrscheinlichkeitsverteilung und somit dem mathematischen Teilgebiet der Stochastik zuzuordnen. Bei ihr handelt es sich um eine univariate diskrete Wahrscheinlichkeitsverteilung. Sie ist definiert als die Summe von unabhängigen, nicht notwendigerweise identisch verteilten Zufallsvariablen, welche einer Bernoulli-Verteilung unterliegen.
Die Verallgemeinerte Binomialverteilung beschreibt also die Erfolge einer Serie von unabhängigen Versuchen, welche jeweils genau zwei Ergebnisse annehmen kann. Der Unterschied zur Binomialverteilung besteht darin, dass jedem Versuch eine andere Erfolgswahrscheinlichkeit zugeordnet werden kann.
Es ist auch möglich die Verallgemeinerte Binomialverteilung als Summe von unabhängigen, nicht identischen, binomialverteilten Zufallsvariablen festzulegen, wobei die Bernoulli Zufallsgrößen mit identischen Erfolgswahrscheinlichkeiten zu binomialverteilten Zufallsvariablen zusammengefasst werden.
Definition der Verallgemeinerten Binomialverteilung
Eine diskrete Zufallsvariable
folgt einer Verallgemeinerten Binomialverteilung mit Parametervektor
, wenn sie die folgende Wahrscheinlichkeitsfunktion besitzt[1]
,
wobei
den Vektor der Erfolgswahrscheinlichkeiten pro Versuch und
die Gesamtanzahl der Erfolge bei
Versuchen bezeichnet.
Schreibweise:
ist die Menge aller
-elementigen Teilmengen, die aus dem Träger
gebildet werden können.
ist das Komplement von
, das heißt
.
Die zugehörige Verteilungsfunktion lautet[2]
![{\displaystyle F_{X}(k)=P(X\leq k)=\sum \limits _{l=0}^{k}\sum \limits _{A\in B_{l}}\prod \limits _{i\in A}p_{i}\prod \limits _{j\in A^{c}}{(1-p_{j})}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/61d8ebfe2d3f9bbf67951bb17c8b7e7c9c7566eb)
Alternative Parametrisierung
Die Verallgemeinerte Binomialverteilung kann ebenso als Summe von binomialverteilten Zufallsgrößen definiert werden, indem die Bernoulli Zufallsvariablen mit gleichen Erfolgswahrscheinlichkeiten zu binomialverteilten Zufallsgrößen zusammengefasst werden.
,
wobei der Parametervektor
die Erfolgswahrscheinlichkeiten von
binomialverteilten Zufallsvariablen enthält und der Parametervektor
die jeweils zugehörige Anzahl an Versuchen.
Es gilt somit
. Hierbei ist
der Einsvektor der Länge
, bestehend aus lauter Einsen.
Eigenschaften der Verallgemeinerten Binomialverteilung
sei im Folgenden eine Zufallsvariable, die einer Verallgemeinerten Binomialverteilung folgt
.
Erwartungswert
Die Verallgemeinerte Binomialverteilung besitzt den Erwartungswert
![{\displaystyle E(X)=\sum \limits _{i=1}^{n}p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7888b0268db7a4c69bdfed61420e013a2146918b)
Varianz
Die Verallgemeinerte Binomialverteilung besitzt die Varianz
![{\displaystyle Var(X)=\sum \limits _{i=1}^{n}(1-{p_{i}}){p_{i}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4d7fe032c5083f3d91cf12a4e3426d2bdca43ba7)
Schiefe
Die Verallgemeinerte Binomialverteilung besitzt die Schiefe
![{\displaystyle v(X)={\frac {\sum \limits _{i=1}^{n}{\left(1-2{p_{i}}\right)\left(1-{{p}_{i}}\right){{p}_{i}}}}{(\sum \limits _{i=1}^{n}\left(1-{p_{i}}){p_{i}}\right)^{\frac {3}{2}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1d44ff27e670fc3a586a2d99474bd7ae1cbedeb7)
Wölbung und Exzess
Die Verallgemeinerte Binomialverteilung besitzt die Wölbung
![{\displaystyle \beta _{2}=3+{\frac {\sum \limits _{i=1}^{n}{\left(1-6(1-p_{i}){p_{i}}\right)\left(1-p_{i}\right)p_{i}}}{(\sum \limits _{i=1}^{n}\left(1-{p_{i}}){p_{i}}\right)^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/609eed2be1586bd3be038890358977e6ff71b2e2)
und damit den Exzess
![{\displaystyle \gamma =\beta _{2}-3={\frac {\sum \limits _{i=1}^{n}{\left(1-6(1-p_{i}){p_{i}}\right)\left(1-p_{i}\right)p_{i}}}{(\sum \limits _{i=1}^{n}\left(1-{p_{i}}){p_{i}}\right)^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8fe76d419345653e739036265222174c69442a6e)
Kumulanten
Die kumulantenerzeugende Funktion ist
.
Daher ist die k-te Kumulante genau die Summe der k-ten Kumulanten der n Bernoulli-verteilten Zufallsvariablen, aus denen die Verallgemeinerte Binomialverteilung zusammengesetzt ist:
![{\displaystyle \tau _{k}=\tau _{k}^{1}+\dots +\tau _{k}^{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c4e62d78e83c4613880d97eac5bc08fd718cba4c)
Für diese Kumulanten gilt dann auch die Rekursionsgleichung der Kumulanten der Bernoulli-Verteilung.
Wahrscheinlichkeitserzeugende Funktion
Die wahrscheinlichkeitserzeugende Funktion der verallgemeinerten Binomialverteilung lautet
![{\displaystyle m_{X}(t)=\prod \limits _{j=1}^{n}(1-{p_{j}}+{p_{j}}{t})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/471547e10cc61310b5168f6147e78d5e363693cc)
Charakteristische Funktion
Die charakteristische Funktion der Verallgemeinerten Binomialverteilung lautet:
![{\displaystyle \varphi _{X}(t)=\prod \limits _{j=1}^{n}(1-{p_{j}}+{p_{j}}{e^{it}})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0023b68b042e99b62c6a869936b10df3a7364fa8)
Momenterzeugende Funktion
Die momenterzeugende Funktion der Verallgemeinerten Binomialverteilung lautet:
![{\displaystyle M_{X}(t)=\prod \limits _{j=1}^{n}(1-{p_{j}}+{p_{j}}{e^{t}})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3a74989096cf1c3ed00fad2173d1c408a17c91e9)
Summe von verallgemeinert binomialverteilten Zufallsvariablen
Ist
und
zwei unabhängige verallgemeinert binomialverteilte Zufallsvariablen, dann ist auch
verallgemeinert binomialverteilt:
. Demnach ist die verallgemeinerte Binomialverteilung reproduktiv.
Beziehung zu anderen Verteilungen
Beziehung zur Binomialverteilung
Die Summe von voneinander unabhängigen binomialverteilten Zufallsvariablen
ist verallgemeinert binomialverteilt. Wenn alle Erfolgswahrscheinlichkeiten gleich sind, das heißt
, dann ergibt sich aus der Verallgemeinerten Binomialverteilung die Binomialverteilung. Tatsächlich ist die Binomialverteilung für festen Erwartungswert und feste Ordnung diejenige verallgemeinerte Binomialverteilung mit maximaler Entropie.[3] Das bedeutet, unter der Bedingung, dass der Parametervektor
von
die Länge
hat, maximiert
die Entropie
.
Beziehung zur Bernoulli-Verteilung
Die Summe von
voneinander unabhängigen Bernoulli-verteilten Zufallsvariablen
, die alle einen unterschiedlichen Parameter
besitzen, ist verallgemeinert binomialverteilt.
Approximation durch die Poisson-Verteilung
Für eine sehr große Anzahl an Versuchen
und sehr kleine, aber unterschiedliche Erfolgswahrscheinlichkeiten
kann die Wahrscheinlichkeitsfunktion der Verallgemeinerten Binomialverteilung durch die Poisson-Verteilung approximiert werden.[2]
![{\displaystyle \rho _{X}(k)\approx {\frac {\lambda ^{k}}{k!}}\cdot \mathrm {e} ^{-\lambda }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ca9c5db245dfc82ac71913c992596c0f3e2c4127)
Der Parameter
ist gleich dem Erwartungswert der Verallgemeinerten Binomialverteilung.
Approximation durch die Normalverteilung
Die Verteilungsfunktion der Verallgemeinerten Binomialverteilung kann für eine sehr große Anzahl an Versuchen
durch die Normalverteilung approximiert werden.[2]
![{\displaystyle F_{X}(k)\approx \Phi \left({\frac {k+0{,}5-\mu }{\sigma }}\right),\ k=0,\dots ,n}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3b396cba46f83e95e5033faf022cf449d285c595)
Der Parameter
entspricht dem Erwartungswert und
der Standardabweichung der Verallgemeinerten Binomialverteilung.
ist die Verteilungsfunktion der Standardnormalverteilung.
Beispiele
Radarkontrolle
Ein Arbeitnehmer muss an jedem Arbeitstag über die Autobahn und durch das Ortsgebiet zur Arbeit fahren. Die Wahrscheinlichkeiten in eine Radarkontrolle zu geraten sind
auf der Autobahn und
im Ortsgebiet.
Wie hoch sind die Wahrscheinlichkeiten an einem Arbeitstag in
Kontrollen zu geraten?
Die zufällige Anzahl von Radarkontrollen
kann als Summe von zwei Bernoulli-verteilten Zufallsvariablen
für die Autobahn und
für das Ortsgebiet modelliert werden:
, mit
![{\displaystyle R_{1}={\begin{cases}1,&{\text{Kontrolle mit Wahrscheinlichkeit }}0{,}005\\0,&{\text{keine Kontrolle mit Wahrscheinlichkeit }}0{,}995\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6eee2b7d00609650c49e22ed462f8aaaf33b148d)
![{\displaystyle R_{2}={\begin{cases}1,&{\text{Kontrolle mit Wahrscheinlichkeit }}0{,}01\\0,&{\text{keine Kontrolle mit Wahrscheinlichkeit }}0{,}99\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/34be750c4bbca6a31c68044982ef4ea0b7ff5b64)
Da
und
unterschiedliche Erfolgswahrscheinlichkeiten besitzen, kann man dieses Beispiel nicht mit Hilfe der Binomialverteilung lösen.
folgt einer Verallgemeinerten Binomialverteilung mit Parametervektor
.
Die gesuchten Wahrscheinlichkeiten können folgendermaßen berechnet werden:
Kontrollen: ![{\displaystyle P(R=0)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/060792e6053efe7df2e0d103841fad94d85544b8)
![{\displaystyle P(R=0)=P(R_{1}=0)\cdot P(R_{2}=0)=0{,}995\cdot 0{,}99=0{,}98505=98{,}505\,\%}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff4f3b390c953bb0aebdab4d342a18d0006005a1)
Kontrolle: ![{\displaystyle P(R=1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c97eae8dd41abac8e45235e89a5c72fc2f44666e)
![{\displaystyle P(R=1)=P(R_{1}=1)\cdot P(R_{2}=0)+P(R_{1}=0)\cdot P(R_{2}=1)=0{,}005\cdot 0{,}99+0{,}995\cdot 0{,}01=0{,}0149=1{,}49\,\%}](https://wikimedia.org/api/rest_v1/media/math/render/svg/33b55fca16c0c9df81ab99e8f0a44cc082047946)
Kontrollen: ![{\displaystyle P(R=2)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8b809559d850a88ce2f22b5ab4b24ac5b5550d7e)
![{\displaystyle P(R=2)=P(R_{1}=1)\cdot P(R_{2}=1)=0{,}005\cdot 0{,}01=0{,}00005=0{,}005\,\%}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53c7c25bfbbebedbe183d63fd6fdee58c9c9fe93)
Herstellungsprozess
In einer Fabrik werden Geräte produziert und anschließend einer Qualitätskontrolle unterzogen. Es können
verschiedene Fehlertypen auftreten. Die Wahrscheinlichkeiten, dass ein spezieller Fehlertyp auftritt sind
für den Fehler vom Typ
und jeweils
für die Fehlertypen
und
.
Wie hoch sind die Wahrscheinlichkeiten dafür, dass ein Gerät mit
Fehlern produziert wird?
Die zufällige Anzahl von Fehlern
kann als Summe von drei Bernoulli-verteilten Zufallsvariablen
,
und
geschrieben werden:
, mit
![{\displaystyle F_{1}={\begin{cases}1,&{\text{Fehler mit Wahrscheinlichkeit }}0{,}04\\0,&{\text{kein Fehler mit Wahrscheinlichkeit }}0{,}96\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/074fd24df1b857a9438885c521b215f5f811a538)
![{\displaystyle F_{2}=F_{3}={\begin{cases}1,&{\text{Fehler mit Wahrscheinlichkeit }}0{,}07\\0,&{\text{kein Fehler mit Wahrscheinlichkeit }}0{,}93\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/15bdac88503766aaabcd2863857dc0f0c6449346)
besitzt eine Verallgemeinerten Binomialverteilung mit Parametervektor
.
Alternativ kann die Parametrisierung
gewählt werden, indem die identischen Bernoulli Zufallsvariablen zu einer binomialverteilten Zufallsvariable zusammengefasst werden.
Die gesuchten Wahrscheinlichkeiten können folgendermaßen berechnet werden:
Fehler: ![{\displaystyle P(F=0)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cf0445e50642041abd99c09090bf5cb8596ee47e)
![{\displaystyle P(F=0)=P(F_{1}=0)\cdot P(F_{2}=0)\cdot P(F_{3}=0)=0{,}96\cdot 0{,}93\cdot 0{,}93=0{,}830304=83{,}0304\,\%}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ba36bac24b9f5e92039c7d1a070d329ed273997e)
Fehler: ![{\displaystyle P(F=1)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/52aa5ea060c8a8c18340b4f6edff4e0e5edd82c9)
![{\displaystyle {\begin{aligned}P(F=1)&=P(F_{1}=1)\cdot P(F_{2}=0)\cdot P(F_{3}=0)+P(F_{1}=0)\cdot P(F_{2}=1)\cdot P(F_{3}=0)+P(F_{1}=0)\cdot P(F_{2}=0)\cdot P(F_{3}=1)\\&=0{,}04\cdot 0{,}93\cdot 0{,}93+0{,}96\cdot 0{,}07\cdot 0{,}93+0{,}96\cdot 0{,}93\cdot 0{,}07=0{,}159588=15{,}9588\,\%\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1bc898e1a675b0708630123b305d0a7f63727cfc)
Fehler: ![{\displaystyle P(F=2)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7a2456c592d24be6568d22ab490ef0cfb6efc251)
![{\displaystyle {\begin{aligned}P(F=2)&=P(F_{1}=1)\cdot P(F_{2}=1)\cdot P(F_{3}=0)+P(F_{1}=0)\cdot P(F_{2}=1)\cdot P(F_{3}=1)+P(F_{1}=1)\cdot P(F_{2}=0)\cdot P(F_{3}=1)\\&=0{,}04\cdot 0{,}07\cdot 0{,}93+0{,}96\cdot 0{,}07\cdot 0{,}07+0{,}04\cdot 0{,}93\cdot 0{,}07=0{,}009912=0{,}9912\,\%\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/af8a6b2adef9f2e5a08bed329d69c8a19079b15d)
Fehler: ![{\displaystyle P(F=3)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/95d2c5feac40c1711c7c0c3215dd888b6f75befa)
![{\displaystyle P(F=3)=P(F_{1}=1)\cdot P(F_{2}=1)\cdot P(F_{3}=1)=0{,}04\cdot 0{,}07\cdot 0{,}07=0{,}000196=0{,}0196\,\%}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2e92b3ea734ad48e9c2bd1fe8f813b194691c81d)
Anwendung & Berechnung
Die Verallgemeinerte Binomialverteilung kommt in vielen Bereichen zum Einsatz; z. B. Umfragen, Herstellungsprozesse, Qualitätssicherung. Oft wird allerdings eine Approximation benutzt, da die exakte Berechnung sehr aufwändig ist. Ohne entsprechende Software sind selbst einfache Modelle mit wenigen Bernoulli Zufallsvariablen kaum zu berechnen.
Zufallszahlen
Zur Erzeugung von Zufallszahlen kann die Inversionsmethode verwendet werden. Alternativ kann man auch
Bernoulli-verteilte Zufallszahlen zu den Parametern
erzeugen und diese Aufsummieren. Das Ergebnis ist dann verallgemeinert binomialverteilt.
Literatur
- M.Fisz, Wahrscheinlichkeitsrechnung und mathematische Statistik, VEB Deutscher Verlag der Wissenschaften, 1973, p. 164 ff.
- K.J. Klauer, Kriteriumsorientierte Tests, Verlag für Psychologie, Hogrefe, 1987, Göttingen, p. 208 ff.
Weblinks
- GenBinomApps – R Package. R Package zur Berechnung von Clopper Pearson Konfidenzintervallen und der verallgemeinerten Binomialverteilung. Abgerufen am 30. Juli 2015.
Einzelnachweise
- ↑ On the Number of Successes in Independent Trials. (PDF; 1,6 MB) Y.H.Wang, Statistica Sinica, Vol. 3, 1993, p. 295–312. Abgerufen am 23. September 2013.
- ↑ a b c On Computing the Distribution Function for the Sum of Independent and Non-identical Random Indicators. (Memento vom 23. Oktober 2015 im Internet Archive) (PDF; 110 kB) Y.Hong, Blacksburg, USA, 5. April 2011. Abgerufen am 23. September 2013.
- ↑ Peter Harremoës: Binomial and Poisson Distributions as Maximum Entropy Distributions. In: IEEE Transactions on Information Theory. 47. Jahrgang. IEEE Information Theory Society, 2001, S. 2039–2041, doi:10.1109/18.930936.
Diskrete univariate Verteilungen
Kontinuierliche univariate Verteilungen
Multivariate Verteilungen