Zufallsgröße Wird
jedem Ausgang eines Zufallsexperiments eine Zahl zugeordnet, so
heißt die Funktion, die diese Zuordnung beschreibt
"Zufallsgröße". Zufallsgrößen bezeichnet man oft mit X , Y oder Z ohne oder X1, X2, X3, ... mit Index. Die Werte (oder Realisationen) einer Zufallsgröße werden häufig mit k oder k1, k2, k3, ... bezeichnet.
Häufigkeitsverteilung einer Zufallsgröße Wird
in einem Zufallsversuch zu jedem Wert k einer Zufallsgröße X
die relative Häufigkeit h(k) bestimmt, so heißt die
Zuordnung von Wert der Zufallsgröße zu relativer
Häufigkeit Häufigkeitsverteilung.
Wahrscheinlichkeitsverteilung oder kurz: Verteilung Jedem Wert ki der Zufallsgröße X wird eine Wahrscheinlichkeit p(X=ki) zugeordnet. Die Zurodnungsvorschrift nennt man Wahrscheinlichkeitsverteilung oder einfach nur Verteilung.
kumulierte Wahrscheinlichkeitsverteilung Wird in einer Tabelle nicht jeweils die Wahrscheinlichkeit p(X=ki), sondern die Summe von Wahrscheinlichkeiten p(X<=ki) gelistet, so nennt man dies kumulierte Wahrscheinlichkeitsverteilung.
Beispiel: Wir
haben in 4 Gruppen jeweils 10-mal mit 5 Heftzwecken gewürfelt und
dabei notiert, wie viele Heftzwecken in den beiden möglichen Lagen
und gefallen sind. In einer Tabelle wurde die relative Häufigkeit dafür aufgelistet, dass bei einem Wurf 1, 2, ... mal die Lage aufgetreten ist.
Die 1. Zeile enthält lediglich eine Zählvariable für den Index. Die 2. Zeile enthält die Zahl der schräg liegenden Heftzwecken. Die 3. Zeile enthält die relativen Häufigkeiten für das Schrägliegen. Die 4. Zeile enthält die kumulierte Häufigkeit für das Schrägliegen.
Mit
Hilfe der folgenden Aufgabe haben wir gelernt, was ein Erwartungswert
ist und wie man den Erwartungswert mit dem Taschenrechner berechnet.
Aufgabe:
Ein Getränkevertrieb verkauft verschiedene Mineralwasser zu
folgenden Preisen: Produkt 1 zu 0,99€, Produkt 2 zu 1,49€,
Produkt 3 zu 0,49€ und Produkt 4 zu 4,79€. Im Einkauf kosten die Produkte der Reihe nach 0,60€, 0,50€, 0,45€ und 0,20€. Die einzelnen Produkte werden der Reihe nach zu 60%, 10%, 25% und 5% gekauft. Mit welchem Gewinn kann der Inhaber des Getränkevertriebs im Mittel rechnen?
Vorgehen bei der Lösung: Als Zufallsgröße X wählen wir: X=Gewinn pro Flasche Die Variable k gibt an, welchen Wert X annimmt. p(X=k)
gibt die Wahrscheinlichkeit an, dass eine Flasche, die den Gewinn k
ergibt, gekauft wird und ist identisch mit den oben genannten
Prozentangaben. k·p(X=k) gibt den Anteil an, den eine Flasche zum Gesamtgewinn beisteuert. Summiert
man für alle k die Produkte k·p(X=k), so erhält man
den durchschnittlich bei jeder Flasche erzielten Gewinn. Diesen Wert nennt man Erwartungswert der Zufallsgröße X.
Beim Taschenrechner nutzt man Listen, um den Erwartungswert schnell bestimmen zu können:
In L1 stehen die Kosten für eine Flasche Wasser. Die Produkte sind durchgehend von oben nach unten angeordnet. In L2 stehen die Verkaufspreise für eine Flasche Wasser. In L3 steht der Gewinn k pro Flasche. Formel: L3=L2-L1 In L4 stehen die Wahrscheinlichkeiten p(X=k), mit denen eine Flasche eines Produkts verkauft werden. In L5 steht das Produkt k·p(X=k). Formel: L5=L3*L4 Im
normalen Arbeitsbereich wird mit 2nd > LIST > MATH > SUM die
Summe der Produkte k·p(X=k) gebildet. Formel: SUM(L5). Es ergibt sich der Erwartungswert 0,5825, d.h. man kann pro Flasche mit einem Gewinn von etwa 58 Cent rechnen.
Um
ein Maß dafür zu erhalten, wie im alltäglichen Leben
der Gewinn ausfallen wird, d. h. ob es immer Gewinne in der Nähe
von 58 Cent oder erheblich unterschiedliche Gewinne geben wird, haben
wir zunächst einmal die Differenz zwischen den Gewinnen und dem
berechneten Erwartungswert in Liste L6 berechnet. Näheres dazu in der nächsten Stunde.
2009-03-20
Fortsetzung des Gedankengangs aus der letzten Stunde: Will man wissen, wie stark die Gewinne für die einzelnen Flaschensorten vom Erwartungswert E(X) = Σ(k·p(X=k))
abweichen, muss man die Werte in L6 noch mit den Wahrscheinlichkeiten
aus L4 wichten (d.h. multiplizieren), weil ja einige Flaschensorten
besser als andere verkauft werden. Alternativ könnte man 60-mal
den Wert der 1. Flaschensorte, 10-mal den der 2. Flaschensorte, 25-mal
den der 3. Flaschensorte und 5-mal den der 4. Flaschensorte
aufschreiben und davon den Mittelwert bilden. So rechnen wir aber den Mittelwert aus durch -0,1925*0,6 + 0,4075*0,1 + (-0,5425)*0,25 + 4,2075*0,05 aus. Es
ergibt sich 0. Warum? Weil der Erwartungswert als Mittelwert des
Gewinns natürlich gerade so gewählt ist, dass sich
Abweichungen nach oben und unten ausgleichen!
Zur Bestimmung des Maßes für die Abweichung müssen wir uns also etwas anderes ausdenken. Es wäre möglich, alle Abweichungen positiv zu nehmen, also den Betrag der Abweichungen zu verwenden. Oft ist es aber sinnvoll, größere Abweichungen stärker zu berücksichtigen als kleine Abweichungen. Deshalb wählt man die Methode der quadratischen Abweichung: es wird (k-E(X))2
berechnet. Erstens ergeben sich durch das Quadrat bei
größeren Abweichungen sehr viel größere Werte,
zweitens sind alle Werte positiv. Wichtet man dann diese Werte noch mit
der jeweiligen Wahrscheinlichkeit p(X=k), so ergibt sich (k-E(X))2·p(X=k) und als Summe dieser Werte die Größe V(X) = Σ(k-E(X))2·p(X=k) . V(X) nennt man Varianz.
Die
Varianz ist ein Maß für die quadratische Abweichung von
einem Erwartungswert. Rechne ich mit Euro-Werten, hat die Varianz die
wenig aussagekräftige Einheit Euro2. Um eine lineare
Abweichung zu erhalten (z.B. in der Einheit Euro), berechnet man die
Wurzel aus der Varianz und nennt das Ergebnis Standardabweichung σ(X) = √V(X)
Was sagt uns nun aber der Wert der Standardabweichung? Im weiteren Verlauf des Unterrichts werden wir sehen:
In etwa 2/3 aller Zufallsversuche liegt das Ergebnis im Intervall [ E(X) - 1·σ , E(X) + 1·σ ]
In etwa 95% aller Zufallsversuche liegt das Ergebnis im Intervall [ E(X) - 2·σ , E(X) + 2·σ ]
In etwa 99% aller Zufallsversuche liegt das Ergebnis im Intervall [ E(X) - 3·σ , E(X) + 3·σ ]
Die entsprechenden Rechnungen für unsere Aufgabe aus der letzten Stunde:
L7: (k-E(X))·p(X=k) Die Summe aller Elemente von L7 ergibt 0 . L8: (k-E(X))2 L9: (k-E(X))2·p(X=k)
Die Summe aller Werte von L9 ergibt V(X) = 0,99756875. Die Wurzel
daraus ergibt σ(X) = √V(X) = 0,9987836352 ≈ 1 Man
sieht, dass die Standardabweichung gegenüber dem Erwartungswert
von 0,85 Euro sehr groß ausfällt. Grund ist hier der
"Ausreißer-Preis" von 4,79€ für die teuerste
Flaschensorte.
Soll
beim Taschenrechner in einer Liste die Formel bestehen und editierbar
bleiben, so muss die Formel in Anführungsstriche " und "
eingeschlossen werden. Beim Ändern eines Wertes werden die so geschriebenen Formel-Werte aktualisiert.
2009-03-25
Bernoulli-Versuche Ein
Zufallsversuch, bei dem mit Zurücklegen mehrfach gezogen wird und
bei dem es nur zwei verschiedene Ausgänge mit den
Wahrscheinlichkeiten p und q=1-p gibt, nennt man Bernoulli-Versuch.
Beispiel: Ein
Hersteller legt jedem 5. Exemplar eines Produktes ein kleines Geschenk
bei. Wie groß ist die Wahrscheinlichkeit, beim Kauf von 10
Exemplaren 3 Geschenke zu finden?
Für jedes Exemplar besteht die Wahrscheinlichkeit 1/5 dafür, dass ein Geschenk beigelegt ist.
Es gibt nur die Versuchsausgänge "Geschenk" und "kein Geschenk" mit den Wahrscheinlichkeiten p = 1/5 und q = 1 - p = 4/5.
Der Versuch wird n=10 mal wiederholt.
Die Voraussetzungen für einen Bernoulli-Versuch sind gegeben.
Der
Fall "die ersten 3 Exemplare enthalten das Geschenk, die letzten 7
Exemplare sind ohne Geschenk" hat die Wahrscheinlichkeit
Dieser
Fall ist aber nur 1 Fall von sehr vielen anderen Fällen, bei denen
auch 3 Geschenke in den Waren gefunden werden. Das Geschenk kann z. B.
in dem 4., dem 7. und dem 9.Exemplar zu finden sein.
Die Anzahl
der Möglichkeiten, das Geschenk in bestimmten Exemplaren zu
finden, ist gleich der Anzahl der Möglichkeiten, 3 Kugeln aus 10
Kugeln mit einem Griff zu ziehen. Es sind Möglichkeiten.
Die Wahrscheinlichkeit, in beliebigen 3 der 10 Exemplare ein Geschenk zu finden, beträgt also
Wie groß ist die Wahrscheinlichkeit, in 20 Exemplaren 6 Geschenke zu finden? Sie vermuteten, dass die Wahrscheinlichkeit so groß wie bei 3 Geschenken in 10 Exemplaren sein müsste. Die Rechnung ergibt aber: . Der
Grund liegt darin, dass sich in diesem Fall die
Gesamtwahrscheinlichkeit von 1 auf doppelt so viel Ausgänge
aufteilen muss. Damit ist jeder einzelne Ausgang weniger wahrscheinlich. Fasst
man hier jeweils 2 Ausgänge zusammen, so kommt man
näherungsweise zum gleichen Ergebnis wie bei 3 Geschenken in 10
Exemplaren.
Übliche Schreibweise für Bernoulli-Versuche bei k Erfolgen in n Versuchen:
es
genau 2 Versuchsausgänge gibt (häufig als Erfolg und
Misserfolg bezeichnet) mit den Wahrscheinlichkeiten p und q=1-p,
auch bei mehrstufigen Versuchen die Wahrscheinlichkeiten gleich bleiben (Ziehen mit Zurücklegen).
Bei einem n-stufigen Bernoulli-Versuch berechnet sich die Wahrscheinlichkeit für k-maligen Erfolg aus Da
die Summe aller Wahrscheinlichkeiten für k=0 bis k=n gleich 1 ist,
erfüllt die angegebene Formel die Bedingungen für eine
Wahrscheinlichkeitsverteilung. Man nennt diese Verteilung
Binomialverteilung.
Berechnung von Bn;p(k) auf dem Taschenrechner: Beispiel: Wie groß ist die Wahrscheinlichkeit, beim 10-maligen Würfeln genau 4-mal eine 6 zu werfen? 2ND > DISTR --> für n=10, p=1/6 und k=4
Wie groß ist die Wahrscheinlichkeit, beim 10-maligen Würfeln höchstens 4-mal eine 6 zu werfen? Gesucht ist also P(X<=4) = B10;1/6(0) + B10;1/6(1) + B10;1/6(2) + B10;1/6(3) + B10;1/6(4) Auf dem Taschenrechner wird die Funktion binomcdf benutzt: 2ND > DISTR -->
Wie groß ist die Wahrscheinlichkeit, beim 10-maligen Würfeln mindestens 4-mal eine 6 zu werfen? Gesucht ist also P(X>=4) = 1 - P(X<=3) = 1 - B10;1/6(0) + B10;1/6(1) + B10;1/6(2) + B10;1/6(3) Auf dem Taschenrechner wird die Funktion binomcdf benutzt:
Die
gesamte Wahrscheinlichkeitsverteilung (Wahrscheinlichkeiten für alle
k-Werte) für die Beispiele kann man sich graphisch darstellen lassen: In
Liste L1 wird seq(X,X,0,10,1) eingegeben (nach dem Schema seq(<zu
berechnender
Term>,<Variable>,<Anfangswert>,<Endwert>,<Schrittweite>). In Liste L2 wird binompdf(10,1/6,L1) eingegeben. STAT > EDIT
2ND > STAT PLOT
WINDOW GRAPH
Auf gleiche Art kann man auch die Summenfunktion binomcdf(10,1/6,L1) darstellen lassen:
2009-04-27
Nachlese zur Studienfahrt in die Toskana
Im Artikel Goldener Schnitt
finden Sie das im Unterricht Besprochene und weiter unten neben vielem
Anderen auch den Vitruvianischen Menschen, eine Analyse zum Bild Mona
Lisa und Anmerkungen zum Auftreten des Goldenen Schnitts in der Natur.
Erwartungswert bei binomialverteilten Zufallsgrößen Wir
haben für n=1, n=2 und n=3 den Erwartungswert allgemein für
die Erfolgswahrscheinlichkeit p und die Misserfolgswahrscheinlichkeit q
ausgerechnet:
Es fiel auf, dass die Werte in der Spalte P(X=k) gebildet werden aus (q+p)1, (q+p)2, (q+p)3 Dass das so sein muss, kann man gut eisehen, wenn man die Ausgänge eines entsprechenden Baumdiagramms betrachtet.
Es sieht so aus, als würde bei einem n-stufigen Bernoulli-Versuch gelten: E(X) = n·p Dass das tatsächlich so ist, zeigt der Beweis im Buch auf Seite 124. Bitte jeden Schritt nachvollziehen!
2009-05-06
Das
Ergebnis für den Erwartungswert E(X)=n·p bei der
Binomialverteilung kann man z.B. bei folgenden Fragestellungen anwenden:
Mit wie vielen Sechsen kann man beim Würfeln rechnen, wenn man 300-mal würfelt? Antwort: n=300, p=1/6 --> n·p=300·1/6=50 Man wird also etwa 50-mal eine 6 würfeln.
Wie lange muss man würfeln, bis man im Schnitt eine Sechs würfelt? Antwort: 1 Sechs bedeutet, dass der Erwartungswert 1 beträgt: n·p=1 --> n·1/6=1 --> n=6 Allgemein gilt: n·p=1 --> n=1/p
Aufgabe zum Auslastungsmodell (als Hausaufgabe): Den
15 Schüler(inne)n im Kurs sollen für das Abitur
Taschenrechner zur Verfügung gestellt werden. Aus Erfahrung
weiß man, dass jeder Schüler während einer Stunde etwa
20 Minuten den Taschenrechner benutzen muss. Die Schulleitung
schätzt deshalb (warum wohl?), dass 5 Taschenrechner für den
Kurs ausreichend sind. Mit welcher Wahrscheinlichkeit reichen die 5
Taschenrechner aus? Anders formuliert: Wie groß ist die
Wahrscheinlichkeit, dass nicht mehr als 5 Schüler(innen) den
Taschenrechner zur selben Zeit benötigen? (Kurzform: P(X<=5))
2009-05-08
Lösung zur Hausaufgabe: Man darf zur Lösung die Binomialverteilung heranziehen, denn
es gibt beim Testen, ob ein Schüler den Taschenrechner benutzt oder nicht, 2 Ausgänge und
beim Testen mehrerer Schüler bleibt diese Wahrscheinlichkeit konstant.
Es gilt n=15 und p=20/60=1/3.
Wahrscheinlich
überlegte sich die Schulleitung, dass 5 Rechner ausreichen
würden, weil der Erwartungswert E(X)=n·p=15·1/3=5
ist.
Zur Frage, ob 5 Taschenrechner ausreichen, muss man die Wahrscheinlichkeit B15;1/3(X<=5) berechnen. Der Taschenrechner liefert
Erscheint die Wahrscheinlichkeit von ca. 62% zu gering, muss man mehr Taschenrechner anschaffen. Eine erweiterte Tabelle im Taschenrechner für weitere k-Werte liefert für die Summenfunktion der Binomialverteilung Man liest ab:
Damit in 90% aller Fälle die Taschenrechner ausreichen, muss man 7 Taschenrechner anschaffen.
Damit in 95% aller Fälle die Taschenrechner ausreichen, muss man 8 Taschenrechner anschaffen.
Damit in 99% aller Fälle die Taschenrechner ausreichen, muss man 9 Taschenrechner anschaffen.
Wir haben gesehen, wie man mit den Tabellen aus der Formelsammlung die Wahrscheinlichkeiten berechnen kann. Dabei
kam es zu Irritationen, warum das Vorgehen für p-Werte
größer als 0,5 funktioniert (man nehme den Tabellenwert, der
sich aus der unteren und der rechten Markierung ergibt und subtrahiere
ihn von 1). Hier die Begründung für einen n-stufigen Bernoulliversuch mit der Erfolgswahrscheinlichkeit p>0,5:
Sei X die Zufallsvariable für die Wahrscheinlichkeit p und Y die Zufallsvariable für die Wahrscheinlichkeit q=1-p.
Dann gilt P(X=0) = P(Y=n), denn wenn man 0-mal Erfolg hat, dann hat man n-mal Misserfolg. Entsprechend gilt P(X=1) = P(Y=n-1) und P(X=2) = P(Y=n-2) und P(X=3) = P(Y=n-3) und allgemein P(X=k) = P(Y=n-k)
Benötigen z.B. die 15 Schüler jeweils 40 Minuten pro Stunde den Rechner, so gilt n=15 und p=2/3. Die Wahrscheinlichkeit, dass 5 Rechner ausreichen, beträgt also P(X<=5). Wir müssen also in der Summen-Tabelle für n=15 in der Spalte für p=2/3 bei k=5 nachschauen. Da
es diese Spalte nicht gibt, können wir wegen der oben gezeigten
Herleitung P(X<=k) = 1 - P(Y<=n-k-1) nach Einsetzen der
Werte zu P(X<=5) = 1 - P(Y<=15-5-1) = 1 - P(Y<=9) auch
nachschauen in der Summentabelle für n=15 in der Spalte für
p=1/3 bei 9 und erhalten den Wert 0,9915. Es gilt dann P(X<=5) = 1 - 0,9915 = 0,0085 Der Taschenrechner bestätigt mit binomcdf(15,2/3,L1) in L2 dieses Ergebnis: .
Folgerung: In den Tabellen müssen sich die Spaltenbeschriftungen oben und unten zu 1 ergänzen und die Zahlen in der rechten Spalte müssen sich aus den Zahlen k aus der linken Spalte ergeben zu n-k-1. Prüfen Sie das in den Tabellen nach!
2009-05-11
Das
Kugel-Fächer-Modell kann immer dann angewendet werden, wenn ein
Zufallsversuch auf folgende Bedingungen reduziert werden kann:
Es stehen f Fächer zur Verfügung, die mit n Kugeln gefüllt werden sollen.
Die Wahrscheinlichkeit, eine Kugel in ein bestimmtes Fach zu legen, ist immer konstant gleich p=1/f.
Da
es nur 2 Versuchsausgänge gibt (Fach wird durch die Kugel
gefüllt oder nicht gefüllt) und da die Wahrscheinlichkeit
für das Füllen konstant ist (p=1/f), darf mit der
Binomialverteilung gerechnet werden.
Die Wahrscheinlichkeit, dass genau k Kugeln in einem Fach liegen, beträgt .
Als
Beispiel einige Rechnungen mit dem Rosinenbrötchenproblem (Ein
Bäcker backt f Brötchen und verteilt in diese n Rosinen) Sei f=100 und n=500 Zur Lösung den Bereich zwischen den Zeichen < und > markieren. Die Lösung wird dann sichtbar.
Wie
groß ist die Wahrscheinlichkeit, dass beim Verteilen der 1.
Rosine das 1. Brötchen eine Rosine erhält? <p = 1/f = 1/100>
Mit wieviel Rosinen pro Brötchen kann man im Schnitt rechnen? <E(X) = n·p = n·1/f = 500·1/100 = 500/100 = 5>
Wie groß ist die Wahrscheinlichkeit, dass ein Brötchen 0 Rosinen erhält? <P(X=k) = Bn,1/f(k) = Bn,1/100(0) =1·(1/100)0·(99/100)500-0 = 0,00657 = 0,657%>
Weitere Aufgaben im Buch auf den Seiten 135-136. Seite 135, Aufgabe 2 als Hausaufgabe
2009-05-13
Besprechung der Hausaufgabe: Wie
groß ist die Wahrscheinlichkeit, dass beim Roulettespiel (37
Felder, bezeichnet von 0 bis 36) in n Runden die Kugel nie auf dem Feld
mit der Bezeichnung 0 liegen bleibt? Lösung (Bereich zwischen < und > markieren): <Im Kugel-Fächer-Modell sind die n Kugeln die Anzahl der Runden und die f Fächer die 37 Felder.> <Die Wahrscheinlichkeit, dass 1 Kugel nicht auf dem Feld 0 liegen bleibt, ist 36/37.> <Die Wahrscheinlichkeit, dass alle n Kugeln nicht auf dem Feld 0 liegen bleiben, beträgt (36/37)n.> Nach
n Runden gibt es 10 von den 37 Feldern, auf denen die Spielkugel noch
nicht liegen geblieben ist. Wieviel Runden sind etwa gespielt worden? <Da für jedes Feld die Wahrscheinlichkeit, dass die Kugel dort nicht liegen bleibt (36/37)n beträgt (s.o.), gibt es etwa 37·(36/37)n Felder, die immer frei geblieben sind.> <Da 10 Felder frei geblieben sind, gilt 37·(36/37)n=10 ---> (36/37)n=10/37 ---> n=log36/37 10/37=47,75> <Es wurden also etwa 48 Spiele durchgeführt.>
2009-05-15
An
Hand der Diagramme zweier Binomialverteilungen wurde uns klar, dass die
Darstellungen sehr ähnlich aussehen, wenn der Erwartungswert der
beiden Verteilungen übereinstimmt. Allerdings ist die
Einhüllende für größeres n etwas breiter und nicht
ganz so hoch. (OOo-Calc-Tabellenkalkulation herunterladen mit Klick auf
das Bild und "Speichern unter...").
Ein
Maß für die Abweichung vom Erwartungswert ist die Varianz
bzw. die Standardabweichung (=Wurzel aus der Varianz), wie wir schon
früher gesehen haben.
Die Binomialverteilung ist nicht
zuletzt deswegen bei Anwendungen so beliebt, weil dabei Erwartungswert
und Varianz bzw. Standardabweichung sehr einfach zu berechnen sind. Für den Erwartungswert gilt E(X)=n·p, wie wir schon gesehen haben.
Heute
haben wir für kleine n per Hand die Varianz ausgerechnet (siehe
Buch Seite 144) und haben auf Grund der Ergebnisse vermutet, dass
für die Varianz V(X) und die Standardabweichung σ(X) gilt: V(X)=n·p·q
und damit σ(X)=√(n·p·q) .(Auf einen
allgemeinen Beweis haben wir verzichtet. Siehe zum Beweis Seite 145
Aufgabe 5).
Da sich die Formeln für E(X), V(X) und σ(X)
sehr einfach aus den Größen n, p und q ergeben, kann man aus
einigen dieser Größen leicht auf andere Größen
schließen. Beispiel: Wenn E(X)=36 und σ(X)=3, so gilt
n·p=36 und n·p·q=9 ---> 36·q=9 --->
q=1/4 ---> p=3/4 ---> n=36/p=36·4/3=48
2009-05-18
Besprechung der Hausaufgabe (Seite 145 Aufgabe 7)
a) siehe Beispiel zur letzten Stunde
b) Gegeben n=72; σ=2. Gesucht p. σ2=n·p·q ---> 4=72·p·(1-p) ---> 4/72=p-p2 ---> p2-p+1/18=0 ---> p1,2=1/2+-√(1/4-1/18)=1/2+-√(7/36) , also 2 verschiedene Werte für p - wegen der Symmetrie mit q (p1+p2=1).
Wir haben schon
erkannt, dass der Erwartungswert bei der Binomialverteilung den
k-Wert angibt, an dem die größte Wahrscheinlichkeit
auftritt (Maximum bei der Einhüllenden). Um zu sehen, was nun
"Standardabweichung" bedeutet, haben wir für verschiedene n und
p=0,5 in der Summierten-Binomialverteilungs-Tabelle die
Wahrscheinlichkeit für den k-Bereich berechnet, für den gilt:
μ-σ<=k<=μ+σ. Die Werte, die Ihr in Gruppen gefunden habt, müssen wir noch einmal überdenken. DieTabellenkalkulation
zeigt teilweise andere Ergebnisse (herunterladen der OOo-Calc-Tabelle
mit Rechts-Klick auf das Bild und "Ziel speichern unter..."): Der Abstand der n-Werte kann in H1 eingestellt werden, die Wahrscheinlichkeit p in F1
2009-05-20
Trägt
man in der oben stehenden Tabelle die Spalten A und D gegeneinander
auf, so sieht man, dass die Werte in D für große n gegen
einen bestimmten Wert konvergieren (etwas kleiner als 0,7) Diese
Gesetzmäßigkeit ("Jedem Radius der Umgebung des
Erwartungswertes kommt eine bestimmte Wahrscheinlichkeit zu") gilt
nahezu unabhängig von der Erfolgswahrscheinlichkeit p und dem
Stichprobenumfang n bei einem Bernoulli-Versuch, wenn die
Laplace-Bedingung σ>3 erfüllt ist.
Arbeitet
man mit den Tabellen für summierte binomiale
Wahrscheinlichkeiten oder mit binomcdf auf dem Taschenrechner, so kann
man die Wahrscheinlichkeit P(k1<=X<=k2) nicht unmittelbar ablesen, sondern muss zunächst umformen:
Sind k1 und k2 ganze Zahlen so gilt: P(k1<=X<=k2) = P(X<=k2) - P(X<k1) = P(X<=k2) - P(X<=k1-1) Beispiel mit k1=27 und k2=42: P(27<=X<=42) = P(X<=42) - P(X<=27-1) = P(X<=42) - P(X<=26) Da die Wahrscheinlichkeit für k1
mit zur gesuchten Wahrscheinlichkeit gehört, darf sie nicht mit
der ganz rechts stehenden Summe abgezogen werden. Also muss dort k1-1 stehen.
Sind k1 und k2 keine ganzen Zahlen, so trennen diese Werte jeweils zwei ganze Zahlen.
Man schreibt dann P(k1<=X<=k2) = P(X<=k2) - P(X<=k1), wobei die rechte Seite dann identisch ist zu P(X<k2) - P(X<k1). Beispiel mit k1=27,7 und k2=42,3: P(27,7<=X<=42,3) = P(X<=42,3) - P(X<=27,7) = P(X<42,3) - P(X<27,7) = P(X<=42) - P(X<=27)
Wir
haben noch kurz mit dem Thema "Normalisierung von
Biniomialverteilungen" begonnen und dabei gesehen, dass man jede
Funktionsgleichung sehr einfach so ändern kann, dass der Punkt des
Graphen, der normalerweise bei x=0 liegt, dann bei x=x0 liegt. Dazu muss man nur jedes x durch x-x0 ersetzen. Beispiel: Ersetzt man im Graph der Normalparabel y=x2 das x durch x-4, so ergibt sich die Gleichung y=(x-4)2=x2-8x+16, deren Graph eine Parabel mit dem Scheitelpunkt bei x=4 ist.
2009-05-27
Normalisierung von Binomialverteilungen: Der Graph einer Binomialverteilung wird folgendermaßen geändert:
Die Lage des Erwartungswertes wird auf 0 gesetzt, indem man statt der k-Werte k-μ abträgt.
Die
Lage der Werte für μ+σ und μ-σ wird auf +1 und
-1 gesetzt, indem man statt der k-μ-Werte (k-μ)/σ
abträgt.
Der Funktionswert für die Wahrscheinlichkeit
beim Erwartungswert soll für alle Binomialverteilungen gleich
groß sein. Da die Wahrscheinlichkeit mit σ abnimmt, muss P(X=k) mit σ multipliziert werden.
Die
sich aus diesen Vorgängen ergebende Funktion nennt man φ(z)
mit z=(k-μ)/σ und es gilt σ·P(X=k)=φ(z) Man kann also P(X=k) näherungsweise berechnen aus P(X=k)=1/σ·φ((k-μ)/σ).
Die
Werte von φ(z) erhält man aus Tabellen oder vom Taschenrechner
oder berechnet man aus φ(z)=1/√(2·π)·e-(z·z)/2 .
Hausaufgabe: Seite 152 Aufgabe 6
2009-05-29
Besprechung der Hausaufgabe
2009-06-03
Wegen
der leichten Berechenbarkeit benutzt man häufig die
Binomialverteilung, auch wenn die Bedingungen (konstante
Wahrscheinlichkeit für Erfolg, Ziehen mit Zurücklegen) nur
näherungsweise erfüllt sind.
Die hypergeometrische Verteilung
berücksichtigt die sich ändernde Wahrscheinlichkeit bei
Stichprobenentnahmen. Hier wird ein Ziehen ohne Zurücklegen zu
Grunde gelegt. Man benutzt die hypergeometrische Verteilung
bevorzugt bei Problemen, bei denen es darauf ankommt, wie viele
Elemente einer Stichprobe eines von zwei Merkmalen aufweisen und bei
denen es darauf ankommt, den Fall "Ziehen ohne Zurücklegen" zu
beachten.
2009-06-05
Aufgaben zur hypergeometrischen Verteilung und Theorie zur Poisson-Verteilung.
2009-06-08
Einführung in die beurteilende Statistik Schluss von der Gesamtheit auf die Stichprobe, Schluss von der Stichprobe auf die Gesamtheit, Punkt- und Intervallschätzung
2009-06-10
Besprechung der Hausaufgabe. Punkt- und Intervallschätzung, Vertrauensintervalle.
2009-06-12
Bestimmung des Vertrauensintervalls (oder auch Konfidenzintervalls) für eine unbekannte Wahrscheinlichkeit Kennt
man die Wahrscheinlichkeit für einem Zufallsversuch nicht und
möchte man mit einer bestimmten Sicherheit γ (Vertrauenszahl
γ) einen Bereich angeben, in dem diese Wahrscheinlichkeit liegen
wird, so führt man einen Zufalls-Versuch mit dem Stichprobenumfang
n durch und erhält eine bestimmte relative Häufigkeit h.
Aus der Ungleichung erhält man die beiden Lösungen für die p-Werte an den Rändern des Intervalls. Das c erhält man aus der Gleichung . Der Taschenrechner hilt dabei mit der Funktion INVNORM im Menü DISTR: hier am Beispiel γ=0,95.
Die Ungleichung kann man mit dem Taschenrechnerbefehl SOLVER im Menü MATH bestimmen: hier am Beispiel n=100, h=7/100 Näherungswert 0 gibt die 1. Lösung p1=0,0343 Näherungswert 1 gibt die 2. Lösung p2=0,1375
d.h.
wenn wir die relative Häufigkeit 7/100 in einem Zufallsversuch
gefunden haben, können wir mit 95% Sicherheit davon ausgehen, dass
die Wahrscheinlichkeit bei diesem Zufallsversuch zwischen p1=0,0343 und p2=0,1375 liegt.
Zusatz (noch nicht behandelt): Oben wurde auf Grund einer Stichprobe vom Umfang n für ein Vertrauensintervall (Vertrauenszahl
γ) die Grenzen dieses Intervalls (p1 und p2) berechnet. d = p2 - p1 ist dann die Länge dieses Vertrauensintervalls. Nun
soll diese Länge d bekannt sein und gesucht ist das n, d.h. man
fragt sich, wie oft man den Zufallsversuch durchführen muss, damit
die Länge des Vertrauensintervalls die Länge d nicht
überschreitet. Aus folgt näherungsweise . Die
Mindestgröße von n ist gefragt, d.h. wir müssen
annehmen, dass das l größtmöglich ist. Das ist der
Fall, wenn p=1/2 ist, da dann das Produkt p·(1-p) den
größten Wert annimmt (das kann leicht gezeigt werden, indem
man untersucht, wo die Funktion mit der Gleichung y=x·(1-x)=x-x2 ein globales Maximum besitzt). Setzen wir für p den Wert 1/2 ein, so gilt Da dieser Wert höchstens gleich d sein soll, gilt . Das c erhält man wie oben gezeigt durch . Führt
man den Versuch n mal (mit dem so berechneten n) durch, so kann man
davon ausgehen, dass mit der Wahrscheinlichkeit γ der Abstand von
h und der wahre Wert von p nicht mehr als d/2 auseinander liegen.
2009-06-15
Abschlussübung zum Thema "Schluss von der Gesamtheit auf eine Stichprobe" (im Buch auf Seite 221 nachzulesen).