Chapter 2 Probability
Kapitel 2 behandlar grunderna i sannolikhetslära.
Inledning (Kap 2.1+2.2)
I inledningen motiverar man att sannolikhetslära ingår i en statistikkurs.
Mängdlära (Kap 2.3)
Avsnitt 2.3 går igenom de matematiska beteckningar som används inom mängdläran. Vill du ha en mer grundläggande genomgång av detta rekommenderas följande länk: [http://www.matteboken.se/lektioner/matte-5/mangdlara/begreppet-mangd]
När det gäller beteckningarna \(\cup\) för union (‘union’) och \(\cap\) för snitt (‘intersection’), kommer dessa att presenteras när de dyker upp nedan.
Sannolikhetslära (Kap 2.4-2.10)
Nu följer en genomgång av kapitel 2.4-2.10; sannolikhetslära:
Kursboken gör möjligen en mer strikt presentation av begreppen, men om du förstår den genomgång som presenteras här, så räcker det för den här kursen.
Sannolikhet
- Sannolikhet är ett kvantitativt mått på hur säkert det är att en händelse ska inträffa.
- Sannolikheten för en händelse är ett tal mellan 0 och 1.
(0 betyder: “kommer aldrig att hända”)
(1 betyder: “kommer säkert att hända”)
Definition av sannolikhet
Subjektiv definition:
Sannolikheter är personliga och mäter graden av tilltro/övertygelse. Vi kommer inte att använda denna definition av sannolikhet i denna kurs. Ett exempel är “Sannolikheten att Gud existerar”, vilket blir olika för olika personer.
Objektiv (frekventistisk) definition:
\(\mathrm{Sannolikhet\:för\:en\:händelse} =\) \(\mathrm{\frac{Antal\:gånger\:händelsen\:inträffar}{Totalt\:antal\:upprepningar\:av\:försöket}}\)
där det totala antalet upprepningar är oändligt.
(Alltså andelen gånger händelsen inträffar när vi upprepar försöket oändligt antal gånger.)
Det är den frekventistiska definitionen av sannolikhet som kommer att användas i den här kursen.
Slumpförsök
En förutsättning för den frekventistiska definitionen är att försöket som upprepas är ett slumpförsök;
Slumpförsök kallas ett försök som kan upprepas under samma förutsättningar varje gång.
Fler begrepp i samband med slumpförsök:
- (Ett) Utfall : Ett resultat av ett slumpförsök
- Utfallsrum : Mängden av alla möjliga utfall för ett slumpförsök. Betecknas vanligen S (engelska sample space)
Exempel 1 : Bestäm utfallsrummet för följande slumpförsök: Kasta ett mynt två gånger och notera dina resultat.
Lösning : Ett träd är en bra bild för att inse hur utfallsrummet ser ut.
Med hjälp av trädet kan vi inse att utfallsrummet (S) blir: \(S=\{\) (krona,krona),(krona,klave),(klave,krona),(klave,klave) \(\}\)
Ytterligare begrepp i samband med slumpförsök:
I den frekventistiska definitionen av sannolikhet ingår t.ex. även ordet händelse.
En händelse A definieras som en delmängd av S (utfallsrummet).
Exempel 2: Slumpförsöket är att kasta en sexsidig tärning.
2a) Bestäm S
2b) Bestäm händelsen A : “få udda resultat”
Lösning :
a) \(S=\{1,2,3,4,5,6\}\)
b) \(A=\{1,3,5\}\)
Notera att vi har \(A\subseteq S\)
(\(A\) är en delmängd av \(S\) )
Fler begrepp: Sammansatta händelser
\(\cup\) Union (‘union’)
\(\cap\) Snitt (‘intersection’)
Om du behöver repetera dessa, kolla t.ex. följande länk:
[http://www.matteguiden.se/matte-diskret/mangdlara/mangder/]
Gå där till avsnittet UNION OCH SNITT.
Tyvärr har symbolerna där försvunnit, så läs här:
\(D=\{2,4,5\}\)
\(E=\{3,5,6\}\)
\(D\cap E=\{6\}\)
\(D\cup E=\{2,3,4,5,6\}\)
Du kan också kolla på de första 90 sekunderna (1.30) i följande länk:
[https://www.youtube.com/watch?v=gBCZb-Uo7ig]
Komplementmängd
Beteckningen för komplementmängden (“alla andra utfall”) varierar mellan författare. I den här kursboken har man valt ett vågrätt streck ovanför mängden: \(\bar{A}\)
Andra beteckningar för komplement kan vara:
\(\sim A\), \(A’\), \(A^\mathsf{c}\)
Exempel 2c: Bestäm händelsen \(\bar{A}\) där A : “få udda resultat”
Lösning : 2c) \(\bar{A}=\{2,4,6\}\)
Övningar
Innan du går vidare, rekommenderas följande övningar på kapitel 2.3: Notera innebörden i DeMorgans lagar (övning 2.3).
(7ed): 2.3, 2.8
Fler begrepp om händelser:
Disjunkta händelser
Två händelser A,B sägs vara disjunkta om \(A\cap B = \emptyset\) (tom mängd)
Istället för disjunkta kan man säga ömsesidigt uteslutande.
En tom mängd representerar en omöjlig händelse, som aldrig kan inträffa.
Dvs Om två mängder är disjunkta, kan de inte inträffa samtidigt.
Parvis disjunkta händelser
Exempel 3: Avgör om följande uppsättning av händelser är parvis disjunkta:
\(A_1=\{1\}, \: A_2=\{2,5\}, \:\) \(A_3=\{3,4\}\)
Svar: Ja, eftersom varje par händelser \(A_i,A_j\) uppfyller \(A_i\cap A_j = \emptyset\)
Sannolikhets-begreppet
Dags att definiera sannolikhetsbegreppet:
Generella definitionen
(Definition 2.6 i kursboken)
Sannolikhet P är en funktion som till varje möjlig händelse A tilldelar ett tal P(A) så att följande axiom är uppfyllda:
- \(P(A)\geq 0\)
- \(P(S)=1\)
- Om \(A_1, A_2, A_3 …\) är parvis disjunkta händelser gäller att
\(\displaystyle P(A_1\cup A_2\cup A_3 …)=\) \(P(A_1) + P(A_2) +P(A_3) + …\)
De tre axiomen benämns Kolmogorovs axiom.
Exempel 4: Avgör om följande funktion P skulle kunna fungera som en sannolikhetsfunktion, enligt Kolmogorovs axiom:
För utfallsrummet \(S=\{1,2,3\}\) ; sannolikhetsfunktionen P som uppfyller följande:
\(P(\{1,2\})=0.6, \:\:\) \(P (\{2,3\})=0.6, \:\:\) \(P (\{2\})=0.3\)
Lösning: Om axiom 3 skulle vara uppfyllt skulle krävas både att \(P (\{1\})=0.3\) och att \(P (\{3\})=0.3\).
Men då skulle inte axiom 2 uppfyllas om vi tog unionen av \(\{1\}, \{2\} , \{3\}\).
Svar: Den ovan beskrivna funktionen P kan inte användas som sannolikhetsfunktion.
Satser som följer av den generella definitionen
-
För varje händelse \(A\subseteq S\) gäller \(P\left( \bar{A}\right) =1-P\left( A\right)\)
-
För tomma mängden \(\emptyset\) gäller \(P\left( \emptyset \right) =0\)
-
Om \(A\) och \(B\) är två händelser så att \(A\subseteq B\), så gäller \(P\left( A\right) \leq P\left( B\right)\)
-
För varje par av händelser \(A\) och \(B\) gäller \(\small P\left( A\cup B\right) =\) \(\small P\left( A\right) +P\left( B\right) -P\left( A\cap B\right)\), som brukar kallas additionssatsen. För disjunkta (ömsesidigt uteslutande) händelser gäller att \(\small P\left( A\cup B\right) =\) \(\small P\left( A\right) +P\left( B\right)\)
-
För varje händelse \(A\) gäller
\(P\left( A\right) \leq P\left( S\right) =1\)
Hur man beräknar sannolikheter
Ofta har vi ett enklare specialfall, så att vi inte behöver använda den generella definitionen (som inte är så enkel att använda). Specialfallet är att alla utfall har samma sannolikhet (likformig sannolikhetsfördelning). Då kan vi använda den klassiska sannolikhetsdefinitionen:
Den klassiska sannolikhetsdefinitionen
(specialfall av frekventistiska definitionen av sannolikhet):
P(A), sannolikheten för händelsen A beräknas såhär:
\(\displaystyle P(A)=\frac{n_A}{N}=\) \(\displaystyle \mathrm{\frac{antalet\:utfall\:i\:\textit{A}}{antalet\:utfall\:i\:\textit{S}}}\)
Vi ser att vi behöver kunna beräkna antalet utfall.
Att beräkna antalet utfall i S (utfallsrummet)
Multiplikationsprincipen
Exempel 5: Om du äger 2 par byxor och 3 skjortor, på hur många sätt kan du klä dig?
Lösning: Antalet utfall är \(2\cdot 3=6\)
Exempel 6a: Du har tillgång till bokstäverna A,B,C,D,E och ska göra koder bestående av tre bokstäver.
Möjliga koder är då AAA, AAB, o.s.v.
Se Exempel6a.pdf
Hur många utfall blir det?
Lösning 6a: Antalet utfall är \(5\cdot 5\cdot 5=125\)
Exempel 6b: Du har tillgång till bokstäverna A,B,C,D,E och ska göra koder bestående av tre bokstäver.
Men nu tänker vi oss att du bara har tillgång till en bokstav av varje sort.
Möjliga koder är då ABC, ABD, o.s.v.
Se Exempel6b.pdf
Hur många utfall blir det?
Lösning 6b: Antalet utfall är \(5\cdot 4\cdot 3=60\)
Exempel 7: Du har tillgång till bokstäverna A,B,C,D,E men du har bara tillgång till en bokstav av varje sort.
Den här gången ska du bara välja ut tre kombinationer av bokstäver; inte göra koder av dem.
Så om du t.ex. väljer bokstäverna A,B,D finns bara en kombination.
Hur många utfall blir det?
Lösning: Enklast är att utgå från de 60 utfallen i 6b.
I den listan finns då bland annat följande sex utfall: ABD, ADB, BAD, BDA, DAB, DBA.
På motsvarande sätt finns i 6b sex utfall för varje kombination av bokstäver.
Om antalet kombinationer i exempel 7 är x stycken, får vi då att \(x\cdot 6=60\)
Detta innebär att svaret i exempel 7 är 10 (x = 10).
Se Exempel7.pdf
Mer om kombinationer
I exempel 7 kan man beräkna svaret 10 på följande sätt:
\(\displaystyle x=\frac{5\cdot 4\cdot 3}{3\cdot 2\cdot 1}\)
Vanligen används en symbol för detta: \(\displaystyle \left( \begin{array}{c} 5 \\ 3 \end{array} \right)\)
I kursboken används även \(_5 C_3\)
\(\Big( \begin{array}{c} \small 5 \\ \small 3 \end{array} \Big)\) utläses “5 över 3”, på engelska “5 choose 3”.
På miniräknare kan det se ut t.ex. såhär: 5 nCr 3 eller 5C3.
Exempel 8: Antag att vi har en skolklass med 25 elever.
8a) Hur många utfall finns det för att välja ut 4 elever bland dessa, som ska hjälpa läraren att hämta böcker?
8b) Hur många utfall finns det för att välja ut en styrelse bestående av ordförande, sekreterare, kassör och informationsansvarig?
Lösning 8a: \(\displaystyle \left( \begin{array}{c} 25 \\ 4 \end{array} \right)=\frac{25\cdot 24\cdot 23\cdot 22 }{4\cdot 3\cdot 2\cdot 1}=12650\)
Lösning 8b: \(\displaystyle 25\cdot 24\cdot 23\cdot 22 = 303600\)
Kommentar till svaret i 8a: Vi säger att vi har 12650 kombinationer (när ordningen saknar betydelse). Vi har \(_{25} C_4=12650\)
Kommentar till svaret i 8b: Vi säger att vi har 303600 permutationer (när ordningen har betydelse). Vi har \(_{25}P_4=303600\)
Binomialkoefficienter
Beteckningen \(\displaystyle \left( \begin{array}{c} n \\ r \end{array} \right)\) kallas ofta binomialkoefficient, eftersom den förekommer i binomialutvecklingen
\(\displaystyle (x+y)^n= \left( \begin{array}{c} n \\ 0 \end{array} \right) x^n y^0\) \(+\left( \begin{array}{c} n \\ 1 \end{array} \right) x^{n-1} y^1\) \(+\left( \begin{array}{c} n \\ 2 \end{array} \right) x^{n-2} y^2+\) \(…+\left( \begin{array}{c} n \\ n \end{array} \right) x^0 y^n\)
Se även BinomialKoeff.pdf
Multinomialkoefficienter
På motsvarande sätt som resonemanget i lösningen till uppgift 7, kan man komma fram till antalet sätt att fördela n st objekt i k st grupper, där det i grupp 1 ska vara \(n_1\) objekt, i grupp 2 ska det vara \(n_2\) objekt, o.s.v.
Det antalet är \(\displaystyle \frac{n!}{n_1!n_2!\cdot\cdot\cdot n_k!}\)
Beteckningen för detta är \(\left( \begin{array}{c} n \\ n_1 \ n_2 \ \ …n_k \end{array} \right)\)
Resonemanget mer i detalj finns (i beviset av) sats 2.3 (kap 2.6 i kursboken).
Anmärkning
Binomialkoefficienten kan ses som ett specialfall av multinomialkoefficienten, där man bara har 2 grupper. T.ex. är antalet sätt att fördela 25 personer i två grupper där det ska vara 4 i ena gruppen och 21 i den andra, lika med 12650.
Betingade sannolikheter
\(P(A|B)\) betyder “Den betingade sannolikheten för att A inträffar, givet att B har inträffat”.
Situationen kan också beskrivas som att du har tillgång till extra information/ett villkor: B har inträffat.
\(P(A|B)\) kan betraktas som “\(P(A)\)” i en värld där utfallsrummet har reducerats till B.
Exempel 9: Slumpförsöket är att kasta en sexsidig tärning.
Händelsen A : “få udda resultat” ges av \(A=\{1,3,5\}\).
Händelsen B : “få högt resultat” ges av \(B=\{4,5,6\}\).
9a) Bestäm \(P(A)\) (Inget villkor; hela utfallsrummet är tillgängligt)
9b) Bestäm \(P(A|B)\) (Utfallsrummet har reducerats till B).
Lösning:
9a) Vi har \(S=\{1,2,3,4,5,6\}\) och använder den klassiska sannolikhetsdefinitionen:
Det ger \(\displaystyle P(A)=\frac{n_A}{N}=\mathrm{\frac{antalet\:utfall\:i\:\textit{A}}{antalet\:utfall\:i\:\textit{S}}}=\frac{3}{6}=0.50\)
9b) S har reducerats: \(S=\{\) 1,2,3,4,5,6\(\}\). Vi ska beräkna sannolikheten att få udda resultat i denna reducerade mängd (B).
Om vi vet att vi har en fyra,femma eller sexa, är sannolikheten att det är udda \(\frac{1}{3}\).
Alltså \(P(A|B)=\frac{1}{3}\approx 0.33\)
Användbara formler
\(P(A|B)\) från definitionen: \(P(A|B)=\frac{P(A\cap B)}{P(B)}\) (1)
Motsvarande formel: \(P(B|A)=\frac{P(B\cap A)}{P(A)}\) (2)
Från ovanstående formler kan vi få:
\(P(A\cap B)=P(B)\cdot P(A|B)\) ur (1)
och \(P(B\cap A)=P(A)\cdot P(B|A)\) ur (2)
Notera att \(P(A\cap B)=P(B\cap A)\).
Exempel 9b igen, med användning av formel (1): \(P(A|B)=\frac{P(A\cap B)}{P(B)}\)
För beräkning av detta behöver vi först \(P(A\cap B)\) och \(P(B)\):
Eftersom \(A\cap B=\{5\}\) får vi \(P(A\cap B)=\frac{1}{6}\)
Eftersom \(B=\{4,5,6\}\) får vi \(P(B)=\frac{3}{6}\)
Det ger \(\displaystyle P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{\frac{1}{6}}{\frac{3}{6}}=\frac{1}{3}\approx 0.33\)
Exempel 10
Bilden visar populationen i en liten by där man bl.a. odlar apelsiner.
Varje punkt är en individ; det bor alltså 25 personer i byn.
Betrakta nu följande slumpförsök: Välj ut en person från byn slumpmässigt.
Låt A vara händelsen att “personen tycker om apelsiner”.
Låt B vara händelsen att “personen är ett barn (ej fyllt 16 år)”.
Beräkna med hjälp av den bildmässiga beskrivningen av byn följande uppgifter:
10a): \(P(A)\)
10b): \(P(A|B)\)
Lösning :
10a): Totalt finns det 25 personer i byn. Av dessa är det 11 personer som tycker om apelsiner (de punkter som finns i “A-ringen”),
så svaret blir \(P(A)=\frac{11}{25}=0.44\).
10b): Nu är utfallsrummet reducerat till de 5 barnen (som finns i “B-ringen”). Av dessa är det 3 som tycker om apelsiner,
så svaret blir \(P(A|B)=\frac{3}{5}=0.60\).
Exempel 10, forts
Ett alternativ till att göra ett Venn-diagram som ovan, är att göra en korstabell enligt nedan.
Talen motsvarar då antalet individer i respektive område.
A |
\(\overline{A}\) |
||
B | 3 | 2 | 5 |
\(\overline{B}\) |
8 | 12 | 20 |
11 | 14 | 25 |
Ur tabellen kan man lätt läsa av de sannolikheter man önskar beräkna:
Alla sannolikheter som är utan villkor, dvs där utfallsrummet inte är begränsat, har 25 i nämnaren. (Det är de sannolikheter där det inte förekommer ett lodrätt streck | .)
För de sannolikheter som har begränsningar, används ett annat tal i nämnaren:
Om det står …|A blir det 11 i nämnaren.
Om det står …| \(\bar{A}\) blir det 14 i nämnaren.
Om det står …|B blir det 5 i nämnaren.
Om det står …| \(\bar{B}\) blir det 20 i nämnaren.
Exempel 11 Bestäm med hjälp av tabellen ovan:
11a): \(P(A)\)
11b): \(P(A|B)\)
11c): \(P(A\cap B)\)
11d): \(P(A\cap \bar{B})\)
11e): \(P(\bar{B} | A)\)
11f): \(P(\bar{B})\)
Lösning :
11a): \(P(A)=\frac{11}{25}=0.44\)
11b): \(P(A|B)=\frac{3}{5}=0.60\)
11c): \(P(A\cap B)=\frac{3}{25}=0.12\)
11d): \(P(A\cap \bar{B})=\frac{8}{25}=0.32\)
11e): \(P(\bar{B} | A)=\frac{8}{11}\approx 0.73\)
11f): \(P(\bar{B})=\frac{20}{25}=0.80\)
Multiplikationssatsen
(se även rubriken “Användbara formler” ovan)
\(P(A\cap B)=P(B)\cdot P(A|B)\) och \(P(B\cap A)=P(A)\cdot P(B|A)\)
Exempel 12: I en låda ligger 25 glödlampor, varav 5 är trasiga. (Dålig idé att lägga i de trasiga i samma låda, egentligen!) Plocka upp två lampor ur lådan på måfå. Vad är sannolikheten att båda är trasiga?
Lösning: Låt A vara händelsen att “första lampan man tar upp är trasig”.
Låt B vara händelsen att “andra lampan man tar upp är trasig”.
Vi söker alltså \(P(A\cap B)\).
Det är inte så lätt att tänka ut vad \(P(A\cap B)\) blir direkt.
Här går det lättare att använda \(P(A\cap B)=P(B)\cdot P(A|B)\) eller \(P(A\cap B)=P(A)\cdot P(B|A)\).
Vilken variant ska vi använda?
Tips: Eftersom det är lättare att börja med att beräkna \(P(A)\), använder vi den högra varianten av formeln.
När vi tar den första lampan, finns det 25 lampor kvar, varav 5 är trasiga.
Då blir \(P(A)=\frac{5}{25}=\frac{1}{5}\).
Sedan kan vi beräkna \(P(B|A)\) med hjälp av följande resonemang:
Om händelsen A har inträffat, så har vi 24 lampor kvar, varav 4 är trasiga.
Så sannolikheten att den andra lampan är trasig givet att den första var det blir:
\(P(B|A)=\frac{4}{24}=\frac{1}{6}\).
Vi får alltså att \(P(A\cap B)=P(A)\cdot P(B|A)=\frac{1}{5}\cdot \frac{1}{6}= \frac{1}{30}\approx 0.033\)
“ÖVNINGSEXEMPEL”
Fem bollar, varav 3 röda och 2 gröna ska placeras i fem fack:
| | | | | |
På hur många olika sätt kan resultat se ut, dvs hur många olika sätt finns det att välja positioner för de två färgerna?
(Vi tänker oss att de tre röda bollarna är likadana, och att även de två gröna bollarna är likadana.)
Lösning: Antag att det finns x st olika utfall för hur resultatet kan se ut. (x är alltså svaret på den här uppgiften)
Ett sätt för att hitta lösningen till vad x är att tänka “via en omväg”. Vi tänker oss därför att alla fem bollarna är olika; vi kan kalla dem \(R_1,R_2,R_3,G_1,G_2\).
Om alla fem bollarna är olika, kan vi tänka oss antalet möjliga utfall på två olika sätt:
-
Välj boll till fack 1, välj därefter boll till fack 2, o.s.v. Antalet möjliga utfall om alla bollar vore olika blir då \(5\cdot4\cdot3\cdot2\cdot1\)
- Välj först positionerna för färgerna och placera därefter ut bollarna:
- Steg 1: Välj positionerna för färgerna röd och grön, Det går på x sätt.
- Steg 2: Välj hur du placerar dina tre röda bollar i de tre utvalda positionerna. Det går på \(3\cdot2\cdot1\) sätt.
-
Steg 3: Välj hur du placerar dina två gröna bollar i de två utvalda positionerna. Det går på \(2\cdot1\) sätt.
-
Sammanfattning av sätt 2: Antalet möjliga utfall om alla bollar vore olika blir då \(x\cdot3\cdot2\cdot1\cdot2\cdot1\)
Nu måste förstås de två olika sätten ge samma svar; dvs \(x\cdot3\cdot2\cdot1\cdot2\cdot1= 5\cdot4\cdot3\cdot2\cdot1\),
vilket ger: \(x=\frac{5\cdot4\cdot3\cdot2\cdot1}{3\cdot2\cdot1\cdot2\cdot1}=10\)
Svaret på (den ursprungliga) uppgiften är alltså 10.
De tio möjliga utfallen är följande:
| R | R | R | G | G |
| R | R | G | R | G |
| R | R | G | G | R |
| R | G | R | R | G |
| R | G | R | G | R |
| R | G | G | R | R |
| G | R | R | R | G |
| G | R | R | G | R |
| G | R | G | R | R |
| G | G | R | R | R |
Oberoende händelser
Låt oss ställa frågan huruvida händelserna A, B i exemplet med “apelsin-byn” ovan är oberoende?
Praktiskt resonemang
Det är samma sak som att fråga om “att tycka om apelsiner” är oberoende av om personen är barn eller inte.
Teoretiskt resonemang
Om A, B är oberoende ska informationen om att B har inträffat inte påverka sannolikheten för A,
vilket är samma sak som att säga att \(P(A|B)=P(A)\) (Jämför gärna med exempel 9).
Lösning: I exemplet med “apelsin-byn” fick vi att \(P(A|B)=0.60\) och att \(P(A)=0.44\).
Alltså är inte händelserna A, B oberoende; det är en större andel bland barnen som tycker om apelsiner (60 %), än bland personerna i allmänhet (44 %).
Det finns flera ekvivalenta (likvärdiga) uttryck för att säga att A, B är oberoende:
1. \(P(A|B)=P(A)\)
2. \(P(B|A)=P(B)\)
3. \(P(A\cap B)=P(A)\cdot P(B)\)
(Nr 3 följer från multiplikationssatsen och 1 och 2.)
Ytterligare ekvivalenta uttryck som innebär att A, B är oberoende:
4. \(P(A|B)=P(A |\bar{B})\) (Båda är då lika med \(P(A)\))
5. \(P(B|A)=P(B |\bar{A})\) (Båda är då lika med \(P(B)\))
Fler ekvivalenta uttryck; se Oberoende.pdf
Följder av att A, B är oberoende
Då är även…
1. \(A, \bar{B}\) oberoende
2. \(\bar{A}, B\) oberoende
3. \(\bar{A}, \bar{B}\) oberoende
Exempel 13: Beräkna sannolikheten att inte få någon sexa när man kastar två tärningar.
Lösning:
Låt \(A=\) “Sexa i första kastet” och \(B=\) “Sexa i andra kastet”.
Utfallet i andra kastet påverkas inte av utfallet i första kastet.
\(A\) och \(B\) kan därför här antas vara oberoende.
Vi ska beräkna \(P(\bar{A}\cap \bar{B})\).
Vi kan utnyttja att eftersom \(A\), \(B\) är oberoende så är även \(\bar{A}, \bar{B}\) oberoende.
Men om \(\bar{A}, \bar{B}\) är oberoende, så följer att \(P(\bar{A}\cap \bar{B})=P(\bar{A})\cdot P(\bar{B})\).
Då får vi att \(P(\bar{A}\cap\bar{B})=P(\bar{A})\cdot P(\bar{B})=\frac{5}{6}\cdot\frac{5}{6}=\frac{25}{36}\).
Definition av oberoende om man har tre händelser A, B, C
Händelserna A, B, C sägs vara ömsesidigt oberoende om …
1. De är parvis oberoende, dvs
\(P(A\cap B)=P(A)\cdot P(B)\) ,
\(P(A\cap C)=P(A)\cdot P(C)\) ,
\(P(B\cap C)=P(B)\cdot P(C)\) .
2. De är sammantaget oberoende, dvs \(P(A\cap B\cap C)=P(A)\cdot P(B)\cdot P(C)\)
Exempel 14: Kasta två tärningar 24 gånger. Beräkna sannolikheten att du vid minst ett av dina kast får en dubbelsexa (två sexor).
Lösning: P(minst en dubbelsexa) = 1 – P(ingen dubbelsexa) =
\(1-(\frac{35}{36})^{24} \approx 0.491\)
Exempel 15: Avgör om följande händelser vid kast med en tärning är oberoende:
Händelsen A : “få udda resultat” som ges av \(A=\{1,3,5\}\).
Händelsen B : “få högt resultat” som ges av \(B=\{4,5,6\}\).
Lösning: Se Exempel 9: Eftersom \(P(A)=0.50\) och \(P(A|B)\approx 0.33\) är olika, är inte A,B oberoende.
Alternativa lösningar finns det gott om, eftersom det finns fem ekvivalenta villkor för att kolla om A,B är oberoende.
T.ex. kan man kolla om \(P(A\cap B)=P(A)\cdot P(B)\):
Eftersom \(A\cap B = \{5\}\), så blir \(P(A\cap B)=\frac{1}{6}\).
Men \(P(A)\) och \(P(B)\) blir båda 0.50, och \(0.50\cdot 0.50\neq\frac{1}{6}\), så därför är inte A,B oberoende.
Satsen om total sannolikhet
Inledande exempel
Detta handlar om tre olika apelsin-odlande byar. Med hjälp av den information du får om byarna, ska du lista ut hur stor andel det är som tycker om apelsiner.
Samma beteckningar som i Exempel 10 används; A för “tycker om apelsiner”, och B för “är barn”.
Uppgiften i samtliga tre deluppgifter är alltså att bestämma P(A).
By a) Du får givet att \(P(A|B)=0.80\) och \(P(A|\bar{B})=0.80\).
Lösning: Andelen som tycker om apelsiner är tydligen lika stor bland alla i byn, så P(A)=0.80.
Ytterligare vägledning till uppgiften finns i villkor 4 tidigare (för oberoende).
By b) Du får givet att \(P(A|B)=0.80\) och \(P(A |\bar{B})=0.60\).
Lösning: Andelen som tycker om apelsiner är större bland barnen i byn.
Om det vore bara barn i byn, skulle P(A)=0.80.
Om det vore bara vuxna i byn, skulle P(A)=0.60.
Vi behöver mer information för att lösa uppgiften:
Här kommer mer information:P(B)=0.50. (dvs det är 50 % barn).
Vi får då att P(A)=0.70.
LEDNING för b) och c) Tänk att det bor 100 personer i byn, så blir det nog lättare att tänka rätt.
By c) Du får givet att \(P(A|B)=0.80\) och \(P(A |\bar{B})=0.60\).
Enligt erfarenhet från b-uppgiften behöver du då också få reda på andelen barn i byn: Här i by c är P(B)=0.25.
Lösning: \(P(A)=0.25\cdot 0.80+ 0.75\cdot 0.60 = 0.65\)
Mer om exemplet “By c”
Svaret verkar logiskt. Hade vi kunnat lista ut det på något annat sätt?
Alternativ 1: Räkna med antal.
Antag att det finns 100 personer i byn. Då är det 25 barn och 75 vuxna.
80 % av barnen tycker om apelsiner, dvs 20 personer.
60 % av de vuxna tycker om apelsiner, dvs 45 personer.
Då är det totalt 65 personer av 100 som tycker om apelsiner, dvs 65 %.
Alternativ 2: Använd formler.
Då behövs även en formel som vi inte nämnt tidigare: \(P(A)=P(A\cap B)+P(A\cap \bar{B})\)
Den formeln kan man “se” i följande bild:
Händelsen \(A\) är inne i cirkeln.
Till vänster om det lodräta strecket är händelsen \(B\).
Till höger om det lodräta strecket är händelsen \(\bar{B}\).
Det lodräta strecket delar \(A\) i två disjunkta delar; \(A\cap B\) och \(A\cap \bar{B}\)
Därav följer att \(P(A)=P(A\cap B)+P(A\cap \bar{B})\)
Tillsammans med formeln \(P(A)=P(A\cap B)+P(A\cap \bar{B})\)
används nu följande formler, som kommer från multiplikationssatsen tidigare:
\(P(A\cap B)=P(B)\cdot P(A|B)\) och \(P(A\cap \bar{B} )=P(\bar{B} )\cdot P(A|\bar{B})\)
Detta sammanslaget ger då: \(P(A)=P(B)\cdot P(A|B)+P(\bar{B} )\cdot P(A|\bar{B})\)
Med insatta värden från “by c” blir det \(P(A)=0.25\cdot 0.80+0.75\cdot 0.60=0.65\).
Alternativ 3: Använd korstabell.
Hitta på ett antal personer i byn (t.ex 100 eller 1000 eller …).
Börja med att fylla i totalantalet 100 (i nedre högra hörnet).
Sedan kan du med hjälp av den information du fick om “by c” fylla i följande:
P(B)=0.25 ger att du kan fylla i 25 i rutan som ger totalsumman för B.
Det ger sedan 75 i rutan under.
\(P(A|B)=0.80\) ger att du kan fylla i \(25\cdot 0.80=20\) i “B-raden” under A.
\(P(A |\bar{B})=0.60\) ger att du kan fylla i \(75\cdot 0.60=45\) på nästa rad (“B-komplement”)
Resten av talen fylls i så att alla summor stämmer.
A |
\(\overline{A}\) |
||
B | 20 | 5 | 25 |
\(\overline{B}\) |
45 | 30 | 75 |
100 |
Ur denna tabell kan avläsas många olika sannolikheter, t.ex. P(A).
(Principen är beskriven i samband med exempel 11 tidigare.)
Vi får \(P(A)=\frac{65}{100}=0.65\)
SAMMANFATTNING: Satsen om total sannolikhet
\(P(A)=P(A\cap B)+P(A\cap \bar{B})\) =
\(=P(B)\cdot P(A|B)+P(\bar{B} )\cdot P(A|\bar{B})\)
Generalisering av ovan till en uppdelning av utfallsrummet i fler än två delar
Ovan (syns bäst i bilden med cirkeln) hade vi delat upp utfallsrummet i två delar; \(B\) och \(\bar{B}\)
Den bilden skulle vi också kunnat rita så att den mer liknade korstabellen, enligt nedan:
(Ovanför det mellersta långa vågräta strecket är händelsen \(B\).
Nedanför det mellersta långa vågräta strecket är händelsen \(\bar{B}\).)
Uppdelningen av utfallsrummet i två delar gör även att händelsen A delas i två delar; \(A\cap B\) och \(A\cap \bar{B}\) :
Från denna bild(tabell) kan vi se (eftersom totalsumman är 100) att \(P(A\cap B)=0.20\) och att \(P(A\cap \bar{B})=0.45\).
Tillsammans bildar dessa \(P(A)=0.65\)
Tre delar
Om utfallsrummet vore uppdelat i tre delar;
\(B_1\), \(B_2\) och \(B_3\), så att \(S=B_1 \cup B_2 \cup B_3\),
så skulle våra två bildalternativ se ut såhär:
respektive
Med hjälp av dessa bilder inses förhoppningsvis att
\(P(A)=P(A\cap B_1)+P(A\cap B_2)+P(A\cap B_3)\)
Från multiplikationssatsen tidigare har vi också:
\(P(A\cap B_1)=P(B_1)\cdot P(A|B_1)\)
\(P(A\cap B_2)=P(B_2)\cdot P(A|B_2)\)
\(P(A\cap B_3)=P(B_3)\cdot P(A|B_3)\)
Sammantaget får vi \(P(A)=P(B_1)\cdot P(A|B_1)+\) \(+P(B_2)\cdot P(A|B_2)+P(B_3)\cdot P(A|B_3)\)
vilket också kan uttryckas som \(\displaystyle P(A)=\sum_{i=1}^3 P(B_i)\cdot P(A|B_i)\)
Detta gäller alltså för tre parvis disjunkta händelser \(B_1\), \(B_2\) och \(B_3\), som tillsammans utgör hela utfallsrummet \(S\).
Allmänt för n stycken delar
I formelsamlingen finns motsvarande generella formel för n stycken parvis disjunkta händelser \(B_1\), \(B_2\), … ,\(B_n\) som tillsammans utgör hela utfallsrummet \(S\):
\(\displaystyle P(A)=\sum_{i=1}^n P(B_i)\cdot P(A|B_i)\)
Detta var alltså Satsen om total sannolikhet i sin mest generella form.
Praktisk användning av Satsen om total sannolikhet
Typisk situation:
-
Vi har n stycken parvis disjunkta händelser \(B_1\), \(B_2\), … ,\(B_n\) som tillsammans utgör hela utfallsrummet \(S\).
-
Vi har en händelse \(A\).
-
Vi känner \(P(B_1)\), \(P(B_2)\), … ,\(P(B_n)\) och
vi känner \(P(A|B_1)\), \(P(A|B_2)\), … ,\(P(A|B_n)\)
Ur denna information kan vi beräkna t.ex.
-
\(P(A)\)
-
\(P(B_1|A)\), \(P(B_2|A)\), … ,\(P(B_n|A)\)
Exempel
Exempel 16
I ett stort bageri har man tre maskiner som tillverar degbitar för bröd. Maskin A står för 50 % av produktionen, maskin B står för 30 % av produktionen och maskin C står för 20 % av produktionen.
Maskinerna fungerar ganska bra, men ibland råkar det komma ut en för liten degbit.
Från maskin A (som är snabbast) blir 4 % av degbitarna för små, från maskin B blir 2 % för små, och från maskin C blir bara 1 % för små.
16a) Hur många procent av alla bageriets degbitar är för små?
16b) Du har hittat en för liten degbit på en plåt, och du vet inte från vilken maskin den kom. Hur stor är sannolikheten att den kom från maskin A?
Lösning med formler
16a) Tillämpa formeln \(P(A)=P(B_1)\cdot P(A|B_1)+\) \(+P(B_2)\cdot P(A|B_2)+P(B_3)\cdot P(A|B_3)\)
Om vi använder uppgiftens beteckningar med tillägget att \(L\) får beteckna händelsen att degbiten är liten, får vi att formeln ger
\(P(L)=P(A)\cdot P(L|A)+\) \(+P(B)\cdot P(L|B)+P(C)\cdot P(L|C)\)
Det ger:
\(P(L)=0.50 \cdot 0.04+0.30\cdot 0.02+0.20\cdot 0.01=\) \(0.028\)
Sannolikheten att få en liten degbit är alltså 2.8 % , vilket är detsamma som att andelen små degbitar är 2.8 %.
16b) Enligt samma beteckningar som nyss, söker vi alltså \(P(A|L)\).
Och \(P(A|L)=\frac{P(A \cap L)}{P(L)}\)
där \(P(L)=0.028\) enligt ovan,
och \(P(A \cap L)=P(A)\cdot P(L|A)=0.50\cdot 0.04=0.02\)
Vi får alltså \(P(A|L)=\frac{P(A \cap L)}{P(L)}=\frac{0.02}{0.028} \approx 0.71\)
Lösning med korstabell
Hitta på ett antal degbitar från bageriet (t.ex 100 eller 1000 eller …).
Börja med att fylla i totalantalet 1000 (i nedre högra hörnet).
Sedan kan du med hjälp av den information du fick i uppgiften fylla i följande:
\(P(A)=0.50\) ger att du kan fylla i 500 i rutan som ger totalsumman för A.
\(P(B)=0.30\) ger att du kan fylla i 300 i rutan som ger totalsumman för B.
\(P(C)=0.20\) ger att du kan fylla i 200 i rutan som ger totalsumman för C.
\(P(L|A)=0.04\) ger att du kan fylla i \(500\cdot 0.04=20\) i “A-raden” under L.
\(P(L|B)=0.02\) ger att du kan fylla i \(300\cdot 0.02=6\) i “B-raden” under L.
\(P(L|C)=0.01\) ger att du kan fylla i \(200\cdot 0.01=2\) i “C-raden” under L.
Resten av talen fylls i så att alla summor stämmer.
L |
\(\overline{L}\) |
||
A | 20 | 480 | 500 |
B | 6 | 294 | 300 |
C | 2 | 198 | 200 |
28 | 972 | 1000 |
Ur denna tabell kan avläsas många olika sannolikheter, t.ex. \(P(L)\) och \(P(A|L)\).
(Principen är beskriven i samband med exempel 11 tidigare.)
Vi får \(P(L)=\frac{28}{1000}=0.028\)
och \(P(A|L)=\frac{20}{28} \approx 0.71\)
Fördelen med korstabell: Att man kan besvara alla möjliga
varianter på sannolikheter, utan att fundera på vilken formel man ska använda.