Chapter 5 Multivariate Probability Distributions
Diskreta bivariata sannolikhetsfördelningar, forts
Väntevärden (Kap 5.5+5.6)
Inledande exempel (klotsexemplet)
Slumpförsöket är att plocka upp en klots ur mängden av klotsar som finns avbildad i följande dokument: Klotsar100.pdf
Det är 100 runda klotsar med olika form; det finns 3 olika tjocklekar (1,2,3) och 4 olika längder (1,2,3,4).
Det finns två intressanta slumpvariabler för slumpförsöket “Tag en slumpvis utvald klots”;
\(Y_1\) som är den valda klotsens tjocklek, och \(Y_2\) som är den valda klotsens längd.
Beskrivningen av den simultana sannolikhetsfördelningen för \(Y_1\) och \(Y_2\) finns i början av kapitel 5.
Exempel 3a)
Bestäm väntevärdet för tjockleken.
Exempel 3b)
Bestäm väntevärdet för längden.
Exempel 3c)
Antag att vi poängsätter varje klots med en “kvalitetspoäng” k enligt följande: \(k=2 \cdot y_1 + y_2\).
Bestäm den förväntade poängen för en genomsnittsklots, dvs väntevärdet för k.
Alla tre exemplen handlar om att bestämma väntevärdet för en funktion \(g(Y_1,Y_2)\) av de två slumpvariablerna \(Y_1\) och \(Y_2\).
Vi kan jämföra med kapitel 3 där vi hade en diskret slumpvariabel \(Y\):
Väntevärdet för en funktion \(g(Y)\) var då \(\displaystyle E(g(Y))=\sum_{y\in S} \big(g(y) \cdot p(y) \big)\).
Nu i kapitel 5 när vi har två diskreta slumpvariabler \(Y_1\) och \(Y_2\) med en simultan sannolikhetsfunktion \(p(y_1,y_2)\) blir väntevärdet för \(g(Y_1,Y_2)\) enligt följande:
\(E \left(g(Y_1,Y_2) \right) =\) \(\displaystyle \sum_{(y_1,y_2)\in S} \big(g(y_1,y_2) \cdot p(y_1,y_2) \big)\)
Det ger följande svar:
Svar 3a)
\(\displaystyle E (Y_1) =\sum_{(y_1,y_2)\in S} y_1 p(y_1,y_2)=\) \(1 \cdot p(1,1)+ 1 \cdot p(1,2) + \cdot \cdot \cdot + 3 \cdot p(3,4)\) \(=2.35\)
Svar 3b)
\(\displaystyle E (Y_2) =\sum_{(y_1,y_2)\in S} y_2 p(y_1,y_2)=\) \(1 \cdot p(1,1)+ 2 \cdot p(1,2) + \cdot \cdot \cdot + 4 \cdot p(3,4)\) \(=2.49\)
Svar 3c)
\(E (2 \cdot Y_1+Y_2) =\) \(\displaystyle \sum_{(y_1,y_2)\in S} (2 \cdot y_1 + y_2) p(y_1,y_2)\) \(=3 \cdot p(1,1)+ 4 \cdot p(1,2) + \cdot \cdot \cdot + 10 \cdot p(3,4)\) \(=7.19\)
Kommentar
För att bestämma väntevärdet tar man “värdet” för varje klots, multiplicerat med sannolikheten att få upp just den klotsen.
Sedan lägger man ihop alla dessa produkter, precis som man gör i fallet med en diskret slumpvariabel. (Och det är precis samma princip som vid beräkning av medelvärde).
“Värdet” i dessa fall är i a-uppgiften tjockleken, i b-uppgiften längden och i c-uppgiften kvalitetspoängen.
“Genväg” för väntevärde om bara en variabel är inblandad
Om man ska beräkna väntevärdet för \(Y_1\), kan man utnyttja marginalfördelningen för \(Y_1\); den fördelning som betecknas \(p_1(y_1)\).
Då blir \(\displaystyle E (Y_1) =\sum_{y_1} y_1 p_1(y_1)=\) \(1 \cdot p_1(1)+ 2 \cdot p_1(2)+ 3 \cdot p_1(3)=\) \(1 \cdot 0.20+ 2 \cdot 0.25+ 3 \cdot 0.55\) \(=2.35\)
Förklaringen till att detta fungerar är att funktionen \(g(Y_1,Y_2)\) har samma värde \((Y_1)\) för alla klotsar med samma tjocklek.
T.ex. motsvarar den första termen \(1 \cdot p_1(1)\) de fyra första termerna i svaret i 3a): \(1\cdot p(1,1)+ 1 \cdot p(1,2)+ 1 \cdot p(1,3)+ 1 \cdot p(1,4)\).
Eftersom värdet \(y_1=1\) är gemensamt för alla termerna kan vi bryta ut 1 och få \(1\cdot \big(p(1,1)+ p(1,2)+ p(1,3)+ p(1,4) \big)\) vilket är just \(1 \cdot p_1(1)\)
På samma sätt, om man ska beräkna väntevärdet för \(Y_2\), kan man göra såhär:
\(\displaystyle E (Y_2) =\sum_{y_2} y_2 p_2(y_2)\)
Användbara formler/räkneregler för omskrivning av uttryck med “E”
(se satserna 5.6, 5.7 och 5.8)
-
\(E(c)=c\)
-
\(E(c \cdot g(Y_1,Y_2)) = c \cdot (E(g(Y_1,Y_2))\)
-
\(E \Big(g_1(Y_1,Y_2)+ g_2(Y_1,Y_2) + \cdot \cdot \cdot + g_k(Y_1,Y_2) \Big)\) \(= E(g_1(Y_1,Y_2))+ E(g_2(Y_1,Y_2)) +\) \(\cdot \cdot \cdot + E(g_k(Y_1,Y_2))\)
Här är \(g,g_1,g_2, … ,g_k\) funktioner av två variabler; \(Y_1\) och \(Y_2\).
Ytterligare en räkneregel för väntevärden när vi har två variabler inblandade
Om \(Y_1\) och \(Y_2\) är oberoende slumpvariabler,
och vi har två funktioner \(g\) och \(h\) som båda är funktioner av en variabel, så att vi har en funktion \(g(Y_1)\) och en funktion \(h(Y_2)\) , så gäller följande:
- \(E(g(Y_1) \cdot h(Y_2))\) = \(E(g(Y_1)) \cdot E(h(Y_2))\)
Övningar
Exempel 4 (Vi fortsätter med klotsexemplet)
4a) Utför beräkningen av \(E (Y_2)\) i exempel 3b ovan och verifiera att du får svaret 2.49.
4b) Utför beräkningen av \(E (Y_2)\) enligt “genvägsmetoden”.
4c) Låt \(K=2 \cdot Y_1 + Y_2\). Verifiera beräkningen av \(E(K)\) i exempel 3c,
men den här gången snabbare, med hjälp av värdena 2.35 och 2.49 samt räknereglerna 2 och 3 ovan.
Exempel 5 Uppgiften är att beräkna \(E(K^2)\), där \(K\) beskrivs i 3c/4c.
5a) Utgå från definitionen av väntevärde och beräkna \(E(K^2)\) “direkt”.
(enligt samma metod som i Exempel 5, kapitel 3; väntevärdet för kvadraten på ett tärningskast.)
5b) För träningens skull, ska vi beräkna \(E(K^2)\) på ett alternativt sätt, i flera steg:
b1 Utveckla \(K^2=(2 Y_1 + Y_2)^2\)
b2 Beräkna \(E(Y_1^2)\) och \(E(Y_2^2)\) med “genvägsmetoden”.
b3 Beräkna \(E(Y_1 Y_2)\). Varför kan inte “genvägsmetoden” användas här?
b4 Utnyttja räknereglerna för att med hjälp av resultaten i b2 och b3 beräkna \(E(K^2)\)=\(E(4 Y_1^2+ 4 Y_1 Y_2 + Y_2^2)\)
Väntevärden för marginalfördelningar och betingade fördelningar
Nedanstående uppgifter bör du kunna klara av om du tänker logiskt (kombinera dina kunskaper om vad ett väntevärde är med dina kunskaper om marginalfördelningar respektive betingade fördelningar).
Annars kan du ta en titt i början av kapitel 5.11.
Exempel 6 (Fortfarande klotsexemplet)
6a) Bestäm väntevärdet för fördelningen \(p_1(y_1)\).
6b) Bestäm väntevärdet för fördelningen \(p(y_1|3)\).
6c) Bestäm \(E(Y_2|Y_1=3)\).
Svar till Exempel 4,5 och 6
4a Se separat dokument: SvarExempel.pdf
4b Se separat dokument: SvarExempel.pdf
4c \(E(K)=E(2 \cdot Y_1 + Y_2)\) =\(E(2 \cdot Y_1) + E(Y_2)\) =\(2 \cdot E(Y_1) + E(Y_2)\)=\(2 \cdot 2.35 + 2.49\)=\(7.19\)
5a Se separat dokument: SvarExempel.pdf
5b1 \(4 Y_1^2+ 4 Y_1 Y_2 + Y_2^2\)
5b2 \(E(Y_1^2)=6.15\) och \(E(Y_2^2)=7.61\)
5b3 \(E(Y_1 Y_2)=5.27\) Lösning, se separat dokument: SvarExempel.pdf
5b4 \(E(K^2)\)=\(E(4 Y_1^2+ 4 Y_1 Y_2 + Y_2^2)\)=\(E(4 Y_1^2)+E(4 Y_1 Y_2)\)+\(E(Y_2^2)\)=\(4 \cdot E(Y_1^2)\)+\(4 \cdot E(Y_1 Y_2)\)+\(E(Y_2^2)\)=\(4 \cdot 6.15\)+\(4 \cdot 5.27\)+\(7.61\)=\(53.29\)
Eftersom funktionsuttrycket \(g(Y_1,Y_2)\)=\(Y_1 \cdot Y_2\) innehåller båda variablerna \(Y_1\) och \(Y_2\) kan “genvägsmetoden” inte användas.
6a \(\displaystyle E (Y_1) =\sum_{y_1} y_1 p_1(y_1)=\) \(1 \cdot p_1(1)+ 2 \cdot p_1(2)+ 3 \cdot p_1(3)=\) \(1 \cdot 0.20+ 2 \cdot 0.25+ 3 \cdot 0.55\) \(=2.35\)
6b Väntevärdet för fördelningen \(p(y_1|3)\) innebär detsamma som väntevärdet för \(Y_1\) i det fall när \(Y_2=3\) .
Se definition 5.13 i början av kapitel 5.11:
\(E(Y_1|Y_2=3)\)=\(\displaystyle \sum_{y_1} y_1 p(y_1|3)\) \(\approx 1 \cdot 0.118\)+\(2 \cdot 0.588\)+\(3 \cdot 0.294\)=\(2.176\)
6c \(E(Y_2|Y_1=3)=\) \(\displaystyle \sum_{y_2} y_2 p(y_2|3)\) \(\approx 1 \cdot 0.454\)+\(2 \cdot 0.364\)+\(3 \cdot 0.091\) \(+4 \cdot 0.091\) \(\approx 1.82\)
// add bootstrap table styles to pandoc tables $(document).ready(function () { $('tr.header').parent('thead').parent('table').addClass('table table-condensed'); });