Chapter 6 Functions of Random Variables
Inledning
I kapitel 5.8 (Exempel 10) fick vi bl.a. fram resultat för väntevärde och varians för en linjär funktion av en slumpvariabel \(Y\):
Om funktionen är \(U=a Y + b\) gäller följande för denna nya slumpvariabel \(U\):
\(E(U)=a E(Y)+b\)
och \(V(U)=a^2 V(Y)\).
Nu i kapitel 6 ska vi inte nöja oss med att ta reda på väntevärdet och variansen för en sådan funktion \(U\) , utan vi ska också ta reda på sannolikhetsfördelningen för \(U\) .
Vi kommer även att titta på andra funktioner av \(Y\) än de linjära.
Vi ska också titta lite på situationen där \(U\) är en linjär funktion av två slumpvariabler; dvs \(U= a_{1}Y_{1}+a_{2}Y_{2}\).
I kap 5.8 kom vi fram till väntevärdet :
\(E(U) =a_{1}E\left( Y_{1}\right)+a_{2}E\left( Y_{2}\right)\)
och variansen :
\(V(U) =a_{1}^2 V\left( Y_{1}\right)+a_{2}^2 V \left( Y_{2}\right)+2 a_{1} a_{2} Cov(Y_1,Y_2)\)
Men nu i kapitel 6 vill vi också få fram mer; vi vill ha information om sannolikhetsfördelningen för \(U\) .
Exempel på uppgifter vi vill kunna lösa:
\(1)\) Om \(Y \sim Re(0,2)\) och \(U=10 Y + 5\), vilken fördelning får \(U\)?
\(2)\) Om \(Y_1\) och \(Y_2\) är resultaten av varsitt tärningskast, vilken fördelning får \(U=\frac{Y_1+Y_2}{2}\)? (\(U\) är då medelvärdet av de två tärningskasten.)
\(3)\) Om \(Y \sim N(0,1^2)\) och \(U=Y^2\), vilken fördelning får \(U\)?
\(4)\) Om \(Y \sim Re(1,5)\) och \(U=2Y^2 + 5\), vilken fördelning får \(U\)?
\(5)\) Om \(Y_1 \sim N(\mu_1,\sigma_1^2)\) och \(Y_2 \sim N(\mu_2,\sigma_2^2)\), vilken fördelning får \(U= Y_{1}+Y_{2}\)?
Beskrivning av målsättningen
Målet är alltså att komma fram till en beskrivning av sannolikhetsfördelningen för \(U\).
Om \(U\) är en diskret slumpvariabel vill vi ha dess sannolikhetsfunktion \(p(u)\) ; antingen i form av en tabell eller en formel.
Om det är en känd fördelning räcker det att ange namnet på fördelningen.
Om \(U\) är en kontinuerlig slumpvariabel vill vi ha formeln för täthetsfunktionen \(f(u)\) .
Om det är en känd fördelning räcker det att ange namnet på fördelningen.
Metoden “Logiskt tänkande”
Exempel 1 En variabel
Om \(Y \sim Re(0,2)\) och \(U=10 Y + 5\), vilken fördelning får \(U\) ?
Först en bild av täthetsfunktionen \(f(y)\) för slumpvariabeln \(Y \sim Re(0,2)\):
De möjliga värdena för \(Y\) är jämnt fördelade mellan 0 och 2, alla lika sannolika.
Dags att börja tänka på slumpvariabeln \(U\)
Steg 1
Vilka möjliga värden har \(U\) om \(U=10 Y + 5\)?
Svar: Det lägsta är \(u=10\cdot 0 + 5=5\)
och det högsta är \(u=10\cdot 2 + 5=25\)
Steg 2
Hur är dessa värdens sannolikheter?
Svar: Eftersom alla värden mellan 0 och 2 är lika sannolika för \(Y\), så blir alla värden för \(U\) lika sannolika.
Slutsats
\(U\) är likformigt fördelad mellan 5 och 25, dvs \(U \sim Re(5,25)\)
Svar: \(U \sim Re(5,25)\)
Exempel 2 Två variabler
Om \(Y_1\) och \(Y_2\) är resultaten av varsitt tärningskast, vilken fördelning får \(U=\frac{Y_1+Y_2}{2}\) ?
Fördelningarna för \(Y_i\) är förstås desamma, både för \(i=1\) och \(i=2\):
\(y_i\) | \(p(y_i)\) |
---|---|
1 | 1/6 |
2 | 1/6 |
3 | 1/6 |
4 | 1/6 |
5 | 1/6 |
6 | 1/6 |
Dags att börja tänka på slumpvariabeln \(U\)
Steg 1
Vilka möjliga värden har \(U\) om \(U=\frac{Y_1+Y_2}{2}\) ?
Kom ihåg att \(U\) är medelvärdet av \(Y_1\) och \(Y_2\) .
Svar: Det lägsta värdet är 1 (om både \(y_1\) och \(y_2\) är 1).
Det högsta värdet är 6 (om både \(y_1\) och \(y_2\) är 6).
Sedan finns alla “halvstegsvärden” mellan 1 och 6 ; 1.5, 2, 2.5 och så vidare.
Steg 2
Hur är sannolikheterna för dessa värden?
Svar: Om vi räknar upp alla utfall för (\(y_1\), \(y_2\)) så blir de följande:
(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
(4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6),
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)
Alla dessa utfall är lika sannolika, dvs sannolikheten är 1/36 för varje enskilt utfall.
Medelvärdet 1 uppstår bara i ett fall; utfallet (1,1).
Därför blir sannolikheten för \(U=1\) lika med 1/36.
Medelvärdet 1.5 uppstår i två fall; utfallen (1,2) och (2,1).
Därför blir sannolikheten för \(U=1.5\) lika med 1/36 + 1/36.
Och så vidare.
:
Slutsats
Vi kan sammanfatta sannolikhetsfördelningen för \(U\) i följande tabell:
\(u\) | \(p(u)\) |
---|---|
1 | 1/36 |
1.5 | 2/36 |
2 | 3/36 |
2.5 | 4/36 |
3 | 5/36 |
3.5 | 6/36 |
4 | 5/36 |
4.5 | 4/36 |
5 | 3/36 |
5.5 | 2/36 |
6 | 1/36 |
Svar: Tabellen är svaret på sannolikhetsfördelningen för \(U\).
Metoder som presenteras i kapitel 6
Här presenteras tre olika metoder för att komma fram till sannolikhetsfördelningen för \(U\), där \(U\) är en funktion av en eller flera slumpvariabler:
Fördelningsfunktions-metoden (kommer i Kap 6.3)
1 Fallet där \(U\) är en funktion av en slumpvariabel \(Y\) , dvs \(U=h(Y)\)
Utgående från täthetsfunktionen \(f(y)\) för \(Y\) och beskrivning av funktionen \(h\) , tar man fram täthetsfunktionen \(f(u)\) för \(U\).
Men man gör detta genom att gå via slumpvariablernas fördelningsfunktioner.
För att inte blanda ihop beteckningarna för de två slumpvariablernas beskrivningar, använder vi olika index; Y respektive U :
För slumpvariabeln \(Y\) betecknas täthetsfunktionen \(f_Y(y)\)
och fördelningsfunktionen betecknas \(F_Y(y)\) .
För slumpvariabeln \(U\) betecknas täthetsfunktionen \(f_U(u)\)
och fördelningsfunktionen betecknas \(F_U(u)\) .
Så i exempel 1 med \(Y \sim Re(0,2)\) och \(U \sim Re(5,25)\) skriver vi t.ex:
\(f_Y(y)=0.5, \ \ 0 \leq y \leq 2\)
och
\(f_U(u)=0.05, \ \ 5 \leq u \leq 25\)
Beskrivning av fördelningsfunktions-metoden :
Start
+ Information om fördelningen för slumpvariabeln \(Y\) , i form av täthetsfunktionen \(f_Y(y)\) .
+ Information om funktionen \(h\) , i form av en formel \(U=h(Y)\)
Mål
+ Information om fördelningen för slumpvariabeln \(U\) , i form av täthetsfunktionen \(f_U(u)\) .
Bild av proceduren från start till mål
2 Fallet där \(U\) är en funktion av två slumpvariabler \(Y_1\) och \(Y_2\)
Detta fall ingår inte i kursen, trots att det finns med i kursboken.
Anledningen är samma begränsning av de matematiska förkunskaperna som gjorde att vi inte heller tog upp kontinuerliga bivariata sannolikhetsfördelningar i allmänhet; vi skulle behövt metoder för analys av två variabler som t.ex. dubbelintegraler.
Transformations-metoden (kommer i Kap 6.4)
1 Fallet där \(U\) är en funktion av en slumpvariabel \(Y\) , dvs \(U=h(Y)\)
Utgående från täthetsfunktionen \(f(y)\) för \(Y\) och beskrivning av funktionen \(h\) , tar man fram täthetsfunktionen \(f(u)\) för \(U\).
Här går vi dock direkt från täthetsfunktion till täthetsfunktion, utan att gå via fördelningsfunktionen.
För att inte blanda ihop beteckningarna för de två slumpvariablernas beskrivningar, använder vi olika index; Y respektive U :
För slumpvariabeln \(Y\) betecknas täthetsfunktionen \(f_Y(y)\) .
För slumpvariabeln \(U\) betecknas täthetsfunktionen \(f_U(u)\)
En kort beskrivning av metoden:
\(f_{U}\left( u\right)\) = \(f_{Y}\Bigl( h^{-1}(u) \Bigr) \cdot \displaystyle \left\vert \frac{d\Bigl( h^{-1}(u) \Bigr)}{du}\right\vert\)
2 Fallet där \(U\) är en funktion av två slumpvariabler \(Y_1\) och \(Y_2\)
Detta fall ingår inte i kursen, trots att det finns med i kursboken.
Momentgenererande funktions – metoden (kommer i Kap 6.5)
1 Fallet där \(U\) är en funktion av en slumpvariabel \(Y\) , dvs \(U=h(Y)\)
Utnyttja att två olika slumpvariabler inte kan ha samma momentgenererande funktion.
2 Fallet där \(U\) är en funktion av två slumpvariabler \(Y_1\) och \(Y_2\)
Till exempel gäller att om \(Y_1\) och \(Y_2\) är oberoende och \(U=Y_1 + Y_2\) ,
så är \(m_U(t)=m_{Y_1}(t) \cdot m_{Y_2}(t)\)
// add bootstrap table styles to pandoc tables $(document).ready(function () { $('tr.header').parent('thead').parent('table').addClass('table table-condensed'); });