Chapter 4 Continous Random Variables
Kapitel 4 Kontinuerliga slumpvariabler
Matematik-grunder
Innan vi går in på kapitel 4 behöver vi några matematiska begrepp.
Gränsvärden
Vi har tidigare hänvisat till [www.matteboken.se/lektioner/matte-3/polynom-och-ekvationer/gransvarde]
Kolla (eventuellt) den länken igen, och försök lista ut vad följande gränsvärden blir:
Exempel 1a
\(\displaystyle \lim_{x\rightarrow \infty} \ \ \frac{1}{x}\)
Exempel 1b
\(\displaystyle \lim_{x\rightarrow \infty} \ \ \frac{x^2+3}{x^4+5x-3}\)
Exempel 1c
\(\displaystyle \lim_{x\rightarrow \infty} \ \ \frac{x^3}{e^x}\)
Exempel 1d
\(\displaystyle \lim_{x\rightarrow \infty} \ \ xe^{-5x}\)
LEDNING och SVAR
Ledning 1d
\(\displaystyle \lim_{x\rightarrow \infty} \ \ xe^{-5x}= \lim_{x\rightarrow \infty} \frac{x}{e^{5x}}\)
I alla fyra uppgifterna blir svaret noll, eftersom täljaren växer snabbare än nämnaren i samtliga tre uppgifter.
Derivata
Om du behöver friska upp deriveringsreglerna, kan du kolla på följande länkar, med tillhörande uppgifter (Klicka på “Gör uppgifter”)
Deriveringsregler, grunder : [http://www.matteboken.se/lektioner/matte-3/derivata/deriveringsregler]
Derivata av sammansatta funktioner : [http://www.matteboken.se/lektioner/matte-4/derivata-och-differentialekvationer/derivatan-av-sammansatta-funktioner]
Några viktiga funktioners derivata : [http://www.matteboken.se/lektioner/matte-4/derivata-och-differentialekvationer/nagra-viktiga-funktioners-derivata]
Men här räcker det om du kollar det som handlar om funktionerna \(f(x)=e^x\) och \(f(x)=e^{kx}\) Alternativ kollar du bara på följande korta video: [https://www.youtube.com/watch?v=iOrCdWQSfoU]
Derivatan av en produkt : [http://www.matteboken.se/lektioner/matte-4/derivata-och-differentialekvationer/derivatan-av-en-produkt]
Derivatan av en kvot : [http://www.matteboken.se/lektioner/matte-4/derivata-och-differentialekvationer/derivatan-av-en-kvot]
Integraler
Om du inte känner till begreppet integral behöver du kolla på följande två länkar:
[http://www.matteboken.se/lektioner/matte-3/integraler/primitiv-funktion]
När du läst igenom (och kanske även kollat på videon) rekommenderas de tre övningsuppgifterna som du hittar om du klickar på “Gör uppgifter”. (Länken till uppgifterna finns både i början och slutet av genomgången.)
[http://www.matteboken.se/lektioner/matte-3/integraler/berakning-av-integraler]
När du läst igenom (och kanske även kollat på videon) rekommenderas de tre övningsuppgifterna som du hittar om du klickar på “Gör uppgifter”. (Länken till uppgifterna finns både i början och slutet av genomgången.)
Vi gör följande tillägg till de två länkarna om integraler:
I länken “Primitiv funktion” lärde du dig bland annat följande:
\(f(y)\) | \(F(y)\) |
---|---|
\(1\) | \(y+C\) |
\(y\) | \(\frac{y^2}{2}+C\) |
\(y^2\) | \(\frac{y^3}{3}+C\) |
\(e^{ky}\) | \(\frac{e^{ky}}{k}+C\) |
Ett alternativt skrivsätt för dessa regler är:
\(\int 1 \ \ dy=y+C\)
\(\int y \ \ dy=\frac{y^2}{2}+C\)
\(\int y^2 \ \ dy=\frac{y^3}{3}+C\)
\(\int e^{ky} \ \ dy=\frac{e^{ky}}{k}+C\)
Övningar
Exempel 1e Bestäm \(\int 6y^2 \ dy\)
Exempel 1f Bestäm \(\displaystyle \int_1^3 6y^2 \ dy\)
Exempel 1g Bestäm \(\int e^{4y} \ dy\)
Exempel 1h Bestäm \(\displaystyle \int_0^2 e^{4y} \ dy\)
Svar
1e \(2y^3+C\)
1f \(52\)
1g \(\frac{e^{4y}}{4}+C=\frac{1}{4} e^{4y}+C=0.25e^{4y}+C\) (Välj det svar du tycker är snyggast)
1h \(\frac{e^8-1}{4} \approx 745\)
Introduktion av kontinuerlig slumpvariabel (Kap 4.1+ 4.2)
Återblick på fördelningsfunktion
I genomgången av kapitel 3 introducerades begreppet fördelningsfunktion F(y). (I kursboken dock först i kap 4)
\(F(y)= P(Y \leq y)\)
(Denna definition gäller oavsett om slumpvariabeln är diskret eller kontinuerlig.)
Vi använde ett exempel som gav följande fördelningsfunktion:
Sannolikhetsfördelningen p(y) som gav upphov till denna F(y) var följande:
\(y\) | \(p(y)\) |
---|---|
2 | 0.25 |
4 | 0.50 |
6 | 0.25 |
Exempel 2
Bestäm den p(y) (pdf) som motsvarar följande F(y) (cdf) :
Svar:
\(y\) | \(p(y)\) |
---|---|
0 | 0.2 |
1 | 0.2 |
2 | 0.2 |
3 | 0.2 |
4 | 0.2 |
Övergång till kontinuerlig slumpvariabel.
Låt oss ta ett nytt exempel på fördelningsfunktion/cdf F(y).
Fundera på hur sannolikhetsfördelningen/pdf ser ut för den slumpvariabel Y som har följande fördelningsfunktion/cdf:
Här ser vi att F(y) stiger kontinuerligt mellan 0 och 4, och inte i steg som i föregående exempel (som handlade om en diskret slumpvariabel).
Vi ska nu presentera ett exempel på ett slumpförsök med en slumpvariabel Y där fördelningsfunktionen ser ut som i bilden ovan.
Slumpförsöket är följande:
Ta en 4 dm lång bräda och sätt en skala utefter långsidan där du markerar 0-4. Just innan det ska regna placerar du brädan på marken. Vänta tills den första regndroppen träffar brädan och kolla vilken position på skalan 0-4 som droppen hamnat mittför.
Slumpvariabeln Y = positionen för den första regndroppen.
Då är det naturligt att F(y) växer. Jämför t.ex. F(2.5) med F(2.6):
\(F(2.5)= P(Y \leq 2.5)\) = sannolikheten att första regndroppen kommer på de första 2.5 dm av brädan.
\(F(2.6)= P(Y \leq 2.6)\) = sannolikheten att första regndroppen kommer på de första 2.6 dm av brädan.
Då följer att F(2.6) är större än F(2.5), eftersom det är ett längre brädavsnitt för värdet 2.6.
Det är också naturligt att F(y) växer lika fort hela tiden, eftersom alla positioner på brädan är lika sannolika.
Den intressanta frågan
Det vi är intresserade av är hur sannolikhetsfördelningen/pdf ser ut för slumpvariabel Y= positionen för den första regndroppen.
Om man skulle försöka göra en tabell som för exempel 2 ovan, skulle man få problem nu när slumpvariabeln är kontinuerlig:
\(y\) | \(p(y)\) |
---|---|
0 | ? |
? | ? |
: | : |
: | : |
4 | ? |
Problem 1. Hur många olika positioner finns det för regndroppen; dvs hur lång blir tabellen?
Problem 2. Vad ska sannolikheterna få för värden?
Slutsatsen blir att det inte går att beskriva sannolikhetsfördelningen för en kontinuerlig slumpvariabel på samma sätt som för en diskret slumpvariabel; med en funktion p(y).
Den beskrivning som används istället heter täthetsfunktion f(y) och introduceras efter nästa stycke.
Egenskaper hos en fördelningsfunktion för en kontinuerlig slumpvariabel Y
Antag att vi har en kontinuerlig slumpvariabel Y som kan anta värden mellan \(y_{min}\) och \(y_{max}\).
För dess fördelningsfunktion \(F(y)\) gäller då följande:
\(F(y)\) är icke-avtagande (dvs växande eller konstant)
\(F(y)\) är kontinuerlig (har inga “hopp”)
\(F(y_{min})=0\) och \(F(y_{max})=1\) gäller om \(y_{min} \leq y\leq y_{max}\).
Om man ska vara mer korrekt bör man skriva \(\displaystyle \lim_{y\rightarrow y_{min}+} \ \ F(y)=0\) och \(\displaystyle \lim_{y\rightarrow y_{max}-} \ \ F(y)=1\) så fungerar det även om vi har t.ex. fallet \(y_{min} < y < y_{max}\).
Mer: \(P(a \leq Y \leq b)\) kan beräknas med hjälp av fördelningsfunktionen;
\(P(a \leq Y \leq b)=F(b)-F(a)\)
Detta gäller alltså för en kontinuerlig slumpvariabel.
OBSERVERA SKILLNADEN JÄMFÖRT MED DISKRETA SLUMPVARIABLER!
Se t.ex. Exempel 16 och 17 i kapitel 3.8.
För en diskret slumpvariabel med heltalsvärden för y gäller \(P(a \leq Y \leq b)=F(b)-F(a-1)\)
Täthetsfunktion f(y)
Fallet likformig fördelning
I exemplet ovan kom vi fram till att det inte fungerar att göra en tabell för p(y) när slumpvariabeln Y är kontinuerlig. Vi ska istället använda en täthetsfunktion f(y).
Vi börjar med en bildmässig beskrivning av hur f(y) fungerar i exemplet med vattendroppen:
Som förberedelse; tänk igenom svaret på följande uppgift: Bestäm \(P(1 \leq Y \leq 2.5)\) (dvs sannolikheten att droppen hamnar någonstans mellan positionerna 1 och 2.5)
Ledning: Hur många procent av brädan motsvarar delen mellan positionerna 1 och 2.5?
Här är bilden av täthetsfunktionen f(y). Det är en linje som går ovanför det område där värdena för y är aktuella.
Det är den graf som motsvarar ett stolpdiagram för en diskret slumpvariabel med en sannolikhetsfördelningsfunktion p(y). I det fallet är summan av stolparnas längd likamed 1. När vi har en kontinuerlig slumpvariabel är det istället arean under f(y) som ska vara 1.
Det är därför som f(y) har värdet 0.25, så att rektangelarean ska bli \(4 \cdot 0.25=1\) (Det färgade området)
Användning av f(y)
Vår uppgift är att använda f(y) för att beräkna \(P(1 \leq Y \leq 2.5)\):
Denna sannolikhet beräknas genom att man beräknar arean under täthetsfunktionen f(y) över området mellan 1 och 2.5. Se den streckade arean i figuren nedan.
Förhoppningsvis kom även du fram till att \(P(1 \leq Y \leq 2.5)=0.375\)
(Det kanske du förresten redan listat ut med hjälp av ledningen tidigare)
Fallet när sannolikheten varierar
I exemplet ovan var sannolikheten densamma för alla värden på y mellan 0 och 4. Vad händer nu om sannolikheten varierar, så att f(y) ser ut såhär?
\(f(y)=0.046875y^2\)
Liksom i det föregående exemplet har vi här en slumpvariabel Y som kan anta alla möjliga värden mellan 0 och 4.
Skillnaden här är att alla värden inte är lika sannolika; det är mycket osannolikt att slumpvariabeln ger ett värde nära 0, men hög sannolikhet för värden nära 4.
Dock är det så (liksom för alla kontinuerliga slumpvariabler) att arean under f(y) är 1 (det färgade området).
Vad blir \(P(1 \leq Y \leq 2.5)\) för denna slumpvariabel?
Det är den streckade arean i figuren nedan.
Hur beräknar man en sådan area? Det är ju ingen rektangel.
Svaret finns under figuren.
Med matematik-kunskaperna från inledningen av detta kapitel har du kanske listat ut att svaret är att den markerade arean kan beräknas med hjälp av en integral: \(\displaystyle \int_1^{2.5} 0.046875y^2 \ dy\).
Vi har alltså att
\(P(1 \leq Y \leq 2.5) = \displaystyle \int_1^{2.5} 0.046875y^2 \ dy =\) \(\left[ 0.015625y^3 \right]_1^{2.5} =\) \(0.015625 \cdot 2.5^3- 0.015625 \cdot 1^3 \approx 0.2285\)
Exempel 3
handlar också om den kontinuerliga slumpvariabeln Y som har täthetsfunktionen \(f(y)=0.046875y^2, \ \ 0 \leq y \leq 4\)
3a)
Bestäm \(P(0 \leq Y \leq 0.5)\)
3b)
Bestäm \(F(2.5)\)
3c)
Bestäm \(F(1)\)
Ledning till 3b och 3c: Du måste inte bestämma formeln för fördelningsfunktionen F(y).
Du kan istället tänka såhär: \(F(b)=P(Y \leq b)\)
Och eftersom Y bara är definerad för \(0 \leq y \leq 4\), betyder det att \(P(Y \leq b)=P(0 \leq Y \leq b)\)
Alltså: \(F(b)=P(Y \leq b)=\) \(P(0 \leq Y \leq b)=\displaystyle \int_0^b 0.046875y^2 \ dy\)
Svar Exempel 3
3a) 0.001953125
3b) 0.244140625
3c) 0.015625
Allmänt om täthetsfunktionen f(y) för en kontinuerlig slumpvariabel Y
-
\(f(y) \geq 0\) för \(-\infty < y < \infty\)
-
\(\displaystyle \int_{-\infty}^{\infty} f(y) \ dy=1\)
-
Sannolikhetsberäkning:
\(P(a \leq Y \leq b)=\displaystyle \int_a^b f(y) \ dy\)
Exempel
Exemplet ovan med \(f(y)=0.046875y^2, \ \ 0 \leq y \leq 4\):
\(P(1 \leq Y \leq 2.5) = \displaystyle \int_1^{2.5} f(y) \ dy\) Svaret blev ca 0.2285, se ovan.
Det tidigare exemplet med \(f(y)=0.25, \ \ 0 \leq y \leq 4\):
\(P(1 \leq Y \leq 2.5) = \displaystyle \int_1^{2.5} f(y) \ dy=\) \(\displaystyle \int_1^{2.5} 0.25 \ dy =\) \(\left[ 0.25y \right]_1^{2.5} = 0.25 \cdot 2.5 – 0.25 \cdot 1=0.375\)
Övningsexempel
Exempel 4
En kontinuerlig slumpvariabel Y har följande täthetsfunktion: \(f(y)=0.375y^2, \ \ 0 \leq y \leq 2\)
4a) Bestäm \(P(0.5 \leq Y \leq 1)\)
4b) Bestäm \(P(0.5 < Y < 1)\)
4c) Bestäm \(P(Y \geq 1)\)
Exempel 5 En kontinuerlig slumpvariabel Y har följande täthetsfunktion: \(f(y)=1.5-0.5y, \ \ 1 \leq y \leq 3\)
5a) Bestäm \(P(2 \leq Y \leq 3)\)
5b) Bestäm \(P(2 < Y < 3)\)
5c) Bestäm F(2)
Svar till exemplen 4 och 5
4a) 0.109375
4b) 0.109375
4c) 0.875
5a) 0.25
5b) 0.25
5c) 0.75
Samband mellan fördelningsfunktionen/cdf F(y) och täthetsfunktionen/pdf f(y)
Att gå från F(y) till f(y)
Sambandet är enkelt; det är bara att derivera!
\(F'(y)=f(y)\)
Exempel 6
En kontinuerlig slumpvariabel Y har följande fördelningsfunktion: \(\displaystyle F(y)=\left\{ \begin{array}{ll} 0, & y<1 \\ 0.01y^2+0.19y-0.20, & 1 \leq y \leq 5 \\ 1, & y > 5 \end{array} \right.\)
Bestäm formeln för täthetsfunktionen f(y)
Svar exempel 6
\(\displaystyle f(y)=\left\{ \begin{array}{ll} 0, & y<1 \\ 0.02y+0.19 & 1 \leq y \leq 5 \\ 0, & y > 5 \end{array} \right.\)
Ett kortare skrivsätt för svaret:
\(f(y)= 0.02y+0.19, \ \ 1 \leq y \leq 5\)
Man tar då för givet att f(y)=0 för de värden på y som är utanför det givna intervallet.
Att gå från f(y) till F(y)
Vi kan utgå från ledningen till exempel 3b och 3c ovan:
\(F(b)=P(Y \leq b)=\) \(P(0 \leq Y \leq b)=\displaystyle \int_0^b f(y) \ dy\) (F)
Skillnaden nu är att vi vill ha en funktion F(y) istället för ett bestämt värde F(b).
Dessutom är ju inte nedre gränsen \(0\) för alla slumpvariabler; vi kallar den allmänt för \(y_{min}\).
Då har vi redan “receptet”; det är bara att byta ut \(b\) mot \(y\) och \(0\) mot \(y_{min}\).
Men det blir lite förvirrande att ha en gräns y när integrationsvariabeln också heter y.
De erfarna matematikerna byter då ut sin integrationsvariabel till något annat än just y, och valet hamnar ofta på t.
Kommentar: \(\displaystyle \int_a^b f(y) \ dy\) = \(\displaystyle \int_a^b f(t) \ dt\) = \(\displaystyle \int_a^b f(x) \ dx\) etc.
så det spelar ingen roll vilken integrationsvariabel man använder.
(Alla tre uttrycken blir nämligen \(F(b)-F(a)\) )
En kortversion av formeln (F) ovan:
\(F(b)=\displaystyle \int_0^b f(y) \ dy\)
Med alla byten blir nu formeln enligt följande:
\(F(y)=\displaystyle \int_{y_{min}}^y f(t) \ dt\)
Alternativ metod för att gå från f(y) till F(y)
Vi vet att F(y) är en primitiv funktion till f(y).
Det vi behöver veta är värdet på konstanten C, men det kan vi bestämma genom att utnyttja antingen \(F(y_{min})=0\) eller \(F(y_{max})=1\)
Exempel 7
En kontinuerlig slumpvariabel Y har följande täthetsfunktion: \(f(y)=1.5-0.5y, \ \ 1 \leq y \leq 3\)
7a) Bestäm F(y) med “diretkformeln”.
7b) Bestäm F(y) med metoden i alternativ 2.
Lösning
7a) \(F(y)=\displaystyle \int_{y_{min}}^y f(t) \ dt =\) \(\displaystyle \int_1^y (1.5-0.5t) \ dt=\)
\(\left[ 1.5t-0.25t^2 \right]_1^y =\) \((1.5\cdot y-0.25\cdot y^2 )- (1.5\cdot 1-0.25\cdot 1^2 )=\) \(1.5y-0.25y^2-1.25\)
Nu har vi fått fram den formel för \(F(y)\) som gäller för \(1 \leq y \leq 3\).
Hela formeln för \(F(y)\) blir som följer:
\(\displaystyle F(y)=\left\{ \begin{array}{ll} 0, & y<1 \\ 1.5y-0.25y^2-1.25, & 1 \leq y \leq 3 \\ 1, & y > 3 \end{array} \right.\)
7b) Primitiv funktion till f(y) : \(F(y)=1.5y-0.25y^2+C\)
Vad C blir kan bestämmas antingen ur \(F(1)=0\) eller \(F(3)=1\).
T.ex. ger \(F(1)=0\) att \(F(y)=1.5 \cdot 1 -0.25\cdot 1^2+C=0\), vilket ger \(C=-1.25\).
Vi får alltså \(F(y)=1.5y-0.25y^2+(-1.25)=\) \(=1.5y-0.25y^2-1.25\) ; som gäller för \(1 \leq y \leq 3\).
Hela formeln för \(F(y)\) blir som följer:
\(\displaystyle F(y)=\left\{ \begin{array}{ll} 0, & y<1 \\ 1.5y-0.25y^2-1.25, & 1 \leq y \leq 3 \\ 1, & y > 3 \end{array} \right.\)
// add bootstrap table styles to pandoc tables $(document).ready(function () { $('tr.header').parent('thead').parent('table').addClass('table table-condensed'); });