Fördelningsfunktion (borde varit med i Kap 3.2)
Detta avsnitt finns i kursboken presenterat först i samband med kontinuerliga slumpvariabler; i början av Kap 4.2, men kan med fördel läsas redan här i kapitel 3. Fördelningsfunktion definieras på samma sätt för diskreta och kontinuerliga slumpvariabler.
Ett alternativ till att använda funktionen p(y) för att beskriva sannolikhetsfördelningen (den som även kallas pdf )
är att använda fördelningsfunktionen som betecknas F(y).
Ett annat namn är kumulativ fördelningsfunktion, och en ofta använd beteckning är cdf. (cumulative distribution function)
(Definieras i kursboken först i kap 4)
Definition
\(F(y)= P(Y \leq y)\)
Exempel
Vi har en slumpvariabel \(Y\) med följande sannolikhetsfördelning.
\(y\) | \(p(y)\) |
---|---|
2 | 0.25 |
4 | 0.50 |
6 | 0.25 |
Då blir t.ex. \(F(4)= P(Y \leq 4)=p(2)+p(4)=0.75\)
Vi kan lägga till en kolumn för fördelningsfunktionen i tabellen:
\(y\) | \(p(y)\) | \(F(y)\) |
---|---|---|
2 | 0.25 | 0.25 |
4 | 0.50 | 0.75 |
6 | 0.25 | 1.00 |
Fördelningsfunktionen som en kontinuerlig funktion
Det går att utvidga beskrivningen av fördelningsfunktionen i tabellen ovan, så att den är definierad som en kontinuerlig funktion; såhär:
\(\displaystyle F(y)=\left\{ \begin{array}{ll} 0, & y<2 \\ 0.25, & 2 \leq y < 4 \\ 0.75, & 4 \leq y < 6 \\ 1, & y \geq 6 \end{array} \right.\)
Att denna beskrivning fungerar kanske är lättast att se om man tittar på några exempel:
F(-1.3)
Enligt ovan och grafen nedan blir \(F(-1.3)=0\)
Innebörden i \(F(-1.3)\) är ju \(P(Y \leq -1.3)\)
Sannolikheten att slumpvariabeln Y antar något värde som är mindre än eller likamed -1.3 är noll. Det beror ju på att Y bara kan anta värdena 2,4 och 6, och alltså aldrig så lågt som -1.3.
F(3.99)
Enligt ovan och grafen nedan blir \(F(3.99)=0.25\)
Innebörden i \(F(3.99)\) är ju \(P(Y \leq 3.99)\)
Det enda möjliga värde på slumpvariabeln Y som är mindre än eller likamed 3.99 är värdet 2. Därför blir \(F(3.99)= P(Y \leq 3.99)=p(2)=0.25\)
F(7.6)
Enligt ovan och grafen nedan blir \(F(7.6)=1\)
Innebörden i \(F(7.6)\) är ju \(P(Y \leq 7.6)\)
Slumpvariabeln Y antar alltid något värde som är mindre än eller likamed 7.6. Det beror ju på att Y bara kan anta värdena 2,4 och 6. Därför blir \(F(7.6)= P(Y \leq 7.6)=p(2)+p(4)+p(6)=1\)
(Anm. Om en händelse har sannolikheten 1 är det detsamma som att händelsen alltid inträffar)
Graf för fördelningsfunktion
Med den utvidgade definitionen ser grafen för F(y) ut såhär:
Användning av fördelningsfunktioner i tabellsamling
När man gör tabeller för att beskriva sannolikhetsfördelningar, använder man för det mesta fördelningsfunktionen (cdf) \(F(y)\).
Vi återkommer till hur vi kan använda sådana tabeller, i samband med Binomialfördelningen (kap 3.4) och Poissonfördelningen (kap 3.8).
// add bootstrap table styles to pandoc tables $(document).ready(function () { $('tr.header').parent('thead').parent('table').addClass('table table-condensed'); });