Plik Rozkład Poissona jest dyskretnym rozkładem prawdopodobieństwa, dzięki któremu można poznać prawdopodobieństwo, że w dużej próbie iw pewnym przedziale wystąpi zdarzenie, którego prawdopodobieństwo jest małe.
Często rozkład Poissona można zastąpić rozkładem dwumianowym, o ile spełnione są następujące warunki: duża próbka i małe prawdopodobieństwo.
Siméon-Denis Poisson (1781-1840) stworzył tę dystrybucję noszącą jego imię, bardzo przydatną, jeśli chodzi o nieprzewidywalne wydarzenia. Poisson opublikował swoje wyniki w 1837 roku, pracę badawczą nad prawdopodobieństwem wystąpienia błędnych wyroków karnych.
Później inni badacze dostosowali rozkład w innych obszarach, na przykład liczbę gwiazd, które można znaleźć w określonej objętości przestrzeni lub prawdopodobieństwo, że żołnierz zginął od kopnięcia konia.
Indeks artykułów
Matematyczna postać rozkładu Poissona jest następująca:
- μ (czasami oznaczane jako λ) jest średnią lub parametrem rozkładu
- Numer Eulera: e = 2,71828
- Prawdopodobieństwo uzyskania y = k wynosi P
- k to liczba sukcesów 0, 1,2,3 ...
- n to liczba testów lub zdarzeń (wielkość próby)
Dyskretne zmienne losowe, jak wskazuje ich nazwa, zależą od przypadku i przyjmują tylko dyskretne wartości: 0, 1, 2, 3, 4 ..., k.
Średni rozkład jest określony przez:
Wariancja σ, która mierzy rozprzestrzenianie się danych, jest kolejnym ważnym parametrem. Dla rozkładu Poissona jest to:
σ = μ
Poisson ustalił, że gdy n → ∞ i p → 0, to średnia μ - nazywana jest również wartość oczekiwana- ma tendencję do stałej:
μ → stała
Ważny: p jest prawdopodobieństwem wystąpienia zdarzenia przy uwzględnieniu całej populacji, natomiast P (y) jest prognozą Poissona na próbce.
Rozkład Poissona ma następujące właściwości:
-Wielkość próby jest duża: n → ∞.
-Rozważane zdarzenia lub zdarzenia są od siebie niezależne i występują losowo.
-Prawdopodobieństwo P. to pewne wydarzenie Y występuje w określonym czasie jest bardzo mała: P → 0.
-Prawdopodobieństwo, że w przedziale czasu wystąpi więcej niż jedno zdarzenie, wynosi 0.
-Średnia wartość przybliża stałą określoną wzorem: μ = n.p (n to wielkość próby)
-Ponieważ dyspersja σ jest równa μ, ponieważ przyjmuje większe wartości, zmienność również staje się większa.
-Zdarzenia muszą być równomiernie rozłożone w stosowanym przedziale czasowym.
-Zbiór możliwych wartości zdarzeń Y jest: 0,1,2,3,4 ... .
-Suma ja zmienne, które są zgodne z rozkładem Poissona, to także kolejna zmienna Poissona. Jego średnia wartość jest sumą średnich wartości tych zmiennych.
Rozkład Poissona różni się od rozkładu dwumianowego na następujące ważne sposoby:
-Na rozkład dwumianowy wpływa zarówno wielkość próby n, jak i prawdopodobieństwo P., ale na rozkład Poissona ma wpływ tylko średnia μ.
-W rozkładzie dwumianowym możliwe wartości zmiennej losowej Y wynoszą 0, 1, 2,…, N, z drugiej strony w rozkładzie Poissona nie ma górnej granicy dla tych wartości.
Poisson początkowo zastosował swoją słynną dystrybucję do spraw sądowych, ale na poziomie przemysłowym jednym z jego najwcześniejszych zastosowań była produkcja piwa. W tym procesie do fermentacji wykorzystywane są kultury drożdży.
Drożdże składają się z żywych komórek, których populacja jest zmienna w czasie. Przy produkcji piwa konieczne jest dodanie niezbędnej ilości, dlatego konieczne jest poznanie ilości komórek przypadających na jednostkę objętości.
Podczas II wojny światowej rozkład Poissona został wykorzystany, aby dowiedzieć się, czy Niemcy faktycznie celowali w Londyn z Calais, czy po prostu strzelali losowo. Było to ważne dla aliantów, aby określić, jak dobra technologia była dostępna dla nazistów..
Zastosowania rozkładu Poissona zawsze odnoszą się do zliczeń w czasie lub zliczeń w przestrzeni. A ponieważ prawdopodobieństwo wystąpienia jest niewielkie, nazywane jest również „prawem rzadkich zdarzeń”.
Oto lista wydarzeń, które należą do jednej z tych kategorii:
-Zapis cząstek w rozpadzie radioaktywnym, który podobnie jak wzrost komórek drożdży, jest funkcją wykładniczą.
-Liczba odwiedzin określonej witryny internetowej.
-Przybycie osób w kolejce, aby zapłacić lub uczestniczyć w kolejce (teoria kolejki).
-Liczba samochodów, które przejeżdżają przez określony punkt na drodze w określonym przedziale czasu.
-Mutacje w określonej nici DNA po ekspozycji na promieniowanie.
-Liczba meteorytów o średnicy większej niż 1 m spadła w ciągu roku.
-Wady na metr kwadratowy tkaniny.
-Liczba krwinek w 1 centymetrze sześciennym.
-Połączenia na minutę z centralą telefoniczną.
-Kawałki czekolady obecne w 1 kg ciasta.
-Liczba drzew porażonych przez danego pasożyta na 1 hektarze lasu.
Zwróć uwagę, że te zmienne losowe przedstawiają, ile razy zdarzenie ma miejsce w ustalonym okresie czasu (połączeń na minutę do centrali telefonicznej) lub dany region przestrzeni (wady tkaniny na metr kwadratowy).
Zdarzenia te, jak już ustalono, są niezależne od czasu, który minął od ich ostatniego zdarzenia..
Rozkład Poissona jest dobrym przybliżeniem do rozkładu dwumianowego, o ile:
-Wielkość próby jest duża: n ≥ 100
-Prawdopodobieństwo p jest mało: p ≤ 0,1
- μ jest w kolejności: np ≤ 10
W takich przypadkach rozkład Poissona jest doskonałym narzędziem, ponieważ w takich przypadkach rozkład dwumianowy może być trudny do zastosowania..
Badanie sejsmologiczne wykazało, że w ciągu ostatnich 100 lat na świecie miały miejsce 93 duże trzęsienia ziemi, co najmniej 6,0 w skali Richtera - logarytmicznej -. Załóżmy, że w tym przypadku odpowiednim modelem jest rozkład Poissona. Odnaleźć:
a) Średnie występowanie dużych trzęsień ziemi w ciągu roku.
b) Tak P (y) to prawdopodobieństwo wystąpienia Y trzęsienia ziemi w losowo wybranym roku, znajdź następujące prawdopodobieństwa:
P.(0), P.(1), P. (dwa), P. (3), P. (4), P. (5), P. (6) i P. (7).
c) Prawdziwe wyniki badania są następujące:
- 47 lat (0 trzęsień ziemi)
- 31 lat (1 trzęsienia ziemi)
- 13 lat (2 trzęsienia ziemi)
- 5 lat (3 trzęsienia ziemi)
- 2 lata (4 trzęsienia ziemi)
- 0 lat (5 trzęsień ziemi)
- 1 rok (6 trzęsień ziemi)
- 1 rok (7 trzęsień ziemi)
Jak te wyniki wypadają w porównaniu z wynikami uzyskanymi w części b? Czy rozkład Poissona jest dobrym wyborem do modelowania tych zdarzeń?
a) Trzęsienia ziemi to zdarzenia, których prawdopodobieństwo p jest mały i rozważamy ograniczony okres jednego roku. Średnia liczba trzęsień ziemi to:
μ = 93/100 trzęsień ziemi / rok = 0,93 trzęsień ziemi rocznie.
b) Aby obliczyć żądane prawdopodobieństwa, podstawiamy wartości we wzorze podanym na początku:
y = 2
μ = 0,93
e = 2,71828
Jest to znacznie mniej niż P (2).
Wyniki przedstawiono poniżej:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Na przykład możemy powiedzieć, że istnieje 39,5% prawdopodobieństwo, że w danym roku nie wystąpi żadne większe trzęsienie ziemi. Albo że jest 5,29% z 3 dużych trzęsień ziemi występujących w tym roku.
c) Częstotliwości są analizowane, mnożąc przez n = 100 lat:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 i 0,00471.
Na przykład:
- Częstotliwość 39,5 wskazuje, że w ciągu 39,5 na 100 lat wystąpiło 0 dużych trzęsień ziemi, możemy powiedzieć, że jest to bardzo zbliżone do rzeczywistego wyniku 47 lat bez żadnego poważnego trzęsienia ziemi..
Porównajmy inny wynik Poissona z rzeczywistymi wynikami:
- Uzyskana wartość 36,7 oznacza, że w okresie 37 lat miało miejsce 1 wielkie trzęsienie ziemi. Rzeczywisty wynik jest taki, że w ciągu 31 lat miało miejsce 1 duże trzęsienie ziemi, co jest dobrym wynikiem zgodnym z modelem.
- Spodziewane jest 17,1 roku z 2 dużymi trzęsieniami ziemi i wiadomo, że w ciągu 13 lat, co jest wartością bliską, rzeczywiście miały miejsce 2 duże trzęsienia ziemi.
Dlatego model Poissona jest akceptowalny w tym przypadku.
Jedna firma szacuje, że liczba komponentów, które ulegają awarii przed osiągnięciem 100 godzin pracy, jest zgodna z rozkładem Poissona. Jeśli średnia liczba awarii w tym czasie wynosi 8, znajdź następujące prawdopodobieństwa:
a) że element ulegnie awarii w ciągu 25 godzin.
b) Awaria mniej niż dwóch elementów w ciągu 50 godzin.
c) Awaria co najmniej trzech elementów w ciągu 125 godzin.
a) Wiadomo, że średnia awarii na 100 godzin wynosi 8, dlatego w ciągu 25 godzin spodziewana jest jedna czwarta awarii, czyli 2 awarie. To będzie parametr μ.
Prawdopodobieństwo awarii 1 składnika jest wymagane, zmienną losową jest „komponenty, które uległy awarii przed 25 godzinami”, a jej wartość wynosi y = 1. Podstawiając w funkcji prawdopodobieństwa:
Powstaje jednak pytanie, na ile prawdopodobne jest, że zawiodą mniej niż dwa składniki za 50 godzin, a nie że dokładnie 2 komponenty zawodzą w 50 godzin, dlatego musimy dodać prawdopodobieństwa, że:
-Żaden nie zawodzi
-Tylko porażka 1
P (mniej niż 2 elementy uległy awarii) = P (0) + P (1)
P (mniej niż 2 elementy uległy awarii) = 0,0183 + 0,0732 = 0.0915
c) Że zawodzą przynajmniej 3 komponenty w 125 godzin, co oznacza, że 3, 4, 5 lub więcej może zawieść w tym czasie.
Prawdopodobieństwo, że to nastąpi przynajmniej jedno z kilku zdarzeń jest równe 1 minus prawdopodobieństwo, że żadne ze zdarzeń nie nastąpi.
-Pożądanym zdarzeniem jest to, że co najmniej 3 komponenty ulegną awarii w ciągu 125 godzin
-Jeśli zdarzenie nie wystąpi, oznacza to, że mniej niż 3 składowe zawodzą, a prawdopodobieństwo tego wynosi: P (0) + P (1) + P (2)
Parametr μ rozkładu w tym przypadku to:
μ = 8 + 2 = 10 awarii w ciągu 125 godzin.
P (3 lub więcej elementów uległo awarii) = 1 - P (0) - P (1) - P (2) =
Jeszcze bez komentarzy