Wzór rozkładu normalnego, charakterystyka, przykład, ćwiczenie

1459
Basil Manning
Wzór rozkładu normalnego, charakterystyka, przykład, ćwiczenie

Plik normalna dystrybucja lub rozkład Gaussa jest rozkładem prawdopodobieństwa w zmiennej ciągłej, w której funkcja gęstości prawdopodobieństwa jest opisana funkcją wykładniczą argumentu kwadratowego i ujemnego, co daje kształt dzwonu.

Nazwa rozkładu normalnego bierze się stąd, że rozkład ten dotyczy największej liczby sytuacji, w których w danej grupie lub populacji występuje jakaś ciągła zmienna losowa..

Rysunek 1. Rozkład normalny N (x; μ, σ) i jego gęstość prawdopodobieństwa f (s; μ, σ). (Opracowanie własne)

Przykłady zastosowania rozkładu normalnego to: wzrost mężczyzn lub kobiet, różnice w mierze wielkości fizycznej lub mierzalnych cech psychologicznych lub socjologicznych, takich jak iloraz intelektualny lub nawyki konsumpcyjne określonego produktu.

Z drugiej strony nazywa się to rozkładem Gaussa lub dzwonem Gaussa, ponieważ to ten niemiecki geniusz matematyczny przypisuje swoje odkrycie za zastosowanie, które podał do opisania błędu statystycznego pomiarów astronomicznych w roku 1800..

Jednak stwierdzono, że ten rozkład statystyczny został wcześniej opublikowany przez innego wielkiego matematyka francuskiego pochodzenia, takiego jak Abraham de Moivre, jeszcze w roku 1733.

Indeks artykułów

  • 1 Formuła
  • 2 Charakterystyka rozkładu normalnego
    • 2.1 Przedziały ufności
  • 3 Zastosowania rozkładu normalnego
  • 4 Przykład
  • 5 Ćwiczenie rozwiązane
  • 6 Odnośniki

Formuła

Do funkcji rozkładu normalnego w zmiennej ciągłej x, z parametrami μ Y σ jest oznaczony przez:

N (x; μ, σ)

i jest to wyraźnie napisane w ten sposób:

N (x; μ, σ) = ∫-∞x f (s; μ, σ) ds

gdzie f (u; μ, σ) jest funkcją gęstości prawdopodobieństwa:

f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- sdwa/ (2σdwa))

Stała, która mnoży funkcję wykładniczą w funkcji gęstości prawdopodobieństwa, nazywana jest stałą normalizacyjną i została wybrana w taki sposób, że:

N (+ ∞, μ, σ) = 1

Poprzednie wyrażenie zapewnia, że ​​prawdopodobieństwo, że zmienna losowa x wynosi od -∞ do + ∞ wynosi 1, czyli 100% prawdopodobieństwa.

Parametr μ jest średnią arytmetyczną ciągłej zmiennej losowej x y σ odchylenie standardowe lub pierwiastek kwadratowy z wariancji tej samej zmiennej. W zdarzeniu w którym μ = 0 Y σ = 1 mamy wtedy standardowy rozkład normalny lub typowy rozkład normalny: 

N (x; μ = 0, σ = 1)

Charakterystyka rozkładu normalnego

1- Jeśli losowa zmienna statystyczna ma rozkład normalny gęstości prawdopodobieństwa f (s; μ, σ), większość danych skupia się wokół średniej wartości μ i są rozproszone wokół niego w taki sposób, że pomiędzy nimi znajduje się nieco ponad ⅔ danych μ - σ Y μ + σ

2- Odchylenie standardowe σ to jest zawsze pozytywne.

3- Postać funkcji gęstości fa przypomina dzwonek, dlatego funkcja ta jest często nazywana dzwonkiem Gaussa lub funkcją Gaussa. 

4- W rozkładzie Gaussa średnia, mediana i tryb pokrywają się.

5- Punkty przegięcia funkcji gęstości prawdopodobieństwa znajdują się dokładnie w μ - σ Y μ + σ.

6- Funkcja f jest symetryczna względem osi, która przechodzi przez jej wartość średnią μ y ma asymptotycznie zero dla x ⟶ + ∞ i x ⟶ -∞.

7- Im wyższa wartość σ większa dyspersja, szum lub odległość danych wokół średniej wartości. To znaczy do większego σ kształt dzwonu jest bardziej otwarty. Zamiast σ mała oznacza, że ​​kostki są ciasne do środka, a kształt dzwonka jest bardziej zamknięty lub spiczasty.

8- Funkcja dystrybucji N (x; μ, σ) wskazuje prawdopodobieństwo, że zmienna losowa jest mniejsza lub równa x. Na przykład na rysunku 1 (powyżej) prawdopodobieństwo P, że zmienna x jest mniejsza lub równa 1,5 wynosi 84% i odpowiada obszarowi pod funkcją gęstości prawdopodobieństwa f (x; μ, σ) od -∞ do x.

Przedziały ufności

9- Jeśli dane mają rozkład normalny, to 68,26% z nich jest pomiędzy μ - σ Y μ + σ.

10-95,44% danych, które mają rozkład normalny, znajduje się pomiędzy μ - 2σ Y μ + 2σ.

11–99,74% danych, które mają rozkład normalny, znajduje się pomiędzy μ - 3σ Y μ + 3σ.

12- Jeśli zmienna losowa x podążaj za dystrybucją N (x; μ, σ), potem zmienna

z = (x - μ) / σ  jest zgodny ze standardowym rozkładem normalnym  N (z, 0,1).

Zmiana zmiennej x do z Nazywa się to standaryzacją lub typowaniem i jest bardzo przydatne przy stosowaniu tabel rozkładu standardowego do danych, które są zgodne z niestandardowym rozkładem normalnym..

Zastosowania rozkładu normalnego

Aby zastosować rozkład normalny, należy przejść przez obliczenie całki gęstości prawdopodobieństwa, co z analitycznego punktu widzenia nie jest łatwe i nie zawsze istnieje program komputerowy, który pozwala na jej numeryczne obliczenie. W tym celu wykorzystuje się tabele wartości znormalizowanych lub znormalizowanych, co jest niczym innym jak rozkładem normalnym w tym przypadku μ = 0 i σ = 1.

Tabela ujednoliconego rozkładu normalnego (część 1/2)
Znormalizowana tabela rozkładu normalnego (część 2/2)

Należy zauważyć, że te tabele nie zawierają wartości ujemnych. Jednak wykorzystując właściwości symetrii funkcji gęstości prawdopodobieństwa Gaussa, można otrzymać odpowiednie wartości. W rozwiązanym ćwiczeniu pokazanym poniżej wskazano użycie tabeli w tych przypadkach.

Przykład

Załóżmy, że masz zestaw losowych danych x, które mają rozkład normalny o średniej 10 i odchyleniu standardowym 2. Zostaniesz poproszony o znalezienie prawdopodobieństwa, że:

a) Zmienna losowa x jest mniejsza lub równa 8.

b) jest mniejsze lub równe 10.

c) że zmienna x jest poniżej 12.

d) Prawdopodobieństwo, że wartość x zawiera się między 8 a 12.

Rozwiązanie:

a) Aby odpowiedzieć na pierwsze pytanie, wystarczy obliczyć:

N (x; μ, σ)

Z x = 8, μ = 10 Y σ = 2. Zdajemy sobie sprawę, że jest to całka, która nie ma rozwiązania analitycznego w funkcjach elementarnych, ale rozwiązanie jest wyrażone jako funkcja funkcji błędu erf (x).

Z drugiej strony istnieje możliwość rozwiązania całki w postaci numerycznej, co robi wiele kalkulatorów, arkuszy kalkulacyjnych i programów komputerowych, takich jak GeoGebra. Poniższy rysunek przedstawia rozwiązanie numeryczne odpowiadające pierwszemu przypadkowi:

Rysunek 2. Gęstość prawdopodobieństwa f (x; μ, σ). Zacieniowany obszar przedstawia P (x ≤ 8). (Opracowanie własne)

a odpowiedź brzmi, że prawdopodobieństwo, że x jest poniżej 8, wynosi:

P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587

b) W tym przypadku staramy się znaleźć prawdopodobieństwo, że zmienna losowa x jest poniżej średniej, która w tym przypadku jest warta 10. Odpowiedź nie wymaga żadnych obliczeń, ponieważ wiemy, że połowa danych jest poniżej średniej i druga połowa powyżej średniej. Dlatego odpowiedź brzmi:

P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5

c) Aby odpowiedzieć na to pytanie, musisz obliczyć N (x = 12; μ = 10, σ = 2), Można to zrobić za pomocą kalkulatora z funkcjami statystycznymi lub oprogramowania takiego jak GeoGebra:

Rysunek 3. Gęstość prawdopodobieństwa f (x; μ, σ). Zacieniowany obszar przedstawia P (x ≤ 12). (Opracowanie własne)

Odpowiedź na część c można zobaczyć na rysunku 3 i jest ona następująca:

P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.

d) Aby znaleźć prawdopodobieństwo, że zmienna losowa x zawiera się w przedziale od 8 do 12, możemy użyć wyników części a i c w następujący sposób:

P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.

Ćwiczenie rozwiązane

Średnia cena akcji firmy wynosi 25 USD z odchyleniem standardowym 4 USD. Określ prawdopodobieństwo, że:

a) Akcja kosztuje mniej niż 20 $.

b) To ma koszt większy niż 30 USD.

c) Cena wynosi od 20 do 30 USD.

Użyj standardowych tabel rozkładu normalnego, aby znaleźć odpowiedzi.

Rozwiązanie:

Aby skorzystać z tabel, konieczne jest przekazanie do znormalizowanej lub typizowanej zmiennej z:

20 dolarów w znormalizowanej zmiennej równa się z = (20 $ - 25 $) / 4 $ = -5/4 = -1,25 i 

30 dolarów w znormalizowanej zmiennej równa się z = (30 $ - 25 $) / 4 USD = +5/4 = +1,25.

a) 20 $ równa się -1,25 w zmiennej znormalizowanej, ale w tabeli nie ma wartości ujemnych, dlatego umieszczamy wartość +1,25, co daje wartość 0,8944.

Jeśli od tej wartości odejmie się 0,5, wynikiem będzie obszar między 0 a 1,25, który, nawiasem mówiąc, jest identyczny (przez symetrię) z polem między -1,25 a 0. Wynik odejmowania to 0,8944 - 0,5 = 0,3944 czyli obszar między -1,25 a 0.

Ale interesujący jest obszar od -∞ do -1,25, który wyniesie 0,5 - 0,3944 = 0,1056. W związku z tym stwierdza się, że prawdopodobieństwo, że cena akcji spadnie poniżej 20 USD, wynosi 10,56%.

b) 30 $ w zmiennej typizowanej z wynosi 1,25. Dla tej wartości w tabeli pojawia się liczba 0,8944, która odpowiada obszarowi od -∞ do +1,25. Obszar między +1,25 a + ∞ wynosi (1 - 0,8944) = 0,1056. Oznacza to, że prawdopodobieństwo, że akcja kosztuje więcej niż 30 USD, wynosi 10,56%.

c) Prawdopodobieństwo, że działanie ma koszt od 20 do 30 USD, będzie obliczane w następujący sposób:

100% -10,56% - 10,56% = 78,88%

Bibliografia

  1. Statystyka i prawdopodobieństwo. Normalna dystrybucja. Odzyskany z: projectdescartes.org
  2. Geogebra. Klasyczna geogebra, rachunek prawdopodobieństwa. Odzyskany z geogebra.org
  3. MathWorks. Rozkład Gaussa. Odzyskany z: es.mathworks.com
  4. Mendenhall, W. 1981. Statystyka zarządzania i ekonomii. 3. wydanie. Grupo Editorial Iberoamérica.
  5. Stat Trek. Naucz się statystyk. Rozkład Poissona. Odzyskany z: stattrek.com,
  6. Triola, M. 2012. Statystyka elementarna. 11th. Ed. Pearson Education.
  7. Uniwersytet w Vigo. Główne rozkłady ciągłe. Odzyskany z: anapg.webs.uvigo.es
  8. Wikipedia. Normalna dystrybucja. Odzyskane z: es.wikipedia.org

Jeszcze bez komentarzy