Empiryczna reguła, jak to zastosować, do czego służy, rozwiązane ćwiczenia

1194
David Holt

ZA Zasada empiryczna Jest wynikiem praktycznego doświadczenia i obserwacji prawdziwego życia. Na przykład można dowiedzieć się, które gatunki ptaków można obserwować w określonych miejscach o każdej porze roku i na podstawie tej obserwacji można ustalić „regułę” opisującą cykle życiowe tych ptaków.

W statystyce reguła empiryczna odnosi się do sposobu, w jaki obserwacje są grupowane wokół wartości centralnej, średniej lub średniej, w jednostkach odchylenia standardowego..

Załóżmy, że masz grupę ludzi o średnim wzroście 1,62 metra i odchyleniu standardowym 0,25 metra, wtedy reguła empiryczna pozwoliłaby ci na przykład określić, ile osób będzie w przedziale średniej plus lub minus jeden odchylenie standardowe?

Zgodnie z regułą 68% danych to mniej więcej jedno odchylenie standardowe od średniej, czyli 68% osób w grupie będzie miało wzrost między 1,37 (1,62-0,25) a 1,87 (1,62 + 0,25) metrów.

Indeks artykułów

  • 1 Gdzie jest reguła empiryczna?
    • 1.1 Twierdzenie Czebyszewa
    • 1.2 Rozkład normalny
  • 2 Jak zastosować regułę empiryczną?
  • 3 Jaka jest praktyczna zasada?
  • 4 ćwiczenia rozwiązane
    • 4.1 Króliki w rezerwacie
    • 4.2 Średnia waga dzieci w kraju
  • 5 Referencje

Skąd pochodzi reguła empiryczna?

Reguła empiryczna jest uogólnieniem twierdzenia Czebyszewa i rozkładu normalnego.

Twierdzenie Czebyszewa

Twierdzenie Tchebysheva mówi, że: dla pewnej wartości k> 1 prawdopodobieństwo, że zmienna losowa mieści się między średnią minus k razy odchylenie standardowe, a średnią plus k razy, odchylenie standardowe jest większe lub równe (1 - 1 / kdwa).

Zaletą tego twierdzenia jest to, że dotyczy ono dyskretnych lub ciągłych zmiennych losowych o dowolnym rozkładzie prawdopodobieństwa, ale zdefiniowana na jego podstawie reguła nie zawsze jest bardzo precyzyjna, ponieważ zależy od symetrii rozkładu. Im bardziej wypaczony rozkład zmiennej losowej, tym mniej dostosowany do reguły będzie jej zachowanie.

Reguła empiryczna zdefiniowana na podstawie tego twierdzenia to:

Jeśli k = √2, mówi się, że 50% danych znajduje się w przedziale: [µ - √2 s, µ + √2 s]

Jeśli k = 2, mówi się, że 75% danych jest w przedziale: [µ - 2 s, µ + 2 s]

Jeśli k = 3, mówi się, że 89% danych znajduje się w przedziale: [µ - 3 s, µ + 3 s]

Normalna dystrybucja

Rozkład normalny lub dzwon Gaussa pozwala ustalić regułę empiryczną lub regułę 68 - 95 - 99,7.

Reguła opiera się na prawdopodobieństwie wystąpienia zmiennej losowej w przedziałach między średnią minus jedno, dwa lub trzy odchylenia standardowe a średnią plus jedno, dwa lub trzy odchylenia standardowe..

Reguła empiryczna określa następujące przedziały:

68,27% danych znajduje się w przedziale: [µ - s, µ + s]

95,45% danych znajduje się w przedziale: [µ - 2s, µ + 2s]

99,73% danych znajduje się w przedziale: [µ - 3s, µ + 3s]

Na rysunku można zobaczyć, jak te przedziały są prezentowane i relacje między nimi podczas zwiększania szerokości podstawy wykresu.

Zasada empiryczna. Melikamp [CC BY-SA 4.0 (https://creativecommons.org/)]
Standaryzacja zmiennej losowej, czyli wyrażenie zmiennej losowej w kategoriach zmiennej z lub normalnej standardowej, upraszcza stosowanie reguły empirycznej, ponieważ zmienna z ma średnią równą zero i odchylenie standardowe równe jeden.

Dlatego zastosowanie reguły empirycznej w skali standardowej zmiennej normalnej z definiuje następujące przedziały:

68,27% danych jest w przedziale: [-1, 1]

95,45% danych znajduje się w przedziale: [-2, 2]

99,73% danych znajduje się w przedziale: [-3, 3]

Jak zastosować regułę empiryczną?

Reguła empiryczna pozwala na skrócone obliczenia podczas pracy z rozkładem normalnym.

Załóżmy, że grupa 100 studentów ma średni wiek 23 lata z odchyleniem standardowym wynoszącym 2 lata. Na jakie informacje zezwala reguła empiryczna?

Zastosowanie reguły empirycznej obejmuje następujące kroki:

1- Skonstruuj interwały reguły

Ponieważ średnia wynosi 23, a odchylenie standardowe wynosi 2, to przedziały są następujące:

[µ - s, µ + s] = [23 - 2, 23 + 2] = [21, 25]

[µ - 2s, µ + 2s] = [23 - 2 (2), 23 + 2 (2)] = [19, 27]

[µ - 3 s, µ + 3 s] = [23 - 3 (2), 23 + 3 (2)] = [17, 29]

dwa- Oblicz liczbę uczniów w każdym przedziale zgodnie z wartościami procentowymi

(100) * 68,27% = około 68 uczniów

(100) * 95,45% = około 95 uczniów

(100) * 99,73% = około 100 uczniów

3- Przedziały wiekowe są powiązane z liczbą uczniów i są interpretowane

Co najmniej 68 uczniów jest w wieku od 21 do 25 lat.

Co najmniej 95 uczniów jest w wieku od 19 do 27 lat.

Prawie 100 uczniów ma od 17 do 29 lat.

Jaka jest praktyczna zasada?

Reguła empiryczna to szybki i praktyczny sposób analizy danych statystycznych, który staje się coraz bardziej wiarygodny, gdy rozkład zbliża się do symetrii.

Jego przydatność zależy od dziedziny, w której jest używany i od stawianych pytań. Warto wiedzieć, że wystąpienie wartości trzech odchyleń standardowych poniżej lub powyżej średniej jest prawie mało prawdopodobne, nawet dla zmiennych o rozkładzie innym niż normalny co najmniej 88,8% przypadków znajduje się w przedziale trzech sigma.

W naukach społecznych generalnie rozstrzygającym wynikiem jest przedział średniej plus minus dwa sigma (95%), podczas gdy w fizyce cząstek nowy efekt wymaga interwału pięciu sigma (99,99994%), aby uznać go za odkrycie..

Rozwiązane ćwiczenia

Króliki w rezerwacie

Szacuje się, że w rezerwacie dzikich zwierząt żyje średnio 16 000 królików z odchyleniem standardowym wynoszącym 500 królików. Jeśli rozkład zmiennej „liczba królików w rezerwacie” jest nieznany, czy można oszacować prawdopodobieństwo, że populacja królików będzie wynosić od 15 000 do 17 000 królików?

Interwał można przedstawić w następujący sposób:

15000 = 16000 - 1000 = 16000 - 2 (500) = µ - 2 s

17000 = 16000 + 1000 = 16000 + 2 (500) = µ + 2 s

Dlatego: [15000, 17000] = [µ - 2 s, µ + 2 s]

Stosując twierdzenie Tchebysheva, istnieje prawdopodobieństwo co najmniej 0,75, że populacja królików w rezerwacie zawiera się między 15 000 a 17 000 królików..

Średnia waga dzieci w kraju

Średnia waga rocznych dzieci w kraju rozkłada się normalnie ze średnią 10 kilogramów i odchyleniem standardowym około 1 kilograma.

a) Oszacuj odsetek jednorocznych dzieci w kraju o średniej wadze od 8 do 12 kilogramów.

8 = 10 - 2 = 10 - 2 (1) = µ - 2 s

12 = 10 + 2 = 10 + 2 (1) = µ + 2 s

Dlatego: [8, 12] = [µ - 2s, µ + 2s]

Zgodnie z regułą empiryczną można stwierdzić, że 68,27% jednorocznych dzieci w kraju ma od 8 do 12 kilogramów wagi..

b) Jakie jest prawdopodobieństwo znalezienia jednorocznego dziecka ważącego 7 kilogramów lub mniej?

7 = 10 - 3 = 10 - 3 (1) = µ - 3 s

Wiadomo, że 7 kilogramów wagi to wartość µ - 3s, jak również wiadomo, że 99,73% dzieci ma od 7 do 13 kilogramów wagi. To pozostawia tylko 0,27% wszystkich dzieci na skrajności. Połowa z nich, 0,135%, waży 7 kg lub mniej, a druga połowa, 0,135%, ma 11 kg lub więcej.

Można więc stwierdzić, że istnieje prawdopodobieństwo 0,00135, że dziecko waży 7 kilogramów lub mniej.

c) Jeśli populacja kraju osiągnie 50 milionów mieszkańców, a 1-letnie dzieci stanowią 1% populacji kraju, ile rocznych dzieci waży od 9 do 11 kilogramów?

9 = 10 - 1 = µ - s

11 = 10 + 1 = µ + s

Dlatego: [9, 11] = [µ - s, µ + s]

Zgodnie z regułą empiryczną 68,27% roczniaków w kraju jest w przedziale [µ - s, µ + s]

W kraju jest 500 000 roczniaków (1% z 50 milionów), więc 341 350 dzieci (68,27% z 500 000) waży od 9 do 11 kilogramów.

Bibliografia

  1. Abraira, V. (2002). Odchylenie standardowe i błąd standardowy. Magazyn Semergen. Odzyskany z web.archive.org.
  2. Freund, R.; Wilson, W.; Mohr, D. (2010). Metody statystyczne. Wydanie trzecie. Academic Press-Elsevier Inc..
  3. Serwer Alicante (2017). Reguła empiryczna (terminy statystyczne). Odzyskany z glossaries.servidor-alicante.com.
  4. Lind, D .; Marchal, W.; Wathen, S. (2012). Statystyki stosowane w biznesie i gospodarce. Wydanie piętnaste. McGraw-Hill / Interamericana de México S. A.
  5. Salinas, H. (2010). Statystyki i prawdopodobieństwa. Odzyskane z uda.cl.
  6. Sokal, R .; Rohlf, F. (2009). Wprowadzenie do biostatystyki. Drugie wyd. Publikacje Dover, Inc..
  7. Spiegel, M. (1976). Prawdopodobieństwo i statystyka. Seria Schauma. McGraw-Hill / Interamericana de México S. A.
  8. Spiegel, M .; Stephens, L. (2008). Statystyka. Czwarte wyd. McGraw-Hill / Interamericana de México S. A.
  9. Recenzja Stat119 (2019). Rozwiązywanie empirycznych pytań dotyczących reguł. Odzyskany ze stat119review.com.
  10. (2019). Reguła 68-95-99,7. Odzyskany z en.wikipedia.org.

Jeszcze bez komentarzy