Miary tendencji centralnej dla formuł danych zgrupowanych, ćwiczenia

3581
Basil Manning
Miary tendencji centralnej dla formuł danych zgrupowanych, ćwiczenia

Plik miary trendów centralny wskazują wartość, wokół której znajdują się dane rozkładu. Najbardziej znana jest średnia lub średnia arytmetyczna, która polega na dodaniu wszystkich wartości i podzieleniu wyniku przez całkowitą liczbę danych.

Jeśli jednak rozkład składa się z dużej liczby wartości i nie są one przedstawione w uporządkowany sposób, nie jest łatwo wykonać niezbędne obliczenia w celu wyodrębnienia cennych informacji, które zawierają..

Rysunek 1. Miary tendencji centralnej dla danych grupowanych są dobrym wskaźnikiem ogólnego zachowania danych

Dlatego są pogrupowane w klasy lub kategorie, aby opracować plik dystrybucja częstotliwości. Dokonując tego poprzedniego uporządkowania danych, łatwiej jest wtedy obliczyć miary tendencji centralnej, wśród których są:

-Pół

-Mediana

-moda

-Średnia geometryczna

-Średnia harmoniczna

Formuły

Oto wzory na miary tendencji centralnej dla zgrupowanych danych:

Średnia arytmetyczna

Średnia jest najczęściej używana do charakteryzowania danych ilościowych (wartości liczbowych), chociaż jest dość wrażliwa na skrajne wartości rozkładu. Oblicza się go według:

Z:

-X: średnia lub średnia arytmetyczna

-faja: częstotliwość klasy

-mja: ocena klasy

-g: liczba klas

-n: dane ogółem

Mediana

Aby to obliczyć, należy znaleźć przedział zawierający obserwację n / 2 i dokonać interpolacji w celu określenia wartości liczbowej tej obserwacji, korzystając z następującego wzoru:

Gdzie:

-c: szerokość przedziału, do którego należy mediana

-bM: dolna granica wspomnianego przedziału

-fam: liczba obserwacji zawartych w przedziale

-n / 2: suma danych podzielona przez 2.

-faBM: liczba obserwacji przed przedziału zawierającego medianę.

Dlatego mediana jest miarą pozycji, to znaczy dzieli zbiór danych na dwie części. Można je również zdefiniować kwartyle, decylach Y percentyle, które dzielą dystrybucję odpowiednio na cztery, dziesięć i sto części.

moda

W zebranych danych przeszukiwana jest klasa lub kategoria, która zawiera najwięcej obserwacji. To jest klasa modalna. Dystrybucja może mieć dwa lub więcej trybów, w którym to przypadku jest nazywana bimodalny Y multimodalny, odpowiednio.

Możesz również obliczyć modę w zgrupowanych danych, korzystając z równania:

Z:

-L1: dolna granica klasy, w której znajduje się tryb

1: odejmij między częstotliwością klasy modalnej a częstotliwością klasy, która ją poprzedza.

dwa: odejmij między częstotliwością klasy modalnej a częstotliwością następnej klasy.

-c: szerokość interwału zawierającego modę

Średnia harmoniczna

Średnia harmoniczna jest oznaczona przez H. Kiedy masz zbiór n wartości x1, xdwa, x3…, Średnia harmoniczna jest odwrotnością lub odwrotnością średniej arytmetycznej odwrotności wartości.

Łatwiej to zobaczyć dzięki formule:

Mając dostępne zgrupowane dane, wyrażenie staje się:

Gdzie:

-H: średnia harmoniczna

-faja: częstotliwość klasy

-mja: ocena klasy

-g: liczba klas

-N = f1 + fadwa + fa3 +...

Średnia geometryczna

Jeśli oni mają n liczby dodatnie x1, xdwa, x3…, Jego średnią geometryczną G oblicza się z n-tego pierwiastka iloczynu wszystkich liczb:

W przypadku danych zgrupowanych można wykazać, że logarytm dziesiętny ze średniej geometrycznej log G jest wyrażony wzorem:

Gdzie:

-G: średnia geometryczna

-faja: częstotliwość klasy

-mja: ocena klasy

-g: liczba zajęć

-N = f1 + fadwa + fa3 +...

Związek między H, G i X

Zawsze jest prawdą, że:

H ≤ G ≤ X

Najczęściej używane definicje

Aby znaleźć wartości opisane we wzorach powyżej, wymagane są następujące definicje:

Częstotliwość

Częstotliwość definiuje się jako liczbę powtórzeń danych.

Ranga

Jest to różnica między najwyższymi i najniższymi wartościami występującymi w rozkładzie.

Liczba zajęć

Aby wiedzieć, w ilu klasach grupujemy dane, posługujemy się pewnymi kryteriami, na przykład:

Limity

Nazywa się skrajne wartości każdej klasy lub przedziału limity a każda klasa może mieć zarówno dobrze zdefiniowane limity, w którym to przypadku ma dolną, jak i wyższą granicę. Lub może mieć otwarte limity, gdy podany jest zakres, na przykład wartości większe lub mniejsze od określonej liczby.

Znak klasy

Składa się po prostu z punktu środkowego przedziału i jest obliczany poprzez uśrednienie górnej i dolnej granicy.

Szerokość szczeliny

Dane można pogrupować w klasy o równej lub różnej wielkości, jest to szerokość lub szerokość. Pierwsza opcja jest najczęściej używana, ponieważ znacznie ułatwia obliczenia, chociaż w niektórych przypadkach konieczne jest, aby klasy miały różne szerokości.

Szerokość do Odstęp można określić za pomocą następującego wzoru:

c = Zakres / Ndo

Gdziedo to liczba klas.

Ćwiczenie rozwiązane

Poniżej mamy serię pomiarów prędkości w km / h, wykonanych za pomocą radaru, które odpowiadają 50 samochodom przejeżdżającym przez ulicę w danym mieście:

Rysunek 2. Tabela rozwiązanego ćwiczenia. Źródło: F. Zapata.

Rozwiązanie

Prezentowane w ten sposób dane nie są uporządkowane, dlatego pierwszym krokiem jest pogrupowanie ich w klasy.

Kroki grupowania danych i tworzenia tabeli

Krok 1

Znajdź zakres R:

R = (52-16) km / h = 36 km / h

Krok 2

Wybierz liczbę klas Ndo, według podanych kryteriów. Ponieważ danych jest 50, możemy wybrać Ndo = 6.

Krok 3

Oblicz szerokość do przedziału:

c = Zakres / Ndo = 36/6 = 6

Krok 4

Klasy formularzy i dane grupowe w następujący sposób: dla pierwszej klasy jako dolną granicę przyjmuje się wartość nieco mniejszą od najniższej wartości obecnej w tabeli, a następnie do tej wartości dodaje się obliczoną wcześniej wartość c = 6, a zatem uzyskuje górną granicę pierwszej klasy.

Postępujemy w ten sam sposób, aby zbudować pozostałe klasy, jak pokazano w poniższej tabeli:

Każdej częstotliwości odpowiada kolor na rysunku 2, w ten sposób zapewnia się, że żadna wartość nie ucieknie przed policzeniem..

Obliczanie średniej

X = (5 x 18,5 + 25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h

Obliczenie mediany

Mediana znajduje się w klasie 2 tabeli, ponieważ istnieje pierwsze 30 danych rozkładu.

-Szerokość przedziału, do którego należy mediana: c = 6

-Dolna granica przedziału, w którym mediana wynosi: BM = 22,0 km / h

-Liczba obserwacji, które zawiera przedział fm = 25

-Łączne dane podzielone przez 2: 50/2 = 25

-Liczba obserwacji przed przedziału zawierającego medianę: fBM = 5

A operacja to:

Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h

Obliczanie mody

Moda jest również w klasie 2:

-Szerokość interwału: c = 6

-Dolna granica klasy, w której znaleziono modę: L1 = 22,0

-Odejmij od częstotliwości klasy modalnej i częstotliwości klasy, która ją poprzedza: Δ1 = 25-5 = 20

-Odejmij między częstotliwością klasy modalnej a częstotliwością następnej klasy: Δdwa = 25 - 10 = 15

Z tymi danymi operacja jest:

Tryb = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h

Obliczanie średniej geometrycznej

N = f1 + fadwa + fa3 +… = 50

log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =

log G = 1,44916053

G = 28,13 km / h

Obliczanie średniej harmonicznej

1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366

H = 27,32 km / h

Podsumowanie miar tendencji centralnej

Jednostkami zmiennych są km / h:

-Średnia: 29.03.2020

-Mediana: 26,80

-Moda: 25,40

-Średnia geometryczna: 28,13

-Średnia harmoniczna: 27,32

Bibliografia

  1. Berenson, M. 1985. Statystyka zarządzania i ekonomii. Interamericana S.A.
  2. Canavos, G. 1988. Prawdopodobieństwo i statystyka: zastosowania i metody. Mcgraw hill.
  3. Devore, J. 2012. Prawdopodobieństwo i statystyka dla inżynierii i nauki. 8th. Wydanie. Cengage.
  4. Levin, R. 1988. Statystyka dla administratorów. 2nd. Wydanie. Sala Prentice.
  5. Spiegel, M. 2009. Statystyka. Seria Schauma. 4 Wydanie. Mcgraw hill.
  6. Traktowanie danych zgrupowanych. Odzyskany z: itchihuahua.edu.mx.
  7. Walpole, R. 2007. Prawdopodobieństwo i statystyka dla inżynierii i nauk. osoba.

Jeszcze bez komentarzy