Plik miary trendów centralny wskazują wartość, wokół której znajdują się dane rozkładu. Najbardziej znana jest średnia lub średnia arytmetyczna, która polega na dodaniu wszystkich wartości i podzieleniu wyniku przez całkowitą liczbę danych.
Jeśli jednak rozkład składa się z dużej liczby wartości i nie są one przedstawione w uporządkowany sposób, nie jest łatwo wykonać niezbędne obliczenia w celu wyodrębnienia cennych informacji, które zawierają..
Dlatego są pogrupowane w klasy lub kategorie, aby opracować plik dystrybucja częstotliwości. Dokonując tego poprzedniego uporządkowania danych, łatwiej jest wtedy obliczyć miary tendencji centralnej, wśród których są:
-Pół
-Mediana
-moda
-Średnia geometryczna
-Średnia harmoniczna
Oto wzory na miary tendencji centralnej dla zgrupowanych danych:
Średnia jest najczęściej używana do charakteryzowania danych ilościowych (wartości liczbowych), chociaż jest dość wrażliwa na skrajne wartości rozkładu. Oblicza się go według:
Z:
-X: średnia lub średnia arytmetyczna
-faja: częstotliwość klasy
-mja: ocena klasy
-g: liczba klas
-n: dane ogółem
Aby to obliczyć, należy znaleźć przedział zawierający obserwację n / 2 i dokonać interpolacji w celu określenia wartości liczbowej tej obserwacji, korzystając z następującego wzoru:
Gdzie:
-c: szerokość przedziału, do którego należy mediana
-bM: dolna granica wspomnianego przedziału
-fam: liczba obserwacji zawartych w przedziale
-n / 2: suma danych podzielona przez 2.
-faBM: liczba obserwacji przed przedziału zawierającego medianę.
Dlatego mediana jest miarą pozycji, to znaczy dzieli zbiór danych na dwie części. Można je również zdefiniować kwartyle, decylach Y percentyle, które dzielą dystrybucję odpowiednio na cztery, dziesięć i sto części.
W zebranych danych przeszukiwana jest klasa lub kategoria, która zawiera najwięcej obserwacji. To jest klasa modalna. Dystrybucja może mieć dwa lub więcej trybów, w którym to przypadku jest nazywana bimodalny Y multimodalny, odpowiednio.
Możesz również obliczyć modę w zgrupowanych danych, korzystając z równania:
Z:
-L1: dolna granica klasy, w której znajduje się tryb
-Δ1: odejmij między częstotliwością klasy modalnej a częstotliwością klasy, która ją poprzedza.
-Δdwa: odejmij między częstotliwością klasy modalnej a częstotliwością następnej klasy.
-c: szerokość interwału zawierającego modę
Średnia harmoniczna jest oznaczona przez H. Kiedy masz zbiór n wartości x1, xdwa, x3…, Średnia harmoniczna jest odwrotnością lub odwrotnością średniej arytmetycznej odwrotności wartości.
Łatwiej to zobaczyć dzięki formule:
Mając dostępne zgrupowane dane, wyrażenie staje się:
Gdzie:
-H: średnia harmoniczna
-faja: częstotliwość klasy
-mja: ocena klasy
-g: liczba klas
-N = f1 + fadwa + fa3 +...
Jeśli oni mają n liczby dodatnie x1, xdwa, x3…, Jego średnią geometryczną G oblicza się z n-tego pierwiastka iloczynu wszystkich liczb:
W przypadku danych zgrupowanych można wykazać, że logarytm dziesiętny ze średniej geometrycznej log G jest wyrażony wzorem:
Gdzie:
-G: średnia geometryczna
-faja: częstotliwość klasy
-mja: ocena klasy
-g: liczba zajęć
-N = f1 + fadwa + fa3 +...
Zawsze jest prawdą, że:
H ≤ G ≤ X
Aby znaleźć wartości opisane we wzorach powyżej, wymagane są następujące definicje:
Częstotliwość definiuje się jako liczbę powtórzeń danych.
Jest to różnica między najwyższymi i najniższymi wartościami występującymi w rozkładzie.
Aby wiedzieć, w ilu klasach grupujemy dane, posługujemy się pewnymi kryteriami, na przykład:
Nazywa się skrajne wartości każdej klasy lub przedziału limity a każda klasa może mieć zarówno dobrze zdefiniowane limity, w którym to przypadku ma dolną, jak i wyższą granicę. Lub może mieć otwarte limity, gdy podany jest zakres, na przykład wartości większe lub mniejsze od określonej liczby.
Składa się po prostu z punktu środkowego przedziału i jest obliczany poprzez uśrednienie górnej i dolnej granicy.
Dane można pogrupować w klasy o równej lub różnej wielkości, jest to szerokość lub szerokość. Pierwsza opcja jest najczęściej używana, ponieważ znacznie ułatwia obliczenia, chociaż w niektórych przypadkach konieczne jest, aby klasy miały różne szerokości.
Szerokość do Odstęp można określić za pomocą następującego wzoru:
c = Zakres / Ndo
Gdziedo to liczba klas.
Poniżej mamy serię pomiarów prędkości w km / h, wykonanych za pomocą radaru, które odpowiadają 50 samochodom przejeżdżającym przez ulicę w danym mieście:
Prezentowane w ten sposób dane nie są uporządkowane, dlatego pierwszym krokiem jest pogrupowanie ich w klasy.
Znajdź zakres R:
R = (52-16) km / h = 36 km / h
Wybierz liczbę klas Ndo, według podanych kryteriów. Ponieważ danych jest 50, możemy wybrać Ndo = 6.
Oblicz szerokość do przedziału:
c = Zakres / Ndo = 36/6 = 6
Klasy formularzy i dane grupowe w następujący sposób: dla pierwszej klasy jako dolną granicę przyjmuje się wartość nieco mniejszą od najniższej wartości obecnej w tabeli, a następnie do tej wartości dodaje się obliczoną wcześniej wartość c = 6, a zatem uzyskuje górną granicę pierwszej klasy.
Postępujemy w ten sam sposób, aby zbudować pozostałe klasy, jak pokazano w poniższej tabeli:
Każdej częstotliwości odpowiada kolor na rysunku 2, w ten sposób zapewnia się, że żadna wartość nie ucieknie przed policzeniem..
X = (5 x 18,5 + 25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h
Mediana znajduje się w klasie 2 tabeli, ponieważ istnieje pierwsze 30 danych rozkładu.
-Szerokość przedziału, do którego należy mediana: c = 6
-Dolna granica przedziału, w którym mediana wynosi: BM = 22,0 km / h
-Liczba obserwacji, które zawiera przedział fm = 25
-Łączne dane podzielone przez 2: 50/2 = 25
-Liczba obserwacji przed przedziału zawierającego medianę: fBM = 5
A operacja to:
Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h
Moda jest również w klasie 2:
-Szerokość interwału: c = 6
-Dolna granica klasy, w której znaleziono modę: L1 = 22,0
-Odejmij od częstotliwości klasy modalnej i częstotliwości klasy, która ją poprzedza: Δ1 = 25-5 = 20
-Odejmij między częstotliwością klasy modalnej a częstotliwością następnej klasy: Δdwa = 25 - 10 = 15
Z tymi danymi operacja jest:
Tryb = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h
N = f1 + fadwa + fa3 +… = 50
log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =
log G = 1,44916053
G = 28,13 km / h
1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366
H = 27,32 km / h
Jednostkami zmiennych są km / h:
-Średnia: 29.03.2020
-Mediana: 26,80
-Moda: 25,40
-Średnia geometryczna: 28,13
-Średnia harmoniczna: 27,32
Jeszcze bez komentarzy