Strona główna
Statystyka
Stopnie swobody, jak je obliczyć, typy, przykłady

Stopnie swobody, jak je obliczyć, typy, przykłady

3385

906

David Holt

Plik stopnie swobody w statystyce są to liczba niezależnych składowych wektora losowego. Jeśli wektor ma n komponenty i są p równania liniowe, które odnoszą się do ich składników, a następnie stopień wolności jest n-p.

Pojęcie stopnie swobody Pojawia się również w mechanice teoretycznej, gdzie z grubsza odpowiada rozmiarowi przestrzeni, w której porusza się cząstka, pomniejszonym o liczbę wiązań..

Rysunek 1. Wahadło porusza się w dwóch wymiarach, ale ma tylko jeden stopień swobody, ponieważ jest zmuszane do poruszania się po łuku o promieniu L. Źródło: F. Zapata.

W tym artykule omówimy pojęcie stopni swobody stosowane w statystyce, ale przykład mechaniczny jest łatwiejszy do wizualizacji w postaci geometrycznej.

Indeks artykułów

1 Rodzaje stopni swobody
- 1.1 W obudowie mechanicznej
- 1.2 W zbiorze losowych wartości
2 Przykłady
- 2.1 Wariancja i stopnie swobody
- 2.2 W rozkładzie Chi-kwadrat
- 2.3 W testowaniu hipotez (z opracowanym przykładem)
3 Odnośniki

Rodzaje stopni swobody

W zależności od kontekstu, w jakim jest stosowany, sposób obliczania liczby stopni swobody może się różnić, ale podstawowa idea jest zawsze taka sama: wymiary całkowite minus liczba ograniczeń.

W etui mechanicznym

Rozważmy oscylującą cząstkę przywiązaną do struny (wahadła), która porusza się w pionowej płaszczyźnie x-y (2 wymiary). Jednak cząstka jest zmuszona do poruszania się po obwodzie o promieniu równym długości cięciwy.

Ponieważ cząstka może poruszać się tylko po tej krzywej, liczba stopnie swobody jest 1. Można to zobaczyć na rysunku 1.

Aby obliczyć liczbę stopni swobody, należy wziąć różnicę między liczbą wymiarów a liczbą wiązań:

stopnie swobody: = 2 (wymiary) - 1 (ligatura) = 1

Inne wyjaśnienie, które pozwala nam dojść do wyniku, jest następujące:

-Wiemy, że położenie w dwóch wymiarach jest reprezentowane przez punkt o współrzędnych (x, y).

-Ale ponieważ punkt musi spełniać równanie obwodu (x^dwa + Y^dwa = L^dwa) dla danej wartości zmiennej x, zmienna y jest określona przez wspomniane równanie lub ograniczenie.

Zatem tylko jedna ze zmiennych jest niezależna i system ma jeden (1) stopień swobody.

W zbiorze losowych wartości

Aby zilustrować znaczenie tego pojęcia, załóżmy, że mamy wektor

x = (x₁, x_dwa,..., x_n)

Co reprezentuje próbkę n wartości losowe o rozkładzie normalnym. W tym przypadku losowy wektor x mieć n niezależne komponenty i dlatego tak się mówi x mieć n stopni swobody.

Teraz zbudujmy wektor r na straty

r = (x₁ - , x_dwa - ,…., X_n - )

Gdzie reprezentuje średnią z próby, którą oblicza się w następujący sposób:

= (x₁ + x_dwa +…. + X_n) / n

A więc suma

(x₁ - ) + (x_dwa - ) +…. + (X_n - ) = (x₁ + x_dwa +…. + X_n) - rz= 0

Jest to równanie, które reprezentuje ograniczenie (lub wiązanie) na elementach wektora r reszt, ponieważ jeśli znane są n-1 składników wektora r, równanie wiązania określa nieznany komponent.

Dlatego wektor r o wymiarze n z ograniczeniem:

∑ (x_ja - ) = 0

Mieć (n - 1) stopnie swobody.

Ponownie stosuje się, że obliczenie liczby stopni swobody wygląda następująco:

stopnie swobody: = n (wymiary) - 1 (więzy) = n-1

Przykłady

Wariancja i stopnie swobody

Wariancja s^dwa definiuje się jako średnią kwadratu odchyleń (lub reszt) próbki n danych:

s^dwa = (r•r) / (n-1)

gdzie r jest wektorem reszt r = (x1 - , x2 - ,…., Xn - ) i gruby punkt (•) jest operatorem iloczynu skalarnego. Alternatywnie wzór wariancji można zapisać w następujący sposób:

s^dwa = ∑ (x_ja - )^dwa / (n-1)

W każdym razie należy zauważyć, że obliczając średnią kwadratu reszt, dzieli się ją przez (n-1), a nie przez n, ponieważ jak omówiono w poprzednim rozdziale, liczba stopni swobody wektor r jest (n-1).

Jeśli do obliczenia wariancji podzielono przez n zamiast (n-1) wynik miałby odchylenie, które jest bardzo istotne dla wartości n poniżej 50.

W literaturze formuła wariancji pojawia się również z dzielnikiem n zamiast (n-1), jeśli chodzi o wariancję populacji.

Ale zbiór zmiennej losowej reszt, reprezentowanych przez wektor r, Chociaż ma wymiar n, ma tylko (n-1) stopnie swobody. Jeśli jednak liczba danych jest wystarczająco duża (n> 500), obie formuły są zbieżne z tym samym wynikiem.

Kalkulatory i arkusze kalkulacyjne podają obie wersje wariancji i odchylenia standardowego (które jest pierwiastkiem kwadratowym z wariancji).

W związku z przedstawioną tutaj analizą, naszym zaleceniem jest, aby zawsze wybierać wersję z wartością (n-1) za każdym razem, gdy wymagane jest obliczenie wariancji lub odchylenia standardowego, aby uniknąć tendencyjnych wyników..

W rozkładzie Chi-kwadrat

Niektóre rozkłady prawdopodobieństwa w ciągłej zmiennej losowej zależą od parametru o nazwie stopień wolności, jest przypadkiem rozkładu Chi-kwadrat (χ^dwa).

Nazwa tego parametru pochodzi właśnie od stopni swobody bazowego wektora losowego, do którego odnosi się ten rozkład.

Załóżmy, że mamy g populacji, z których pobrano próbki o rozmiarze n:

X₁ = (x1₁, x1_dwa,… X1_n)

X2 = (x2₁, x2_dwa,… X2_n)

... .

X_jot = (xj₁, xj_dwa,… Xj_n)

... .

Xg = (xg₁, xg_dwa,… Xg_n)

Populacja jot co ma średnią i odchylenie standardowe Sj, jest zgodny z rozkładem normalnym N (, Sj ).

Zmienna standaryzowana lub znormalizowana zj_ja jest zdefiniowany jako:

zj_ja = (xj_ja - ) / Sj.

I wektor Zj jest zdefiniowany w następujący sposób:

Zj = (zj₁, zj_dwa,..., zj_ja,..., zj_n) i jest zgodny ze znormalizowanym rozkładem normalnym N (0,1).

Więc zmienna:

Q = ((z1₁^ 2 + z2₁^ 2 +…. + zg₁^ 2),…., (Z1_n^ 2 + z2_n^ 2 +…. + zg_n^ 2))

postępuj zgodnie z rozkładem χ^dwa(g) o nazwie rozkład chi-kwadrat ze stopniem swobody sol.

W teście hipotezy (z opracowanym przykładem)

Jeśli chcesz przetestować hipotezy na podstawie określonego zestawu losowych danych, musisz znać liczba stopni swobody g aby móc zastosować test Chi-kwadrat.

Rysunek 2. Czy istnieje związek pomiędzy preferencją SMAKU lodów a PŁCIĄ klienta? Źródło: F. Zapata.

Jako przykład przeanalizowane zostaną dane zebrane na temat preferencji lodów czekoladowych lub truskawkowych wśród mężczyzn i kobiet w danej lodziarni. Częstotliwość, z jaką mężczyźni i kobiety wybierają truskawkę lub czekoladę, podsumowano na rycinie 2.

Najpierw obliczana jest tabela przewidywanych częstotliwości, którą przygotowuje się poprzez pomnożenie wartości suma wierszy dla niego suma kolumn, podzielony przez dane ogółem. Wynik przedstawiono na poniższym rysunku:

Rysunek 3. Obliczanie oczekiwanych częstotliwości na podstawie obserwowanych częstotliwości (wartości zaznaczone na niebiesko na rysunku 2). Źródło: F. Zapata.

Następnie przystępujemy do obliczenia Chi-kwadrat (z danych) za pomocą następującego wzoru:

χ^dwa = ∑ (F_lub - fa_i)^dwa / F_i

Gdzie F._lub są obserwowanymi częstotliwościami (ryc. 2) i F._i są oczekiwanymi częstotliwościami (rysunek 3). Sumowanie obejmuje wszystkie wiersze i kolumny, które w naszym przykładzie dają cztery wyrazy.

Po wykonaniu operacji otrzymasz:

χ^dwa = 0,2043.

Teraz należy porównać z teoretycznym Chi-kwadrat, który zależy od liczba stopni swobody g.

W naszym przypadku ta liczba jest określana w następujący sposób:

g = (# wiersze - 1) (# kolumny - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.

Okazuje się, że liczba stopni swobody g w tym przykładzie wynosi 1.

Jeśli chcesz sprawdzić lub odrzucić hipotezę zerową (H0: nie ma korelacji między SMAK i PŁEĆ) przy poziomie istotności 1%, teoretyczną wartość Chi-kwadrat oblicza się ze stopniem swobody g = 1.

Poszukiwana jest wartość, która sprawia, że skumulowana częstotliwość (1 - 0,01) = 0,99, czyli 99%. Ta wartość (którą można odczytać z tabel) to 6,636.

Ponieważ teoretyczne Chi przewyższa obliczone, weryfikowana jest hipoteza zerowa.

To znaczy z zebranymi danymi, Nie zaobserwowany związek między zmiennymi SMAK i PŁEĆ.

Bibliografia

Minitab. Jakie są stopnie swobody? Odzyskany z: support.minitab.com.
Moore, David. (2009) Podstawowe statystyki stosowane. Redaktor Antoni Bosch.
Leigh, Jennifer. Jak obliczyć stopnie swobody w modelach statystycznych. Odzyskany z: geniolandia.com
Wikipedia. Stopień swobody (statystyki). Odzyskany z: es.wikipedia.com
Wikipedia. Stopień swobody (fizyczny). Odzyskany z: es.wikipedia.com