Test U Manna - Whitney co to jest i kiedy jest stosowany, wykonanie, przykład

2679
Sherman Hoover

Plik Test U Manna-Whitneya Stosuje się go do porównania dwóch niezależnych próbek, gdy mają one niewiele danych lub nie mają rozkładu normalnego. W ten sposób jest uważany za test nieparametryczny, W przeciwieństwie do swojego odpowiednika Test t Studenta, który jest używany, gdy próbka jest wystarczająco duża i ma rozkład normalny.

Frank Wilcoxon zaproponował go po raz pierwszy w 1945 roku dla próbek o identycznych rozmiarach, ale dwa lata później został rozszerzony dla próbek o różnych rozmiarach przez Henry'ego Manna i D. R. Whitneya..

Rysunek 1. Do porównania niezależnych próbek zastosowano test U Manna-Whitneya. Źródło: Pixabay.

Test jest często stosowany w celu sprawdzenia, czy istnieje związek między zmienną jakościową a ilościową.

Ilustrującym przykładem jest pobranie zestawu osób z nadciśnieniem i wyodrębnienie dwóch grup, z których dzienne dane ciśnienia krwi są rejestrowane przez miesiąc.

Leczenie A stosuje się w jednej grupie, a w drugiej - B. Ciśnienie krwi jest tutaj zmienną ilościową, a rodzaj leczenia jakościową..

Chcemy wiedzieć, czy mediana, a nie średnia mierzonych wartości jest statystycznie taka sama czy różna, aby ustalić, czy istnieje różnica między tymi dwoma terapiami. Aby uzyskać odpowiedź, stosuje się statystykę Wilcoxona lub test U Manna-Whitneya..

Indeks artykułów

  • 1 Przedstawienie problemu w teście U Manna-Whitneya
    • 1.1 Zmienne jakościowe a zmienne ilościowe
  • 2 Charakterystyka testu U Manna Whitneya
    • 2.1 Wzór Manna-Whitneya
    • 2.2 Kroki do zastosowania testu
  • 3 Praktyczny przykład zastosowania
    • 3.1 - Krok 1
    • 3.2 - Krok 2
    • 3.3 Krok 3
    • 3.4 Krok 4
  • 4 kalkulatory online do testu U Manna - Whitney
  • 5 Referencje

Przedstawienie problemu w teście U Manna-Whitneya

Inny przykład, w którym można zastosować test, jest następujący:

Załóżmy, że chcesz wiedzieć, czy spożycie napojów bezalkoholowych różni się znacznie w dwóch regionach kraju.

Jeden z nich nazywa się regionem A, a drugi region B. Prowadzony jest zapis litrów spożytych tygodniowo w dwóch próbkach: jedna na 10 osób dla regionu A i druga dla 5 osób dla regionu B.

Dane są następujące:

-Region A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

-Region B: 12,14, 11, 30, 10

Powstaje następujące pytanie:

Czy spożycie napojów bezalkoholowych (Y) zależy od regionu (X)?

Zmienne jakościowe a zmienne ilościowe

-Zmienna jakościowa X: Region

-Zmienna ilościowa Y: Zużycie sody

Jeśli ilość spożytych litrów jest taka sama w obu regionach, wniosek będzie taki, że nie ma zależności między tymi dwiema zmiennymi. Aby się tego dowiedzieć, należy porównać średnią lub medianę trendu dla obu regionów.

Normalny przypadek

Jeśli dane mają rozkład normalny, powstają dwie hipotezy: zerowa H0 i alternatywna H1 poprzez porównanie średnich:

-H0: nie ma różnicy między średnią z dwóch regionów.

-H1: średnie w obu regionach są różne.

Przypadek z nienormalnym trendem

Wręcz przeciwnie, jeśli dane nie mają rozkładu normalnego lub próbka jest po prostu zbyt mała, aby ją poznać, zamiast porównywać średnią, zostanie porównana mediana z dwóch regionów.

-H0: nie ma różnicy między medianą obu regionów.

-H1: mediany w obu regionach są różne.

Jeśli mediany pokrywają się, wówczas hipoteza zerowa zostaje spełniona: nie ma związku między spożyciem napojów bezalkoholowych a regionem.

A jeśli dzieje się odwrotnie, hipoteza alternatywna jest prawdziwa: istnieje związek między konsumpcją a regionem.

W tych przypadkach wskazany jest test U Manna-Whitneya..

Sparowane lub niesparowane próbki

Kolejnym ważnym pytaniem przy podejmowaniu decyzji, czy zastosować test U Manna Whitneya, jest to, czy liczba danych w obu próbach jest identyczna, to znaczy, że są one równe..

Jeśli dwie próbki zostaną sparowane, będzie miała zastosowanie oryginalna wersja Wilcoxon. Ale jeśli nie, jak w przykładzie, to stosuje się zmodyfikowany test Wilcoxona, którym jest dokładnie test U Manna Whitneya..

Charakterystyka testu U Manna Whitneya

Test U Manna - Whitneya jest testem nieparametrycznym, stosowanym do próbek, które nie mają rozkładu normalnego lub mają niewiele danych. Posiada następujące cechy:

1.- Porównaj mediany

2.- Działa na zamówionych zakresach

3. - Jest mniej potężne, będąc rozumianym przez władzę, prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona faktycznie fałszywa.

Biorąc pod uwagę te cechy, test U Manna - Whitneya stosuje się, gdy:

-Dane są niezależne

-Nie są zgodne z rozkładem normalnym

-Hipoteza zerowa H0 jest akceptowana, jeśli mediany obu próbek pokrywają się: Ma = Mb

-Hipoteza alternatywna H1 jest akceptowana, jeśli mediany obu próbek różnią się: Ma ≠ Mb

Formuła Manna-Whitneya

Zmienna U jest statystyką kontrastu używaną w teście Manna-Whitneya i jest zdefiniowana w następujący sposób:

U = min (Ua, Ub)

Oznacza to, że U jest najmniejszą z wartości między Ua i Ub, zastosowaną do każdej grupy. W naszym przykładzie byłoby to dla każdego regionu: A lub B.

Zmienne Ua i Ub są definiowane i obliczane według następującego wzoru:

Ua = Na Nb + Na (Na +1) / 2 - Ra

Ub = Na Nb + Nb (Nb +1) / 2 - Rb

Tutaj wartości Na i Nb są rozmiarami próbek odpowiadających odpowiednio regionom A i B, a ze swojej strony Ra i Rb są sumy rang które zdefiniujemy poniżej.

Kroki, aby zastosować test

1. - Zamów wartości dla dwóch próbek.

2. - Przypisz rangę zamówienia do każdej wartości.

3. - Popraw istniejące ligatury w danych (powtarzane wartości).

4. - Oblicz Ra = Suma zakresów próbki A.

5.- Znajdź Rb = Suma rang w próbce B..

6. - Określ wartości Ua i Ub, zgodnie ze wzorami podanymi w poprzedniej sekcji.

7.- Porównaj Ua i Ub, a mniejsza z nich jest przypisana do statystyki eksperymentalnej U (czyli danych), którą porównuje się z teoretyczną lub normalną statystyką U.

Praktyczny przykład zastosowania

Teraz odnosimy się do wspomnianego wcześniej problemu napojów bezalkoholowych:

Region A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

Region B: 12, 14, 11, 30, 10

W zależności od tego, czy średnie obu próbek są statystycznie takie same, czy różne, przyjmuje się lub odrzuca hipotezę zerową: nie ma związku między zmiennymi Y i X, czyli spożycie napojów bezalkoholowych nie zależy od regionu:

H0: Ma = Mb

H1: Ma ≠ Mb

Rysunek 2. Dane dotyczące spożycia napojów bezalkoholowych w regionach A i B. Źródło: F. Zapata.

- Krok 1

Przystępujemy do wspólnego porządkowania danych dla dwóch próbek, porządkując wartości od najniższej do najwyższej:

Zwróć uwagę, że wartość 11 pojawia się 2 razy (raz w każdej próbce). Oryginalnie ma pozycje lub zakresy 3 i 4, ale aby nie zawyżać ani nie lekceważyć jednego lub drugiego, jako zakres wybiera się średnią wartość, czyli 3,5.

Podobnie postępujemy z wartością 12, która jest powtarzana trzykrotnie z zakresami 5, 6 i 7.

Cóż, wartości 12 przypisano średni zakres 6 = (5 + 6 + 7) / 3. I to samo dla wartości 14, która ma ligaturę (pojawia się w obu próbkach) w pozycjach 8 i 9, przypisano jej średni zakres 8,5 = (8 + 9) / 2.

- Krok 2

Następnie dane dla Regionu A i B są ponownie rozdzielane, ale teraz odpowiadające im zakresy są przypisane do nich w innym wierszu:

Region A

Region B

Zakresy Ra i Rb są otrzymywane z sum elementów drugiego rzędu dla każdego przypadku lub regionu.

Krok 3

Obliczane są odpowiednie wartości Ua i Ub:

Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19

Ub = 10 × 5 + 5 (5 + 1) / 2-34 = 31

Wartość doświadczalna U = min (19, 31) = 19

Krok 4

Zakłada się, że teoretyczna wartość U jest zgodna z rozkładem normalnym N z parametrami określonymi wyłącznie przez wielkość próbek:

N ((na⋅nb) / 2, √ [na nb (na + nb +1) / 12])

Aby porównać uzyskaną doświadczalnie zmienną U, z teoretyczną U konieczna jest zmiana zmiennej. Przechodzimy od zmiennej eksperymentalnej U do jej wartości typowy, który będzie nazywany Z, aby móc dokonać porównania ze znormalizowanym rozkładem normalnym.

Zmiana zmiennej wygląda następująco:

Z = (U - na.nb / 2) / √ [na. nb (na + nb + 1) / 12] 

Należy zauważyć, że do zmiany zmiennej wykorzystano parametry rozkładu teoretycznego dla U. Następnie nowej zmiennej Z, będącej hybrydą teoretycznej U i eksperymentalnej U, przeciwstawiono standaryzowany rozkład normalny N (0 , 1).

Kryteria porównania

Jeśli Z ≤ Zα ⇒ przyjmuje się hipotezę zerową H0

Jeśli Z> Zα ⇒ hipoteza zerowa H0 zostaje odrzucona

Standaryzowane wartości krytyczne Zα zależą od wymaganego poziomu ufności, na przykład dla poziomu ufności α = 0,95 = 95%, co jest najczęściej wartością krytyczną Zα = 1,96.

Dla danych pokazanych tutaj:

Z = (U - na nb / 2) / √ [na nb (na + nb + 1) / 12] = -0,73

Co jest poniżej wartości krytycznej 1,96.

Tak więc ostateczny wniosek jest taki, że przyjmuje się hipotezę zerową H0:

Nie ma różnicy w spożyciu napojów bezalkoholowych między regionami A i B..

Kalkulatory online do testu U Manna - Whitneya

Istnieją specjalne programy do obliczeń statystycznych, w tym SPSS i MINITAB, ale programy te są płatne, a ich użycie nie zawsze jest łatwe. Wynika to z faktu, że oferują one tak wiele opcji, że praktycznie ich użycie jest zarezerwowane dla ekspertów statystyki..

Na szczęście istnieje kilka bardzo dokładnych, bezpłatnych i łatwych w użyciu programów online, które umożliwiają między innymi przeprowadzenie testu U Manna-Whitneya..

Te programy to:

-Social Science Statistics (socscistatistics.com), która ma zarówno test U Manna-Whitneya, jak i test Wilcoxona dla przypadku zrównoważonych lub sparowanych próbek.

-Statystyki terapii AI (ai-therapy.com), które zawierają kilka typowych testów statystyk opisowych.

-Statystyka do wykorzystania (physics.csbsju.edu/stats), jeden z najstarszych, więc jego interfejs może wyglądać na przestarzały, mimo że jest to bardzo wydajny darmowy program.

Bibliografia

  1. Dietrichson. Metody ilościowe: test rangowy. Odzyskane z: bookdown.org
  2. Marín J P. Przewodnik SPSS: Analiza i procedury w testach nieparametrycznych. Odzyskany z: halweb.uc3m.es
  3. USAL MOOC. Testy nieparametryczne: Mann - Whitney U. Odzyskany z: youtube.com
  4. Wikipedia. Test U Manna-Whitneya. Odzyskany z: es.wikipedia.com
  5. XLSTAT. Centrum pomocy. Samouczek dotyczący testu Mann-Whitney w programie Excel. Odzyskany z: help.xlsat.com

Jeszcze bez komentarzy