Plik podwójne pobieranie próbek jest techniką używaną w statystykach wnioskowania, gdy chcesz poznać więcej szczegółów i pewność na temat określonej zmiennej, która charakteryzuje daną populację.
Drugą próbę populacyjną generalnie przeprowadza się po pobraniu i przeanalizowaniu pierwszej próby, której analiza nie przyniosła statystycznie istotnych wniosków dotyczących żadnej z badanych zmiennych..
Z tego powodu podwójne próbkowanie w statystykach jest również znane jako dwustopniowe pobieranie próbek. Użyteczność drugiej próbki polega na tym, że pomaga ona z większą precyzją określić estymację współczynników i regresji pewnej zmiennej pomocniczej, która powstaje w świetle analizy pierwszej próbki..
Innym zastosowaniem podwójnego pobierania próbek jest zbieranie informacji w celu przeprowadzenia próbkowania według warstw..
Różne sytuacje, w których podwójne pobieranie próbek jest uzasadnione, zostaną opisane poniżej..
Metoda podwójnego pobierania próbek jest często stosowana w przemysłowej kontroli jakości i zwykle przebiega w dwóch fazach..
Na przykład załóżmy, że maszyna przemysłowa wytwarza określone części. Bez względu na to, jak bardzo maszyna jest wyregulowana, żadna część nie jest identyczna z inną, ponieważ mogą wystąpić niewielkie różnice w jej wymiarach i wadze. Chodzi o określenie, czy partia części wyprodukowanych przez tę maszynę spełnia kryteria tolerancji, aby została przyjęta lub odrzucona..
Najpierw pobierana jest losowa próbka kawałków, za pomocą której chcesz sprawdzić, czy jedna ze zmiennych, na przykład długość kawałka, mieści się w tolerancji.
W przypadku, gdy średnia długość jest poniżej lub powyżej stopnia tolerancji pożądanego dla tej zmiennej, w tej pierwszej próbce wnioskuje się, że partia jest wadliwa i należy ją wyrzucić. W takim przypadku nie są wymagane żadne nowe próbki.
I odwrotnie, jeśli średnia wartość mieści się w zakresie tolerancji, ale odchylenie standardowe próbki jest na tyle duże, że dodanie lub odjęcie średniej wartości wykracza poza zakres, wówczas należy pobrać drugą, większą próbkę..
Ta druga próbka musi zawierać oryginalną próbkę, aby powtórzyć obliczenia, a tym samym móc podjąć ostateczną decyzję dotyczącą badanej zmiennej. W ten sposób można sprawdzić, czy partia jest wadliwa, czy nie.
W wielu przypadkach informacja o jednej z badanych zmiennych jest trudno dostępna. Ale może istnieć pomocnicza zmienna łatwiejsza do zbierania danych.
W tym przypadku pobiera się dwie próbki, jedną dużą dla zmiennej pomocniczej, tańszą i mniejszą, zawartą w większej próbce zmiennej najdroższej..
Metodę tę można zastosować zawsze, gdy zostanie ustalone, że istnieje korelacja między obiema zmiennymi, która jest na ogół zależnością proporcjonalną..
Przykład takiej sytuacji pojawia się w naukach leśnych, gdzie pożądane jest określenie odsetka drzew dotkniętych przez roślinę pasożytniczą (grzybicę).
Ponieważ są to bardzo rozległe regiony i trudno dostępne, badanie całej populacji drzew jest niewykonalne pod względem czasu i kosztów. Następnie należy wykonać następujące kroki:
Wstępne pobieranie próbek obejmowałoby wykorzystanie zdjęć lotniczych, a las zostałby podzielony na części. Stąd wybiera się losowo kilka partii i na podstawie analizy zdjęć z wybranych partii szacuje się, ile drzew jest dotkniętych grzybicą, ponieważ pasożyt ma wpływ na kolor drzew..
Jednak analiza fotograficzna może być nieprecyzyjna, dlatego wybiera się kilka partii pierwszej próbki, najlepiej losowo, do pracy w terenie..
Wynik w terenie jest następnie porównywany z wynikiem fotograficznym dla przechwycenia dwóch zestawów serii. Porównanie to można przeprowadzić, na przykład, wykonując wykres, na którym oś pozioma to wartość uzyskana dla każdej partii w wyniku fotografowania, a na osi pionowej wartość uzyskana na partię podczas prac terenowych..
Ta metoda graficzna pozwala wizualnie zidentyfikować, czy istnieje korelacja między obydwoma wynikami, oraz określić, poprzez analizę regresji, współczynnik proporcjonalności lub stosunek między obiema próbami..
Po największej próbce, czyli próbce fotograficznej, pobiera się średnią wartość porażonych drzew i ich odchylenie standardowe. Ale ponieważ określono współczynnik proporcjonalności i jego błąd z próbkami terenowymi, można skorygować wynik większej próbki (fotograficznej).
Wynik ten można następnie ekstrapolować na całą populację drzew.
W opisanych przykładach przewaga kosztowa jest oczywista, ponieważ zastąpienie łatwo dostępnej zmiennej inną, do której dostęp jest trudny, oszczędza czas i pieniądze..
Wadą jest to, że w przypadku podwójnego pobierania próbek do kontroli jakości istnieje ryzyko przejścia przez dobre partie produktów, które nie mieszczą się w tolerancji..
Chcemy oszacować liczbę chorych drzew w 162-hektarowym lesie. Ponieważ las jest bardzo rozległy, dzieli się go na 100 działek o tej samej powierzchni. 18 działek jest wybieranych losowo i na podstawie badań fotograficznych szacuje się, że na tych 18 powierzchniach występuje 8,5 chorych drzew z błędem standardowym plus minus 4,5 drzewa.
Z tych 18 powierzchni losowo wybiera się 8 powierzchni, na których przeprowadza się badanie terenowe. Na tych ośmiu poletkach studium fotograficzne pokazuje 10 chorych drzew z błędem plus lub minus 5,3 drzew..
Z drugiej strony, na tych samych ośmiu poletkach badanie terenowe wykazało 12,4 chorych drzew z błędem plus minus 6,3 drzewa..
Pyta:
Wykres przedstawia liczbę drzew przypadającą na liczbę zdjęć w porównaniu z liczbą pól dla ośmiu partii wybranych do obu badań..
Dopasowuje się linię trendu i wyznacza jej nachylenie. W tym przypadku uzyskuje się, że współczynnik proporcjonalności wynosi 1,23. Oznacza to, że jeśli X jest liczbą na liczbę zdjęć, szacuje się, że liczba pól wyniesie Y = 1,23 X.
Liczba chorych drzew według liczby zdjęć w 18 wybranych partiach będzie wynosić:
18 x 8,5 = 153
Ponieważ jednak cały las został podzielony na 100 poletek o tej samej powierzchni, liczba chorych drzew oszacowana metodą fotograficzną wynosi: (100/18) x 153 = 850.
Stosuje się teraz współczynnik korygujący uzyskany z porównania badania terenowego i fotograficznego:
Szacunkowa rzeczywista liczba chorych drzew w lesie = 1,23 x 850 = 1046.
Jeszcze bez komentarzy