Plik Opisowe statystyki to dział Statystyki odpowiedzialny za zbieranie i porządkowanie informacji o zachowaniu się systemów z wieloma elementami, znanymi generalnie pod nazwą populacja.
W tym celu wykorzystuje techniki numeryczne i graficzne, za pomocą których przedstawia informacje, nie przewidując ani nie wnioskując na temat populacji, z której pochodzi..
Indeks artykułów
Statystyka ma swoje źródło w ludzkiej potrzebie uporządkowania informacji niezbędnych do jego przetrwania i dobrego samopoczucia, a także do przewidywania wydarzeń, które na nią wpływają. Wielkie cywilizacje starożytności pozostawiły zapisy o osadnikach, pobranych podatkach, wysokości zbiorów i liczebności armii.
Na przykład podczas długiego panowania Ramzes II (1279-1213 pne) zarządził spis ziem i mieszkańców Egiptu, który liczył wówczas około 2 mln mieszkańców..
Podobnie Biblia podaje, że Mojżesz przeprowadził spis ludności, aby dowiedzieć się, ilu żołnierzy miało dwanaście plemion Izraela.
Również w starożytnej Grecji liczono ludzi i zasoby. Rzymianie, wyróżniający się wysoką organizacją, okresowo rejestrowali ludność, sporządzając co pięć lat spisy, uwzględniając terytoria i zasoby..
Po upadku Rzymu, ważnych danych statystycznych było niewiele, aż do nadejścia renesansu, kiedy to ponownie pojawiły się statystyki jako pomoc w podejmowaniu decyzji..
Pod koniec XVII wieku narodziła się teoria prawdopodobieństwa, będąca wynikiem skłonności ludzi do gier losowych, co nadało statystyce matematyczny rygor, który uczynił ją nauką samą w sobie..
Nowy impuls przyszedł z teorią błędów i najmniejszych kwadratów w XIX wieku, za którą podążała metoda korelacji między zmiennymi, do ilościowej oceny zależności między nimi..
Aż w końcu, w XX wieku, Statystyka rozprzestrzeniła się na każdą gałąź nauki i inżynierii jako niezbędne narzędzie do rozwiązywania problemów..
Statystyki opisowe charakteryzują się:
- Uporządkuj zebrane informacje w postaci danych i wykresów. Wykresy mogą być różnorodne: między innymi histogramy, wielokąty częstotliwości, diagramy w kształcie kołowych..
- Rozłóż dane w zakresach częstotliwości, aby ułatwić zarządzanie nimi. Użyj arytmetyki, aby znaleźć najbardziej reprezentatywne wartości danych za pomocą miar tendencji centralnej, a także przeanalizuj ich rozproszenie.
- Określić kształt rozkładów, ich symetrię, czy są wyśrodkowane czy skośne oraz czy są spiczaste czy raczej spłaszczone.
Ilekroć dane muszą być gromadzone, organizowane i prezentowane, statystyki opisowe są niezbędne w dziedzinach nauki, które dotyczą wielu elementów i ilości, a także w większości działań ludzkich: ekonomii, polityce, zdrowiu, sporcie i nie tylko..
Oto kilka przykładów:
Statystyka opisowa dotyczy spójnego rejestrowania i organizowania danych dotyczących populacji i ich wieku, dochodów, inwestycji, zarobków i wydatków. W ten sposób rządy i instytucje planują ulepszenia i odpowiednio inwestują środki..
Z jego pomocą monitorowane są zakupy, sprzedaż, zwroty i efektywność usług. Z tego powodu statystyki są niezbędne w procesie podejmowania decyzji.
Fizyka i mechanika wykorzystują statystykę do badania ośrodków ciągłych, które składają się z dużej liczby cząstek, takich jak atomy i cząsteczki. Okazuje się, że nie ma możliwości śledzenia każdego z nich osobno..
Jednak badając globalne zachowanie systemu (na przykład części gazu) z makroskopowego punktu widzenia, można znaleźć średnie i zdefiniować makroskopowe zmienne, aby poznać ich właściwości. Przykładem tego jest kinetyczna teoria gazów.
Jest niezbędnym narzędziem do monitorowania chorób, od ich powstania i w trakcie ich ewolucji, a także skuteczności leczenia.
Statystyki opisujące wskaźniki zachorowalności, współczynniki wyleczeń, czas inkubacji lub rozwoju choroby, wiek, w którym zwykle się pojawia, i podobne dane są niezbędne przy projektowaniu najskuteczniejszych metod leczenia..
Jednym z wielu zastosowań statystyki opisowej jest rejestrowanie i porządkowanie danych dotyczących spożycia żywności w różnych populacjach: jej ilości, jakości i tego, która jest najczęściej spożywana, a także wielu innych obserwacji, które interesują ekspertów..
Oto kilka przykładów, które ilustrują, jak przydatne są opisowe narzędzia statystyczne ułatwiające podejmowanie decyzji:
Władze oświatowe danego kraju planują usprawnienia instytucjonalne. Załóżmy, że zamierzasz wdrożyć nowy system stołówki szkolnej.
W tym celu niezbędne są dane dotyczące populacji uczniów, na przykład liczba uczniów w klasie, ich wiek, płeć, wzrost, waga i status społeczno-ekonomiczny. Informacje te są następnie przedstawiane w postaci tabel i wykresów..
Aby śledzić lokalną drużynę piłkarską i dokonywać nowych transferów, menedżerowie śledzą liczbę meczów rozegranych, wygranych, zremisowanych i przegranych, a także liczbę bramek, strzelców i sposób, w jaki udało im się strzelić: rzut wolny, połowa sąd, kary, z lewą lub prawą nogą, między innymi.
Lodziarnia ma kilka smaków lodów i chce poprawić sprzedaż, dlatego właściciele przeprowadzają badanie, w którym liczą klientów, dzielą ich na grupy ze względu na płeć i wiek.
W tym badaniu odnotowano na przykład ulubiony smak lodów i najlepiej sprzedającą się prezentację. Na podstawie zebranych danych planują zakupy aromatów oraz pojemników i akcesoriów niezbędnych do ich przygotowania..
Te podstawowe pojęcia są niezbędne do zastosowania technik statystycznych, zobaczmy:
W kontekście statystycznym populacja odnosi się do wszechświata lub grupy, z której pochodzą informacje.
Nie zawsze dotyczą ludzi, ponieważ mogą to być grupy zwierząt, roślin lub przedmiotów, takich jak samochody, atomy, cząsteczki, a nawet zdarzenia i idee..
Gdy populacja jest bardzo duża, pobiera się z niej reprezentatywną próbkę i analizuje, nie tracąc przy tym istotnych informacji..
Można go wybrać losowo lub według pewnych kryteriów ustalonych wcześniej przez analityka. Zaletą jest to, że będąc podzbiorem populacji, jest znacznie łatwiejszy w zarządzaniu.
Odnosi się do zestawu wartości, jakie może przyjąć określona cecha populacji. Badanie może zawierać kilka zmiennych, takich jak wiek, płeć, waga, poziom naukowy, stan cywilny, dochód, temperatura, kolor skóry, czas i wiele innych.
Zmienne mogą mieć różny charakter, dlatego istnieją kryteria pozwalające na ich klasyfikację i najbardziej odpowiednie traktowanie.
W zależności od sposobu ich pomiaru zmiennymi mogą być:
-Kategoryczny
-Liczbowy
Zmienne kategorialne, zwane także jakościowy, reprezentują cechy, takie jak stan cywilny osoby, która może być osobą samotną, żonatą, rozwiedzioną lub owdowiałą.
Zamiast tego zmienne numeryczne lub ilościowy, można zmierzyć, na przykład wiek, czas, wagę, dochód i inne.
Zmienne dyskretne przyjmują tylko wartości dyskretne, jak sugeruje ich nazwa. Przykładami są liczba dzieci w rodzinie, liczba przedmiotów w danym kursie oraz liczba samochodów na parkingu.
Te zmienne nie zawsze przyjmują wartości całkowite, ponieważ istnieją również wartości ułamkowe.
Z drugiej strony zmienne ciągłe dopuszczają nieskończone wartości w pewnym zakresie, takie jak waga osoby, pH krwi, czas konsultacji telefonicznej i średnica piłek..
Dają wyobrażenie o ogólnym trendzie, po którym następują dane. Wspomnimy o trzech najczęściej stosowanych środkach centralnych:
-Pół
-Mediana
-moda
Odpowiednik średniej wartości. Oblicza się go, dodając wszystkie obserwacje i dzieląc przez całkowitą liczbę:
Jest to wartość, która powtarza się najczęściej w zbiorze danych, najczęściej lub najczęściej, ponieważ w rozkładzie może występować więcej niż jeden tryb.
Podczas sortowania zestawu danych mediana jest centralną wartością wszystkich z nich.
Wskazują na zmienność danych i dają wyobrażenie o tym, jak daleko lub jak bardzo są rozproszone od centralnych miar. Najczęściej używane to:
Jest to różnica między największą wartością xM a najmniejszy xm ze zbioru danych:
Ranga = xM - xm
Mierzy, jak daleko znajdują się dane od średniej wartości. Aby to zrobić, oblicza się średnią, ale z różnicami między dowolną wartością xja a średnia, walcząca do kwadratu, aby zapobiec wzajemnemu znoszeniu się. Zwykle jest oznaczony grecką literą σ do kwadratu lub sdwa:
Wariancja nie ma tych samych jednostek co dane, więc odchylenie standardowe jest definiowane jako pierwiastek kwadratowy z wariancji i jest oznaczane jako σ lub s:
Zamiast uwzględniać poszczególne dane z osobna, lepiej jest pogrupować je w przedziały, co ułatwia pracę, zwłaszcza jeśli wartości jest wiele. Na przykład, pracując z dziećmi w szkole, można je podzielić na przedziały wiekowe: od 0 do 6 lat, od 6 do 12 lat i od 12 do 18 lat.
Są świetnym sposobem, aby zobaczyć rozkład danych na pierwszy rzut oka i zawierają wszystkie informacje zebrane w tabelach i tabelach, ale są znacznie tańsze.
Jest ich bardzo dużo: z paskami, liniowymi, okrągłymi, łodygami i liśćmi, histogramami, wielokątami częstotliwości i piktogramami. Przykładowe wykresy statystyczne przedstawiono na rysunku 3..
Gałęzie statystyki.
Zmienne statystyczne.
Populacja i próba.
Statystyka wnioskowa.
Jeszcze bez komentarzy