Próbkowanie to ... Definicja, rodzaje, metody i wyniki próbkowania

25.02.2019

Często zdarza się, że konieczne jest przeanalizowanie konkretnego zjawiska społecznego i uzyskanie informacji na jego temat. Takie zadania często pojawiają się w statystykach i badaniach statystycznych. Sprawdź, czy w pełni zdefiniowane zjawisko społeczne jest często niemożliwe. Na przykład, jak dowiedzieć się opinii ludności lub wszystkich mieszkańców danego miasta w jakiejkolwiek sprawie? Pytanie absolutnie wszystkich jest prawie niemożliwe i bardzo pracochłonne. W takich przypadkach potrzebujemy próbki. To jest właśnie koncepcja, na której opierają się praktycznie wszystkie badania i analizy.

Co to jest próbkowanie

Analizując określone zjawisko społeczne, konieczne jest uzyskanie informacji na jego temat. Jeśli podejmiesz jakiekolwiek badania, zobaczysz, że nie każda jednostka przedmiotu badania podlega badaniom i analizie. Uwzględniana jest tylko pewna część całego agregatu. Ten proces polega na pobieraniu próbek: gdy sprawdzane są tylko niektóre jednostki zestawu.

Oczywiście wiele zależy od rodzaju próbki. Ale są podstawowe zasady. Najważniejszym z tych stanów jest to, że wybór z agregatu powinien być całkowicie losowy. Jednostki kruszywa, które mają być stosowane, nie powinny być wybierane ze względu na jakiekolwiek kryteria. Z grubsza rzecz biorąc, jeśli konieczne jest zebranie agregatu populacji określonego miasta i wybrania tylko mężczyzn, wówczas wystąpi błąd w badaniu, ponieważ wybór nie był losowy, ale został wybrany na podstawie płci. Praktycznie wszystkie metody próbkowania są oparte na tej zasadzie.

typy próbek

Zasady wyboru

Aby wybrana populacja mogła odzwierciedlać podstawowe cechy całego zjawiska, musi być zbudowana zgodnie z określonymi przepisami, w których należy skupić się na następujących kategoriach:

  • próbka (próbka);
  • populacja ogólna;
  • reprezentatywność;
  • błąd reprezentatywności;
  • jednostka kruszywa;
  • sposoby na zbudowanie próbki.

Cechy pobierania próbek i pobierania próbek są następujące:

  1. Wszystkie uzyskane wyniki opierają się na prawach i zasadach matematycznych, tj. Przy odpowiednich badaniach i przy odpowiednich obliczeniach wyniki nie zostaną zniekształcone na podstawie subiektywnej.
  2. Pozwala to na uzyskanie wyników znacznie szybciej i przy mniejszym nakładzie czasu i zasobów, studiując nie cały szereg zdarzeń, ale tylko część z nich.
  3. Można go wykorzystać do badania różnych przedmiotów: od konkretnych zagadnień, na przykład wieku, płci grupy zainteresowań, po badanie opinii publicznej lub poziom materialnego wsparcia populacji.

Losowa obserwacja

Selektywne - jest to obserwacja statystyczna, w której badanie nie jest poddawane całemu zestawowi badanych, ale tylko pewna jego część jest wybrana w określony sposób, a wyniki badania tej części odnoszą się do całego zestawu. Ta część nosi nazwę zestawu próbek. Jest to jedyny sposób na studiowanie szerokiego spektrum przedmiotu badań.

Jednak obserwacja selektywna może być stosowana tylko w przypadkach, w których konieczne jest zbadanie tylko niewielkiej grupy jednostek. Na przykład podczas badania stosunku mężczyzn do kobiet na świecie będą stosowane obserwacje selektywne. Z oczywistych powodów - niemożliwe jest uwzględnienie każdego mieszkańca naszej planety.

Ale z tymi samymi badaniami, ale nie wszyscy mieszkańcy ziemi, ale pewna klasa 2 "A" w danej szkole, pewne miasto, pewien kraj, może obejść się bez selektywnej obserwacji. W końcu całkiem możliwe jest przeanalizowanie całej tablicy przedmiotu badania. Konieczne jest policzenie chłopców i dziewcząt tej klasy - taki będzie stosunek.

zestaw próbek

Próbka i populacja

W rzeczywistości wszystko nie jest tak trudne, jak się wydaje. W każdym przedmiocie studiów istnieją dwa systemy: agregat ogólny i selektywny. Co to jest? Wszystkie jednostki należą do generała. A do próbki - te jednostki całkowitej populacji, które zostały pobrane dla próbki. Jeśli wszystko zostanie wykonane poprawnie, wybrana część będzie zredukowanym układem całej (ogólnej) populacji.

Jeśli mówimy o populacji ogólnej, możemy wyróżnić tylko dwie jej odmiany: określoną i nieokreśloną populację ogólną. Zależy to od tego, czy znana jest całkowita liczba jednostek tego systemu. Jeśli jest to konkretna populacja, wówczas próbka będzie łatwiejsza, ponieważ wiadomo, jaki procent ogólnej liczby jednostek będzie próbką.

Ten moment jest bardzo potrzebny w badaniach. Na przykład, jeśli konieczne jest zbadanie procentu złej jakości wyrobów cukierniczych w danej fabryce. Załóżmy, że populacja jest już zdefiniowana. Wiadomo, że przedsiębiorstwo to produkuje 1000 wyrobów cukierniczych rocznie. Jeśli zrobisz próbkę 100 losowych wyrobów cukierniczych z tego tysiąca i wyślesz je do badania, błąd będzie minimalny. Z grubsza rzecz biorąc, 10% wszystkich produktów było przedmiotem badań i zgodnie z wynikami możemy, biorąc pod uwagę błąd reprezentatywności, mówić o złej jakości wszystkich produktów.

A jeśli spróbujesz 100 wyrobów cukierniczych z niepewnej ogólnej populacji, gdzie faktycznie było, powiedzmy, 1 milion jednostek, wynik próbki i samo badanie będą krytycznie niewiarygodne i niedokładne. Poczuj różnicę? Dlatego w większości przypadków pewność populacji ogólnej jest niezwykle ważna i ma duży wpływ na wynik badania.

Ogólna populacja

Reprezentatywność agregatu

Oto jedno z najważniejszych pytań - jaka powinna być próba? To jest główny punkt badań. Na tym etapie konieczne jest obliczenie próbki i wybranie jednostek z całkowitej liczby do niej. Agregat został wybrany prawidłowo, jeśli pewne cechy i cechy populacji ogólnej pozostają w próbce. Nazywa się to reprezentatywnością.

Innymi słowy, jeśli po selekcji część zachowuje te same tendencje i cechy co cała badana liczba, wówczas taki zbiór nazywa się reprezentatywnym. Ale nie każda konkretna próbka może zostać wybrana z reprezentatywnego zestawu. Istnieją również takie obiekty badań, których próbkowanie po prostu nie może być reprezentatywne. Tutaj powstaje pojęcie błędu reprezentatywności. Ale pomówmy o tym bardziej szczegółowo trochę więcej.

Jak dokonać wyboru

Aby zmaksymalizować reprezentatywność, istnieją trzy podstawowe zasady pobierania próbek:

  1. Najbardziej unikalnym wskaźnikiem liczby próbek jest 20%. Próbka statystyczna o wartości 20% prawie zawsze daje wynik tak bliski rzeczywistości, jak to tylko możliwe. Jednocześnie nie ma potrzeby przekazywania do zgromadzonej większości populacji. 20% próby to wskaźnik opracowany w wielu badaniach. Dajemy trochę więcej teorii. Im większa próbka, tym mniejszy jest błąd reprezentatywności i dokładniejszy wynik badania. Im bardziej próbka zbliża się do ogólnej liczby jednostek, tym dokładniejsze i poprawne będą wyniki. W końcu, jeśli eksplorujesz cały system, wynik będzie wynosił 100%. Ale nie ma próbki. Są to badania, w których badana jest cała tablica, wszystkie jednostki, więc nas to nie interesuje.
  2. W przypadku niewłaściwości przetwarzania 20% całkowitej populacji, dozwolone jest badanie jednostek agregatu w ilości nie mniejszej niż 1001. Jest to również jeden ze wskaźników badania tablicy przedmiotu badania, która rozwinęła się z czasem. Oczywiście nie da to dokładnych wyników w przypadku dużych tablic badań, ale przyniesie to jak najbliżej możliwej dokładności próbkowania.
  3. W statystykach istnieje wiele formuł i tabel tabelarycznych. W zależności od przedmiotu badania i kryterium próby istnieje celowość wyboru jednej lub innej formuły. Ale ten przedmiot jest wykorzystywany w złożonych i wieloetapowych badaniach.
    Zestaw próbek

Błąd (błąd) reprezentatywności

Główną cechą jakości wybranej próbki jest pojęcie "marginesu błędu". Co to jest? Są to pewne rozbieżności między wskaźnikami obserwacji selektywnej i ciągłej. Pod względem błędu reprezentatywność dzieli się na wiarygodne, zwyczajne i przybliżone. Innymi słowy, dopuszczalne są odchylenia do 3%, od 3 do 10% i od 10 do 20%. Chociaż w statystyce pożądane jest, aby błąd nie przekraczał 5-6%. W przeciwnym razie można mówić o braku reprezentatywności próby. Aby obliczyć błąd reprezentatywności i jego wpływ na próbkę lub populację ogólną, bierze się pod uwagę wiele czynników:

  1. Prawdopodobieństwo, z jakim musisz uzyskać dokładny wynik.
  2. Liczba jednostek próbki. Jak wspomniano wcześniej, im mniej jednostek będzie próbką, tym większy będzie błąd reprezentatywności i na odwrót.
  3. Homogeniczność badanej populacji. Im bardziej heterogeniczny jest agregat, tym większy będzie błąd reprezentatywności. Zdolność agregatu do reprezentatywności zależy od jednorodności wszystkich jego składników.
  4. Metoda wyboru jednostek w próbie.

W specjalnie określonych badaniach procentowy błąd wartości średniej jest zwykle podawany przez samego badacza na podstawie programu obserwacji i zgodnie z danymi z poprzednich badań. Co do zasady marginalny błąd próbkowania (błąd reprezentatywności) wynosi 3-5%.

Prowadzenie badań

Więcej nie zawsze jest lepiej

Warto również pamiętać, że najważniejszą rzeczą w organizacji selektywnej obserwacji jest doprowadzenie jej objętości do akceptowalnego minimum. W takim przypadku nie należy dążyć do nadmiernego zmniejszenia granic błędu pobierania próbek, ponieważ może to prowadzić do nieuzasadnionego zwiększenia ilości danych przykładowych, a w konsekwencji do zwiększenia kosztów pobierania próbek.

Jednocześnie nie jest możliwe nadmierne zwiększenie wielkości błędu reprezentatywności. Rzeczywiście, w tym przypadku, chociaż nastąpi zmniejszenie objętości próbki, doprowadzi to do pogorszenia wiarygodności uzyskanych wyników.

Jakie pytania zazwyczaj stawia badaczowi

Każde badanie, jeśli prowadzone, jest w jakimś celu i uzyskać pewne wyniki. Podczas przeprowadzania badania selektywnego z reguły stawia się pytania wstępne:

  1. Określanie wymaganej liczby jednostek próbki, to znaczy, ile jednostek zostanie zbadanych. Ponadto, dla dokładnego badania, całość powinna być reprezentatywna.
  2. Obliczanie błędu reprezentatywności z ustalonym poziomem prawdopodobieństwa. Natychmiast warto zauważyć, że selektywne badania nie odbywają się z prawdopodobieństwem na poziomie 100%. Jeśli organ, który przeprowadził badanie danego segmentu, twierdzi, że jego wyniki są dokładne z prawdopodobieństwem 100%, to jest to fałsz. Długoterminowa praktyka już ustaliła procent prawdopodobieństwa poprawnie przeprowadzonego badania selektywnego. Liczba ta wynosi 95,4%.
    Jak próbkować

Metody doboru jednostek badawczych w próbie

Nie każda próbka jest reprezentatywna. Czasami ten sam znak jest inaczej wyrażany jako całość i jego część. Aby osiągnąć wymogi reprezentatywności, zaleca się stosowanie różnych technik próbkowania. Co więcej, zastosowanie jednej lub drugiej metody zależy od konkretnych okoliczności. Wśród takich metod tworzenia próbki są:

  • losowy wybór;
  • wybór mechaniczny;
  • typowy wybór;
  • wybór seryjny (hodowlany).

Losowe pobieranie próbek to system środków ukierunkowanych na losowe pobieranie próbek jednostek populacyjnych, gdy prawdopodobieństwo dostania się do próbki jest równe dla wszystkich jednostek w populacji ogólnej. Technikę tę można stosować tylko w przypadku jednorodności i niewielkiej liczby cech wrodzonych. W przeciwnym razie niektóre cechy mogą nie zostać odzwierciedlone w próbie. Znaki losowego wyboru leżą u podstaw wszystkich innych metod pobierania próbek.

Gdy mechaniczny wybór jednostek odbywa się w określonych odstępach czasu. Jeśli konieczne jest stworzenie próbki konkretnych przestępstw, każda 5., 10. lub 15. karta może zostać wycofana ze wszystkich statystycznych zapisów zarejestrowanych przestępstw, w zależności od ich całkowitej liczby i dostępnych rozmiarów próbek. Wadą tej metody jest to, że przed pobieraniem próbek konieczne jest posiadanie pełnego rachunku agregatów, następnie należy przeprowadzić klasyfikację i dopiero po tym czasie można przeprowadzić próbę w określonym przedziale czasu. Ta metoda zajmuje dużo czasu, więc nie jest często używana.

Pobieranie próbek

Typowa (strefowa) selekcja to rodzaj pobierania próbek, w którym populacja ogólna jest podzielona na grupy homogeniczne według określonego atrybutu. Czasami badacze używają zamiast "grup" innych terminów: "obszary" i "strefy". Następnie z każdej grupy w kolejności losowej wybiera się określoną liczbę jednostek proporcjonalnie do wagi grupy w całej populacji. Typowa selekcja jest często przeprowadzana w kilku etapach.

Selekcja seryjna to metoda, w której selekcja jednostek odbywa się w grupach (seriach) i wszystkie jednostki z wybranej grupy (serii) podlegają badaniu. Zaletą tej metody jest to, że czasem trudniej jest wybrać poszczególne jednostki niż serie, na przykład podczas studiowania osoby, która wykonuje wyrok. W wybranych obszarach, strefach, studiowane są wszystkie jednostki bez wyjątku, na przykład badanie wszystkich osób odbywających karę w danej instytucji.