Próbkowanie danych w Google Analytics

0 napisany przez Karol Krzystała, 21 lipca 2020

Próbkowanie danych jest dość istotnym zagadnieniem dla statystyki, dlatego często wspomina się o nim w kontekście analiz w Google Analytics. Warto więc wiedzieć, czym jest próbkowanie i jakie niesie za sobą zagrożenia. 

Dane próbkowane w Google Analytics

Co to jest próbkowanie danych? 

Jeżeli mówimy o próbkowaniu w przypadku analizy danych, jest to  wybranie podzbioru z obszaru wszystkich danych w celu znalezienia zależności w większym zbiorze danych. Wybrana próbka reprezentuje całość danych, a na podstawie jej badania formułuje się wnioski dotyczące przeprowadzanej analizy.  Na efekt analizy i w rezultacie jej jakość największy wpływ ma dobór danych reprezentatywnych – jeśli próbka jest odpowiednim reprezentantem ogółu danych, analiza może być bardzo wartościowa. Problem pojawia się wówczas, gdy próbka jest niereprezentatywna, ponieważ w takim przypadku analizy nie można odnieść do ogółu. 

Próbkowanie danych w Google Analytics

W Google Analytics próbkowanie danych jest stosowane w celu oszczędności czasu i wykorzystania możliwości obliczeniowych systemu. W zależności od skomplikowania zapytania Analytics wybiera i wyświetla raport z pełnymi danymi lub na podstawie próbkowania. Jeśli raport został wygenerowany na podstawie próbkowania danych, nie możemy być pewni jego jakości, ponieważ wybrana próbka może nie być reprezentatywna. W Idealnym rozwiązaniem byłoby  wyświetlanie przez Google Analytics za każdym razem raportów z kompletnymi danymi. Świat (i Google Analytics) jednak idealny nie jest, należy więc umożliwić narzędziu przeanalizowanie jak największej ilości danych. Ich dokładność  zależy od wielkości próbki – im większa, tym lepiej. 

Próbkowanie danych w raportach 

Próbkowanie danych zależy od tego, jak bardzo rozbudowane jest zapytanie użytkownika, czyli jak skomplikowany raport ma zostać wygenerowany. Każdy widok ukazuje dedykowany zestaw danych, który można szybko wyświetlić i w którym dane nie są próbkowane. Edycja raportu to ryzyko próbkowania danych, a przez edycję raportu rozumiem stosowanie zaawansowanych segmentów, wymiarów dodatkowych itd. Nie zawsze jednak Google Analytics próbkuje dane w raportach, w których zastosowano segmenty lub wymiary dodatkowe. Zależy to też od liczby sesji do przeanalizowania, prawdopodobieństwo wzrasta gdy ich liczba przekracza 500 000.

Jak sprawdzić, czy dane są próbkowane? 

Google Analytics informuje nas, które z wyświetlonych danych są próbkowane – są one oznaczone jako wyświetlana nad raportem żółta tarcza. Po najechaniu na tarczę wyświetla się informacja, na podstawie jakiej części ruchu dany raport został wygenerowany. Oczywiście im większy procent, tym lepsza jakość danych. Dodatkowo dostępna jest opcja, czy raport ma się ładować szybciej (krótki czas reakcji), ale z mniejszą dokładnością danych, czy dane mają być bardziej precyzyjne (większa precyzja). W drugim przypadku raport może ładować się jednak wolniej. 

dane próbkowane

Zielona tarcza wyświetlana przy nazwie raportu oznacza, że raport został wygenerowany na podstawie wszystkich danych (nie są one próbkowane). 

Jak uniknąć próbkowania danych?

Aby dane odzwierciedlały rzeczywistość, warto uruchamiać raport, który jest generowany na podstawie wszystkich sesji. Jeśli chcesz uniknąć próbkowania: 

– generuj raporty w krótszym okresie czasu, 
– nie używaj filtrów widoków,
– nie stosuj zaawansowanych segmentów i wymiarów dodatkowych,
– pobieraj raporty do Excela, a następnie tam używaj segmentów. 

Dowiedz się jak, wdrożyć nową wersję GA4 i zarządzać jej ustawieniami.

Próbkowanie danych jest często zagadnieniem marginalizowanym w kontekście Google Analytics i interpretacji danych. Aby analizy były rzetelne i miarodajne, powinniśmy unikać tego zjawiska. Przez próbkowanie danych można narazić się na błędną ich analizę, a co za tym idzie na nierentowne decyzje w kontekście decyzji biznesowych, dlatego warto być ostrożnym w procesie wyciągania wniosków.

Rate this post

Historie sukcesu naszych klientów:

  • ponad 500 leadów z Google Ads i Facebook Ads
  • 4,63% współczynnika konwersji
  • 17 926 leadów dzięki kampanii Google Ads
  • 6,26%  współczynnika konwersji
  • 1,28 zł kosztu za wyświetlenie strony klienta
  • bardzo niski wskaźnik współczynnika odrzuceń
  • 1455% średniego ROASu z kampanii Google Ads
  • przychód o 63% wyższy niż w poprzednim okresie
  • o 197% wyższy wzrost transakcji
  • 2000% ROASu z kampanii Google Ads
  • 4% współczynnika konwersji

O autorze:

Karol Krzystała

Specjalizuje się w kampaniach Google Ads, pomaga klientom w rozwoju ich firm. Certyfikowany specjalista Ads. Absolwent Filozofii i Politologii na Uniwersytecie Śląskim. Pasjonat piłki nożnej, a szczególnie rodzimej ekstraklasy oraz lig amatorskich. Wolne weekendy lubi spędzać w górach.

Spodobał Ci się artykuł? Oceń go!

Rate this post
Reklama w Internecie nie musi być droga!

Reklama w Internecie nie musi być droga!

Umów się na konsultację i poznaj propozycję naszych działań wraz z ich wyceną.

Marketing dla ludzi
Zapisz się do newslettera!
Zdobywaj wiedzę! Co dwa tygodnie otrzymasz najciekawsze artykuły na swoją skrzynkę e-mail!
...i dołącz do ponad 600 subskrybentów!