האם אפשר לסמוך על אנליטיקס ? פוסט על “דגימת נתונים”על מגבלות הדיוק של גוגל אנליטיקס ונושא שחשוב מאוד להכיר – דגימת נתוניםכאשר מנתחים מספר גדול של נתונים באנליטיקס, הוא מבצע דגימה של הנתונים כדי לחסוך את זמן טעינת הדו”חות ולכן הנתונים אינם מדוייקים במאה אחוז. |
מהי דגימת נתונים?
המושג דגימת נתונים מתייחס לתופעה של בחירת קבוצה מדגמית של הנתונים לצורך ניתוח.
המשמעות בהקשר של גוגל אנליטיקס היא שלעיתים המדדים השונים עליהם אתם מסתכלים, מסתמכים על אמדן שמתבסס על חלק מהנתונים. למשל אם אתם מנתחים את יחס ההמרה של אתר ורואים בדו”ח מסוים שיחס ההמרה עומד על 15%, ועל אותו דו”ח מוכלת דגימת נתונים – יכול מאוד להיות שיחס ההמרה בפועל הוא 10% וחשוב להכיר במגבלה הזו (אל דאגה, יש מה לעשות בנידון).
נזכיר שוב שתמיד מומלץ להסתכל על האנליטיקס בתור כלי סטטיסטי ולא ככלי שאוסף מאה אחוז מהנתונים של האתר , למשל גולשים שחוסמים עוגיות או JavaScript כלל לא נספרים באנליטיקס (הערכה סבירה שמדובר בלא יותר מ-1-2% מהגולשים).
מתי ומדוע זה קורה?
דגימת הנתונים מתרחשת כאשר מנתחים נתונים רבים, על מנת לזרז את הזמן הנדרש להפקתו של כל דו”ח (וכדי להוריד את העומסים על השרתים של Google Analytics מכל שאילתא גדולה).
דוגמאות למקרים בהם דו”חות ישתמשו בדגימת נתונים:
- כשמסתמכים על נתונים של יותר מ-250 אלף ביקורים באנליטיקס
- כאשר מריצים דו”ח על טווח זמן רחב כאשר ככל שהתקופה גדולה, הדגימה פחות מדויקת. כך למשל דו”ח עבור 30 יום, מציג כ-30 אלף דפים ליום, ודו”ח עבור 60 יום מציג כ-16 אלף דפים ליום
- כאשר משתמשים ב-funnel על ניתוח של יותר ממאה אלף ביקורים
- כאשר יש יותר מ-75 אלף שורות בפירוט, יתר המידע מתנקז ל-other (סוג שונה של דגימת נתונים)
איך אפשר למנוע את הדגימה הזו ולהפוך את הנתונים למדויקים יותר?
1. לחיצה על אייקון הדגימה, ושינוי מידת הרגישות ל-Higher Precision (הוראות למתקשים):
2. צמצום טווח התאריכים עליו נשען הדו”ח כך שיכיל פחות נתונים
3. שדרוג החשבון ל-Google Analytics Premium אשר מאפשר ניתוח של כל הנתונים
4. יצירת מספר פרופילים אשר כל אחד מנתח חלק אחר בנתונים, למשל פרופיל נפרד לכל סאב דומיין של האתר (תמיד לשמור על פרופיל אחד ללא פילטרים כגיבוי)
נכתב ע”י טל גביזון
מקורות שימושיים נוספים בנושא:
- https://support.google.com/analytics/answer/2637192
- https://support.google.com/analytics/answer/2601061
- https://developers.google.com/analytics/resources/concepts/gaConceptsSampling
מאמרים נוספים מהבלוג בנושא: