ГЕВС - частная независимая исследовательская компания
Ничто не может остановить идею,
время которой пришло!

ГЕВС - Полезно знать

Ошибка выборки и оценка погрешности результатов
Генеральная совокупность – все те люди, о которых делается вывод на основании социологического исследования.
 
Выборочная совокупность (выборка) – специальным образом отобранная часть людей, на основании исследования которых, делается вывод о мнении/поведении генеральной совокупности.
 
Случайная выборка – такая выборка, вероятность попадания в которую для каждого человека одинакова. Для того, чтобы случайная выборка точнее отражала данные по определенным целевым группам, людям в выборке присваивают веса так, чтобы соотношение разных групп в выборке и генеральной совокупности было одинаковым – такая выборка называется случайной с контролем квот. А параметры, по которым контролируются квоты, называются квотируемыми.
 
Понятно, что если исследуются не все люди, а какая-то их часть (выборка), неизбежно возникает погрешность измерений. Эту погрешность и называют ошибкой выборки. При больших размерах (более 10.000 человек) генеральной совокупности, величина ошибки выборки в первую очередь зависит от размера выборки, т.е. количества людей, которые были фактически исследованы. Чем больше размер выборки, тем меньше ошибка. Погрешность для конкретного единичного события при 95% уровне доверия (принятого по умолчанию в социологии) рассчитывается по следующей формуле:
где, p –рейтинг в процентах;
       n – размер выборки.
 
Приведем пример. Пусть в результате исследования передача набрала рейтинг 9,6%, а размер выборки был 600 человек. Тогда:
Это значит, что на самом деле рейтинг данной передачи находится в диапазоне от 7,2% до 11,8%.
 
Если рейтинг – 9,6%, а размер выборки был 1100 человек, то получаем:
Это значит, что на самом деле рейтинг данной передачи находится в диапазоне от 8,7% до 10,5%.
 
Если же мы оцениваем погрешность не для одного конкретного события, а для их серии (например, 1000 выходов одного рекламного ролика), то необходимо применять агрегирование результатов измерения. Это позволяет избежать учета множества случайных факторов, которые воздействуют на единичное событие, а также выйти на закономерности, которые проявляются именно в серии. Даже без математических доказательств очевидно, что при одинаковом размере выборки, например, средний рейтинг 1000 событий более надежен и устойчив, чем рейтинг одного выхода. Агрегирование данных позволяет даже на сравнительно малых выборках получать достоверные и надежные результаты. Таким образом, можно говорить что агрегирование – эквивалент увеличения выборки. Не вдаваясь в математические подробности, приведем формулу, позволяющую использовать агрегирование данных:
где, p –рейтинг в процентах;
       n – размер выборки;
       t – количество агрегируемых выходов событий;
       r – корреляция между смотрением агрегируемых событий.
 
Результаты анализа показывают (Щипков В. Малые аудитории. Проблемы и решения // Лаборатория рекламы, маркетинга и public relations – 2003г. – №5), что в широком диапазоне разных рекламных кампаний объемом от 200 GRP для расчета доверительного интервала оценки GRP (и/или среднего рейтинга по кампании) с высокой степенью достоверности можно пользоваться приведенной выше формулой, приняв коэффициент корреляции равным 0,02.
 
Рассмотрим предыдущий пример, но возьмем, что 9,6% – это средний рейтинг 1000 выходов рекламного ролика, а размер выборки был такой же – 600 человек. Получаем:
Это значит, что на самом деле средний рейтинг данной рекламной компании находится в диапазоне от 9,26% до 9,94%. Легко заметить, что надежность и точность на порядок выше.
Все права защищены © ГЕВС 2008-2017