Uploaded by srednevaa

12

advertisement
1
ТЕМА 12 ПЛАНИРОВАНИЕ И ПРОВЕДЕНИЕ ВЫБОРОК ПРИ ПРОВЕДЕНИИ МАРКЕТИНГОВОГО
ИССЛЕДОВАНИЯ. ОПРЕДЕЛЕНИЕ КОНЕЧНОГО И НАЧАЛЬНОГО РАЗМЕРОВ ВЫБОРКИ
Содержание
1 Процесс выборки как плановый шаг маркетингового исследования ........................................1
2 Этапы проведения выборочного наблюдения ..............................................................................2
3 Методы составления выборки........................................................................................................5
3.1 Детерминированные методы выборки ..................................................................................6
3.1.1 Нерепрезентативные (случайные) выборки ..................................................................6
3.1.2 Поверхностная (преднамеренная, не вполне случайная) выборка .............................6
3.1.3 Квотная выборка ..............................................................................................................7
3.1.4 Выборка по принципу «снежного кома» .......................................................................7
3.2 Вероятностные методы выборки ...........................................................................................8
3.2.1. Простая случайная (собственно случайная) выборка ................................................8
3.2.2 Систематическая (механическая) выборка....................................................................8
3.2.3 Стратифицированная (расслоенная) выборка ...............................................................9
3.2.4 Кластерная (групповая, типическая) выборка ............................................................10
3.2.5 Другие методы вероятностной выборки .....................................................................12
4 Принятие решения о выборе между детерминированной и вероятностной выборками .......13
5 Статистические методы определения объема вероятностной выборки ..................................14
5.1 Определение объема выборки методом доверительных интервалов при простой
случайной (собственно случайной), систематической (механической) и кластерной
(типической) выборках ...............................................................................................................15
5.2 Корректировка статистически определенного объема выборки ......................................20
5.3 Решение проблемы ненаблюдения при опросе респондентов и пути их устранения ....20
5.3.1 Увеличение коэффициента отклика респондентов ....................................................20
5.3.2 Корректировка результатов с учетом неполученных данных ...................................21
1 Процесс выборки как плановый шаг маркетингового исследования
Проведение выборки является одним из плановых шагов маркетингового исследования. К этому времени маркетологами, в соответствии с разработанным и утвержденным планом исследования:
1) определены характер и содержание информации, необходимой для решения проблемы исследования;
2) установлен тип исследования (поисковое, дескриптивное или причинноследственное);
3) установлена процедура измерения и шкалирования;
4) составлена и протестирована анкета.
Процесс выборочного наблюдения, являющегося очередным шагом маркетингового
исследования, также планируется. При этом рассматриваются следующие его аспекты:
1) необходимость проведения выборочного наблюдения;
2) процедура выборочного наблюдения;
2
3) метод выборки;
4) величина выборки;
5) способы уменьшения и устранения последствий ошибок ненаблюдения.
Проведение маркетингового исследования чаще всего направлено на получение информации о параметрах генеральной совокупности (популяции), которая представляет собой совокупность элементов (людей, компаний, организаций, продукты), которые обладают
рядом общих характеристик, охватывающую полное множество этих элементов с точки зрения решения проблемы маркетингового исследования. Параметры этой совокупности обычно представляют собой количественные соотношения (например, процент или долю потребителей). Информацию о них можно получить после проведения:
1) переписи (ценза) – сбора сведений обо всех элементах генеральной совокупности;
2) выборки – статистического обследования отобранной части (подмножества) генеральной совокупности.
Характеристики выборки, называемые статистиками, в дальнейшем используются
для составления заключения о параметрах генеральной совокупности. Маркетологи на основании выборочных данных делают заключения о параметрах генеральной совокупности, которые подлежат отдельной процедуре проверки.
Основные критерии, определяющее целесообразность проведения выборки или переписи, показаны в табл. 12.1.
Таблица 12.1 – Основные критерии, определяющее целесообразность проведения выборки
или переписи
Критерии для выбора совокупности исследуемых
элементов
Размер бюджета
Временная продолжительность
Объем совокупности исследуемых элементов
Отличия в исследуемых характеристиках
Цена ошибки выборки
Цена систематической ошибки
Характер измерения параметров совокупности
(возможность уничтожения исследуемых образцов)
Возможность анализа частных случаев (проведение глубинных (глубоких) интервью)
Возможность сохранения тайны исследования
Значения критериев при проведении
выборки
переписи
небольшой
большой
небольшая
большая
большой
небольшой
небольшие
большие
невысокая
высокая
высокая
невысокая
разрушающий
неразрушающий
есть
нет
есть
нет
2 Этапы проведения выборочного наблюдения
При планировании выборочного наблюдения можно исходить из примерной последовательности этапов его проведения, показанной на рис. 12.1.
Составление плана выборочного наблюдения начинается с определения изучаемой
совокупности, которая представляет собой совокупность элементов или объектов, обладающих информацией, которую желает получить исследователь, и о которой нужно сделать
заключение. С целью обеспечения эффективности исследования эта совокупность должна
быть точно определена. Определение изучаемой совокупности предполагает трансформацию
формулировки проблемы маркетингового исследования в четкое определение того, кого
включать и кого не включать в выборку.
Изучаемая совокупность должна быть определена с точки зрения:
3
1) элементов генеральной совокупности – объектов, о которых или от которых исследователь хочет получить информацию;
2) охвата – выраженной в процентах доли элементов популяции или группы, удовлетворяющих условиям включения в состав выборки;
3) единиц выборки – элементов или единиц наблюдения, содержащих элемент, который подлежит отбору на определенном этапе выборки (например, семьи или отдельные потребители);
4) территории, на которой будут отбираться элементы совокупности;
5) времени и длительности проведения выборочного наблюдения.
1. Определение (задание) изучаемой совокупности исследуемых элементов
2. Определение основы выборочного наблюдения
3. Определение методов составления выборки в соответствии с принятой ее основой
4. Определение объема выборки
5. Отбор элементов, которые будут подвергнуты исследованию
6. Обследование отобранных элементов
Рисунок 12.1 – Примерная последовательность этапов проведения маркетингового
исследования
Основа выборочного наблюдения представляет собой список (перечень) элементов,
отображающих изучаемую их совокупность, отобранный на основе установленных исследователем правил или процедур. В ходе ее создания необходимо выявить и устранить ошибку
формирования основы выборочного наблюдения, используя следующие способы:
1) пересмотр основы выборки, позволяющий предохраниться от заблуждений, связанных с реальным составом исследуемой совокупности;
2) тщательный отбор респондентов на этапе сбора данных, чтобы обеспечить их соответствие критерию отбора изучаемой совокупности, что позволит исключить из основы выборочного наблюдения неподходящие элементы (но не позволит учесть элементы, которые
не были включены);
3) коррекция собранных данных с помощью системы весовых коэффициентов.
Составление выборки в соответствии с ее основой предполагает отбор элементов совокупности с использованием:
1) байесового (последовательного) подхода;
2) традиционного подхода;
3) повторной или бесповторной выборки;
4) вероятностного и детерминированного метода.
В соответствии с байесовым походом (не нашедшим широкого применения на практике) количество отбираемых элементов неизвестно и оно определяется на основе серии последовательных решений. В соответствии с эти подходом, если обследование малой выборки
не приводит к достоверному результату, круг обследуемых элементов расширяется. Если по-
4
лученный результат представляется неубедительным и после этого, объем выборки увеличивается снова. На каждом шаге принимается решение о том, следует ли считать полученный
результат достаточно убедительным или же продолжить сбор данных. Работа с последовательной выборкой дает возможность оценить тренд данных по мере их сбора, что позволяет
сократить расходы, связанные с дополнительными наблюдениями в тех случаях, когда их
целесообразность сходит на нет.
Традиционный подход предполагает работу с выборкой фиксированного объема, который определяется до начала наблюдения и анализу результатов предшествует сбор данных.
При повторной выборке исследователь выбирает элемент из основы выборки и получает необходимую информацию, после чего он возвращается в основу выборки (но при этом
элемент можно неоднократно включать в выборку). При бесповторной выборке элемент генеральной совокупности, выбранный для включения в выборку удаляется из основы выборки
и, следовательно, не может использоваться вновь. Расчет статистических данных при использовании этих двух методов немного отличается, но статистические выводы похожи, если
основа выборки намного больше конечного объема выборки. Поэтому различия нужно учитывать только тогда, когда основа выборочного наблюдения ненамного больше объема выборки.
Выбор между вероятностным или детерминированным методом выборки является
наиболее важным решением, связанным с отбором элементов для формирования выборки,
поэтому будет рассмотрено далее отдельным подвопросом (см. подвопрос 3.2).
Объем выборки – это количество элементов совокупности, которые нужно изучить.
Определение его представляет собой сложный процесс, затрагивающий анализ ряда количественных и качественных факторов. К последним относят:
1) важность решения, которое будет принято на основе результатов маркетингового
исследования (для принятия важных решений требуется детальная, максимально точная информация, предполагающая создание больших выборок);
2) тип (характер) исследования (см. табл. 12.2);
3) количество используемых переменных и характер анализа (большой объем выборки необходим при проведении углубленного анализа с использованием разнообразных методов многомерного статистического анализа, а также для анализа данных с собой точностью);
4) объем выборки в аналогичных исследованиях, установленный ранее опытным путем и используемый в качестве ориентировочного (прежде всего при детерминированных
методах формирования выборки);
5) коэффициент завершенности (процент респондентов, полностью прошедших интервью, и позволяющий учесть ожидаемые отказы респондентов, соответствующих критериям исследования);
6) временные и финансовые ограничения, уровень квалификации специалистов, участвующих в исследовании.
Таблица 12.2 – Объемы выборок, используемых в маркетинговых исследованиях
Характер исследования
Минимальный объем Обычный диапазон
Исследование с целью определения проблемы
500
1 000–2 500
(например, изучения потенциала рынка)
Исследование с цель решения проблемы (на200
300–500
пример, определения цены)
Тестирование продукции
200
300–500
Пробный маркетинг
200
300–500
Исследование эффективности средств рекламы
150
200–300
Проведение аудита на пробном рынке
10 магазинов
10–12 магазинов
Поведение фокус-групп
6 групп
10–15 групп
5
3 Методы составления выборки
Методы выборочного наблюдения (методы выборки) делятся на две основные категории: детерминированные и вероятностные (см. рис. 12.2).
Нерепрезентативная
(случайная) выборка
Детерминированные методы
Поверхностная
(преднамеренная, не
вполне случайная)
выборка
Квотная выборка
Выборка по принципу «снежного кома»
Методы выборочного
наблюдения
Простая случайная
выборка
Систематическая выборка
Вероятностные
методы
Стратифицированная
(расслоенная) выборка
Пропорциональная выборка
Непропорциональная выборка
Кластерная (групповая) выборка
Другие методы выборки
Последовательная
выборка
Выборка по методу двойного контроля
Рисунок 12.2 – Методы выборочного наблюдения (методы выборки)
При отборе элементов детерминированной выборки определяющую роль играют индивидуальные оценки или решения исследователя, он может произвольно или сознательно
решать какие элементы включать в выборку. В результате ее проведения можно получить
детальную оценку характеристик совокупности, но он не позволяет объективно оценить точность результатов исследования. Поскольку элементы в выборку отбираются не механически, определение вероятности включения в выборку произвольного элемента и соответственно ошибки выборочного наблюдения становится невозможным, и полученные результаты
нельзя статистически распространять на всю совокупность.
При использовании вероятностного метода выборки единицы выборки подбираются
случайным образом. Поскольку отбор ее элементов осуществляется на основе некоего объ-
6
ективного процесса и не зависит от прихоти и пристрастия исследователя или регистратора,
возможность предварительно определить все возможные выборки конкретного объема, которые можно получить из генеральной совокупности, а также вероятность получения каждой
выборки является вполне реальной. (Каждая потенциальная выборка не должна иметь одинаковой вероятности получения, но возможно установить вероятность получения конкретной выборки определенного размера). Но для этого нужно не только точно определить изучаемую совокупность, но и основные характеристики основы выборки. Кроме этого, произвольность выбора элементов выборки позволяет определить точность оценки исследуемых
характеристик в каждой выборке (например, можно рассчитать доверительные интервалы, в
пределах которых с определенной достоверностью получают истинные значения характеристик генеральной совокупности), что позволяет исследователю сделать выводы или высказать предположения относительно изучаемой совокупности, из которой получена выборка.
3.1 Детерминированные методы выборки
3.1.1 Нерепрезентативные (случайные) выборки
При использовании нерепрезентативного метода исследователи (интервьюеры) стремятся создать выборку случайным образом из удобных, доступных в период отбора элементов (например, респонденты оказались в нужное время в нужном месте).
Такая выборка является наиболее экономной с точки зрения временных и финансовых
затрат. Ее элементы доступны, готовы сотрудничать и их характеристики легко измерить.
Она считается весьма пригодной при проведении поискового исследования, направленного
на появление новых идей, понятий и гипотез. Ее можно применять для создания фокусгрупп, для предварительных опросов или в экспериментальных исследованиях.
Но она же имеет ряд ограничений:
1) при ее проведении существует большой риск возникновения различных ошибок
выборки, включая самовыбор респондентов;
2) она не может представить какую-либо совокупность и выводы, полученные при ее
анализе, некорректно распространять на генеральную совокупность, она не подходит для
маркетинговых исследований, предусматривающих написание заключения обо всей совокупности;
3) ею нельзя пользоваться при проведении дескриптивного и причинно-следственного
анализа.
3.1.2 Поверхностная (преднамеренная, не вполне случайная) выборка
Поверхностная (преднамеренная, не вполне случайная) выборка – это разновидность нерепрезентативной выборки, в соответствии с которой элементы совокупности собираются исследователем на основе его суждений об их пригодности для целей исследования.
Исследователь, применяя свои знания и проведя анализ, отбирает элементы для включения в
выборку, поскольку считает, что они представляют изучаемую совокупность и могут дать
полноценное о ней представление, или подходят по другим причинам.
Такая выборка недорога, удобна, быстра и полезна, если заказчик исследования не
требует подробного заключения о результатах исследования изучаемой совокупности. Но
она:
1) не позволяет обобщать результаты, полученные в ходе определения совокупности,
как правило, потому что эта совокупность, точно не определена;
2) является субъективной и ее эффективность полностью зависит от оценки исследователя, его компетентности и изобретательности.
Поэтому использование преднамеренной выборки может очень эффективным, когда
исследователь находится на начальных этапах проработки проблемы, когда определяются
перспективы и возможные ограничения планируемого исследования.
7
3.1.3 Квотная выборка
Проведение такой выборки, обеспечивающей удобство выбора элементов для квот,
является недорогим.
Квотная выборка рассматривается в качестве двухэтапной ограниченной поверхностной выборки.
Первый этап включает создание контрольных групп, или квот, из элементов совокупности. Для создания этих квот исследователь на основе своего мнения фиксирует контрольные характеристики (пол, возраст и т.п.), относящиеся к предмету исследования, и определяет их распределение в изучаемой совокупности. Часто квоты устанавливаются таким образом, чтобы процентное соотношение элементов выборки, обладающих контрольными характеристиками, было равно процентному соотношению элементов совокупности, обладающих
этими характеристиками (другими словами, применение квот обеспечивает соответствие
структуры выборки структуре генеральной совокупности с учетом исследуемых характеристик).
На втором этапе выбор элементов основан на удобстве отбора или мнении исследователя, которому при этом предоставляется значительная свобода в отборе элементов. Главным
требованием здесь является обеспечение соответствия отобранных элементов контрольным
характеристикам.
Однако, при проведении квотной выборки нужно помнить, что:
1) выборка может разительно отличаться от совокупности по каким-то важным иным
характеристикам, которые сложно было включить для отбора респондентов, что может оказать серьезное влияние на результат, т.е, даже если в структуре выборки полностью отражена структура популяции с учетом конкретных характеристик, все равно нет гарантии, что эта
выборка репрезентативна;
2) увеличение числа характеристик для отбора может существенно усложнить спецификацию, что в свою очередь усложнит – а порой может сделать невозможной – отбор элементов выборки;
3) существует большая вероятность необъективности при отборе, поскольку элементы
из каждой квоты выбираются исходя из удобства или на основании мнения исследователя, а
убедиться в том, что конкретная выборка действительно является репрезентативной, весьма
сложно.
3.1.4 Выборка по принципу «снежного кома»
Считается разновидностью преднамеренной выборки, предназначенной для работы с
особыми видами совокупностей, поскольку главная задача такой выборки – дать оценку необычным для совокупности характеристикам. Примерами таких совокупностей могут быть:
1) люди, получающие какую-либо государственную или социальную помощь, имена
которых не подлежат разглашению;
2) отдельные группы населения (например, рано овдовевшие, представители национальных меньшинств);
3) промышленные исследования, осуществляемые покупателями и продавцами в поисках взаимовыгодного делового сотрудничества.
При использовании выборки по принципу «снежного кома» исследователи, опираясь
на свои знания и опыт, обычно случайным образом подбирают начальную группу респондентов. После проведения опроса респондентов их просят выявить и предложить других
кандидатов, входящих в изучаемую совокупность, среди которых отбирается следующая
группа опрашиваемых. Данный процесс, когда респонденты, прошедшие опрос, называют
следующих кандидатов, в конце концов приводит к эффекту «снежного кома». И хотя при
отборе первых респондентов использовалась случайная выборка, конечная выборка оказывается детерминированной. При этом демографические и психологические характеристики на-
8
званных респондентов больше похожи на характеристики назвавших их респондентов, чем
при случайном выборе опрашиваемых.
3.2 Вероятностные методы выборки
Вероятностные методы выборки отличаются между собой степенью эффективности.
Эффективность выборки является понятием отражающим компромисс между затратами, связанными с проведением выборки, и ее точностью. Точность выборки – это степень
неопределенности, связанная с измеряемой характеристикой. Чем больше точность, тем выше стоимость проведения выборки. Исследователь, создавая план выборочного наблюдения
с учетом выделенного бюджета, должен соблюсти разумный баланс между затратами на выборку и требуемой точностью.
3.2.1. Простая случайная (собственно случайная) выборка
При проведении простой случайной (собственно случайной) выборки каждый элемент
совокупности имеет известную и равную вероятность отбора. Более того, каждая возможная
выборка данного объема (n) имеет известную и равную вероятность того, что она станет выборочной совокупностью. Это означает, что каждый элемент отбирается независимо от другого. Выборка формируется произвольным отбором элементов из основы выборки.
При такой выборке исследователь сначала формирует основу выборочного наблюдения, в которой каждому элементу присваивается уникальный идентификационный номер.
Затем генерируются случайные числа (с помощью компьютера или с использованием соответствующих таблиц), чтобы определить номера элементов, которые будут включены в выборку.
Преимуществами данной выборки являются:
1) простота для понимания;
2) возможность распространения результатов на изучаемую совокупность.
Его недостатки:
1) достаточно частая проявляемая сложность создания основы выборочного наблюдения, которая позволила бы провести простую случайную выборку;
2) результатом ее применения может стать большая совокупность, либо совокупность,
распределенная по большой географической территории, что значительно увеличивает время
и стоимость сбора данных;
3) результаты ее применения часто характеризуются низкой точностью и большей
стандартной ошибкой, чем результаты применения других вероятностных методов;
4) в результате ее применения может сформироваться нерепрезентативная выборка
(особенно при небольшом ее объеме).
3.2.2 Систематическая (механическая) выборка
При проведении систематической (механической) выборки сначала задают произвольную отправную точку, а затем из основы выборочного наблюдения последовательно выбирают каждый i-й элемент. Интервал выборки i определяется как отношение объема совокупности к объему выборки с округлением результата до ближайшего целого числа:
i=
где:
N
n
(12.1)
N – объем исследуемой совокупности;
n – объем выборки.
Общей чертой простой систематической выборки, как и простой случайной, является
то, что каждый элемент генеральной совокупности имеет известную и равную вероятность
выбора. Она отличается от простой тем, что только допустимые выборки объема n, которые
9
можно получить из генеральной совокупности, имеют известную и равную вероятность выбора, остальные же имеют нулевую вероятность.
При систематической выборке исследователь предполагает, что элементы совокупности расположены в определенном порядке. В некоторых случаях принцип сортировки (например, в алфавитном порядке) не имеет отношения к исследуемой характеристике. В других случаях сортировка непосредственно связана с исследуемой характеристикой (например,
в справочнике компаний отрасли они располагаются соответственно их годовому объему
продаж). Если элементы совокупности расположены по принципу, не связанному с исследуемой характеристикой, результаты систематической выборки аналогичны результатам
простой выборки.
Но с другой стороны, если принцип расположения элементов связан с исследуемой
характеристикой, систематизированный отбор увеличивает репрезентативность выборки
(например, компании в справочнике расположены по принципу увеличения годового объема
продаж и он включает как мелкие, так и крупные). Простая случайная выборка (из-за высокой непропорциональной доли, например, малых фирм) в данном случае может оказаться
нерепрезентативной. Если расположение элементов выборки носит циклический характер,
систематическим методом можно уменьшать представительность выборки.
Систематическая выборка в целом обладает следующими преимуществами:
1) дешевле и проще, чем простая случайная, поскольку случайный отбор осуществляется только один раз;
2) случайные числа не должны соответствовать определенным элементам, как в простой случайной выборке;
3) в связи с тем, что некоторые перечни содержат миллионы элементов, использование этого метода значительно экономит время, что, в свою очередь, способствует снижению
затрат, связанных с исследованием;
4) если совокупность обладает информацией об исследуемой характеристике, он дает
возможность получить более репрезентативную и достоверную (с меньшей ошибкой выборки) выборку, чем простая случайная выборка;
5) ее можно применять даже не зная структуру основы выборочного наблюдения.
3.2.3 Стратифицированная (расслоенная) выборка
Процесс стратифицированной выборки принципиально состоит из двух этапов:
1. Генеральная совокупность на основе выбранных переменных делится на ряд непересекающихся, исчерпывающих ее подмножеств (подгрупп, слоев, страт, частных совокупностей) (которые должны взаимно исключать и взаимно дополнять друг друга, чтобы каждый элемент совокупности относился бы к одному и только слою, и ни один элемент не был
бы упущен).
2. В каждом подмножестве (подгруппе, слое, страте) производится независимый отбор элементов простых случайных выборок.
Формально выбор элементов из каждого слоя может осуществляться только с помощью простой случайной выборки, но на практике иногда применяется систематический отбор и другие вероятностные выборочные методы.
Отличие стратифицированной выборки от квотной состоит в том, что элементы в ней
выбираются скорее случайно, а не из удобства или на основании мнения исследователя.
Главная цель такой выборки – увеличение точности без увеличения затрат.
Переменные, используемые для деления генеральной совокупности на слои, называются стратификационными переменными. Как правило, для стратификации используются
такие переменные, как демографические характеристики, разновидности покупателей, размеры компании или отрасль промышленности, к которой она принадлежит. Для стратификации можно использовать несколько переменных, однако больше двух применяют редко, поскольку это непрактично и экономически неоправданно. Опыт показывает, что использовать
10
нужно не более шести, так как дальнейшее их увеличение повышение точности сводит на
нет увеличением стоимости расслоения и отбора.
Критериями для выбора стратификационных переменных являются:
1) однородность элементов, относящихся к одному слою;
2) неоднородность элементов, относящихся к разным слоям;
3) взаимосвязанность с исследуемой характеристикой, ведущая к уменьшению нежелательных отклонений в выборке;
4) стоимость (переменные должны снижать стоимость процесса расслоения, будучи
простыми в оценке и применении).
Исходя из того, что стратифицированные выборки имеют большую стоимость, но дают при этом более точные оценки, еще одним важным решением при проведении стратифицированной выборки является выбор между пропорционально стратифицированной и непропорционально стратифицированной выборкой.
При пропорционально стратифицированном отборе объем выборки, полученной из
каждого слоя, пропорционален доле этого слоя в объеме генеральной совокупности. Преимущество пропорционального распределения состоит в том, что исследователю достаточно
знать только относительные размеры каждой страты для определения количества выборочных наблюдений, которые должны быть отобраны из каждого слоя для заданного объема
выборки.
При непропорционально стратифицированном отборе объем выборки, полученной
из каждого слоя, пропорционален доле этого слоя в объеме генеральной совокупности и
среднеквадратическому отклонению распределения исследуемой характеристики среди всех
элементов этого слоя. Такая выборка может давать результаты более точные, чем пропорционально стратифицированная. При ее составлении одновременно учитываются два критерия:
1) объем страты и
2) ее изменчивость.
Логика непропорциональной страты такова:
1) слои относительно большего размера больше влияют на определение средней для
генеральной совокупности и, следовательно, эти слои больше влияют на формирование выводов выборочного исследования. Таким образом, слои должны быть представлены бóльшим
количеством элементов;
2) для повышения точности оценки следует отбирать больше элементов из слоев с
бóльшим среднеквадратическим отклонением, и меньше элементов – с меньшим среднеквадратическим отклонением (при фиксированном объеме выборки слои с большей изменчивостью получают в общей выборке представление, доля которого превышает их относительный размер в генеральной совокупности, и наоборот, страты с высоким уровнем гомогенности получают представление, меньшее пропорционального).
При применении непропорционального отбора необходимо рассчитывать среднее
квадратичное отклонение распределения исследуемой характеристики среди элементов слоя.
Поскольку эта информация не всегда доступна, исследователю часто приходиться полагаться
на интуицию и логику, определяя объем выборки каждого слоя.
Стратифицированный метод обеспечивает наличие в выборке всех важных подгрупп,
что определяет его популярность при проведении маркетинговых исследований. Наличие
всех важных подгрупп особенно важно, когда исследуемая характеристика неравномерно
распределена среди элементов генеральной совокупности.
3.2.4 Кластерная (групповая, типическая) выборка
Кластерная выборка предполагает выполнение следующих этапов:
1. Деление исходной (генеральной) совокупности на взаимодополняющие и взаимоисключающие подмножества (подгруппы или кластеры).
11
2. С помощью вероятностного метода (например, такого как простая случайная выборка), формируется случайная выборка кластеров.
В выборку могут включаться либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом.
Если в выборку включаются все элементы каждого отобранного кластера, то такая
процедура именуется одноступенчатой кластерной выборкой, а если выборка получена с
помощью вероятного отбора из каждого отобранного кластера, то – двухступенчатой кластерной выборкой (см. рис. 12.3).
Кластерная выборка
Одноступенчатая кластерная выборка
Двухступенчатая кластерная выборка
Простая двухступенчатая кластерная выборка
Многоступенчатая
кластерная выборка
Вероятностная кластерная выборка, пропорциональная объему
Рисунок 12.3 – Типы кластерной выборки
Одной из форм кластерной выборки, в которой в качестве первичных единиц выборки
выступают географические территории или зоны, является территориальная выборка. Генеральная совокупность при этом делится (обычно с использованием карты) на ряд непересекающихся и взаимоисключающих подмножеств (территорий), после чего формируется их
случайная выборка.
У двухступенчатой кластерной выборки существует две разновидности: простая двухступенчатая кластерная выборка и вероятностная выборка, пропорциональная объему.
Кроме этого, кластерная выборка может состоять из более, чем двух этапов и являться
многоступенчатой.
Основные отличия кластерной выборки от стратифицированной, в которой также генеральная совокупность делится на ряд непересекающихся и взаимоисключающих подмножеств, заключаются в следующем:
1) используются элементы только отобранных подмножеств (кластеров) в то время
как в стратифицированной выборке производится отбор элементов из каждого подмножества
(слоя);
2) прямая противоположность критериев формирования кластеров и слоев по однородности и неоднородности: элементы кластера должны быть максимально разнородны, а
сами кластеры – как можно более однородными;
3) при кластерной выборке основа выборочного наблюдения необходима только для
кластеров, которые вошли в выборку;
4) необходимо сформировать подобные подмножества (кластеры), которые, вместе с
тем, являлись бы уменьшенной моделью генеральной совокупности (каждый кластер должен
отражать все многообразие элементов исходной совокупности), а в стратифицированной выборке генеральная совокупность подразделялась на слои, количественная характеристика
внутри которых стремилась к гомогенности;
5) цель кластерной выборки заключается в увеличении эффективности выборки при
уменьшении затрат на ее проведение, а цель стратифицированной выборки – увеличение
точности.
12
Как видно из рис. 12.3 существует две разновидности двухступенчатой кластерной
выборки:
1) простая двухступенчатая кластерная выборка, в которой простая случайная выборка применяется на обоих этапах – при выборке кластеров и при выборе элементов кластеров,
при этом количество отобранных на втором этапе элементов одинаково для каждого отобранного кластера (метод подходит в случае, когда все кластеры равны по объему (каждый
из них содержит одинаковое количество элементов) или их можно сделать таковыми объединив часть из них);
2) вероятностная выборка, пропорциональная объему, в которой кластеры отбираются
с вероятностью, пропорциональной их объему (который определяется количеством входящих в него единиц выборки), при этом на первом этапе бóльшие по объему кластеры имеют
бóльшую вероятность включения в выборку, но на втором этапе вероятность отбора единицы
из выбранного кластера обратно пропорциональная его объему, в связи с чем вероятность
включения в выборку будет равной для всех выборочных единиц, поскольку неравная вероятность включения на первой стадии отбора компенсируется неравной вероятностью включения на второй стадии.
Кластерная выборка обладает двумя основными преимуществами:
1) имеет более экономически эффективной, так как стоимость опроса в этом случае
ниже, чем при использовании других методов, что позволяет с меньшими затратами рассмотреть генеральную совокупность;
2) относительная легкость проведения, поскольку инструментариями для изучения
генеральной совокупности будут не отдельные ее элементы, а кластеры, сформировать которые существенно проще.
Но у нее есть следующие ограничения:
1) в результате отбора по кластерам создаются относительно не точные выборки;
2) сформировать неоднородные кластеры относительно сложно;
3) сложность расчета и оценки полученных статистических величин.
3.2.5 Другие методы вероятностной выборки
Для решения сложных проблем, возникающих в процессе выборки разработано множество других методов вероятностной выборки, большинство из которых являются разновидностями рассмотренных базовых. Для маркетинговых исследований определенную важность представляют:
1) последовательная выборка и
2) метод двойного контроля (метод двухэтапной выборки).
При последовательной выборке отбор элементов генеральной совокупности производится последовательно, при этом на каждом этапе собирается и анализируется информация и
принимается решение о дополнительном отборе элементов популяции.
Объем выборки изначально не известен, однако, перед тем, как начать отбор, исследователи устанавливают критерии формирования выборки. На каждом этапе отбора такие
критерии определяют, продолжать выборку или уже получено достаточно информации.
Такой метод может, например, использоваться для того, чтобы определить, какую из
альтернатив предпочтут потребители или для установления ценовой разницы между обычной и усовершенствованной моделями потребительских товаров длительного пользования.
При использовании метода двойного контроля некоторые элементы исследуемой популяции отбирают дважды.
На первом этапе проводится выборка и собирается некоторое количество информации
обо всех ее элементах. На втором этапе из элементов начальной выборки создается подгруппа и дальнейшая информация собирается уже об ее элементах.
Этот процесс может состоять из трех или больше этапов, и различные этапы могут
проводиться как одновременно, так и в разное время.
13
Метод двойного контроля полезен, когда нельзя сразу воспользоваться основой выборки для отбора конечных элементов выборки, но известно, что его элементы входят в более полную основу выборки
4 Принятие решения о выборе между детерминированной и вероятностной
выборками
Решение о применении детерминированного или вероятностного метода выбора элементов изучаемой совокупности должно приниматься с учетом аргументов, указанных в таблице 12.3 и присущих им преимуществ и недостатков, указанных в таблице 12.4.
Таблица 12.3 – Основные аргументы в пользу и против детерминированной и вероятностной
выборки
Условия, благоприятные для использования
выборки
детерминированной
вероятностной
Природа исследования
поисковое
итоговое
Относительное соотношение между величиной больше систематибольше ошибка высистематических ошибок и ошибок выборки
ческая ошибка
борки
Изменчивость изучаемой ситуации
низкая
высокая
Возможности применения статистических менеблагоприятные
благоприятные
тодов обработки данных
Требования к статистической подготовке исневысокие
высокие
следователей, затраты бюджета и времени
Факторы
Таблица 12.4 – Преимущества и недостатки основных методов формирования выборки
Методы выборки
Преимущества
Недостатки
Детерминированные выборки
Необъективность отбора
Нерепрезентативная Наименьшая стоимость
Наименьшая продолжительность Нерепрезентативность выборки
Наибольшее удобство отбора (не рекомендуется для проведеэлементов генеральной совокуп- ния дескриптивного и причинноследственного исследований)
ности
Поверхностная
Низкая стоимость
Не позволяет распространять поУдобство
лученные результаты на генеНебольшая продолжительность
ральную совокупность
Квотная
Может регулироваться по опре- Необъективность отбора
деленным характеристикам
Выборка по принци- Позволяет оценить необычные Большая продолжителность
пу «снежного кома» для совокупности характеристики
Вероятностные выборки
Простая случайная Проста для понимания
Сложно создать основу для вывыборка
борочного наблюдения
Систематическая
Позволяет увеличить репрезента- Может уменьшить репрезентавыборка
тивность
тивность
Проще в применении, чем простая случайная выборка
Не требуется основа выборки
14
окончание таблицы 12.4
Методы выборки
Преимущества
Недостатки
Стратифицированная Включает все важные подгруппы Сложно выбрать подходящие певыборка
совокупности
ременные для стратификации
Высокая точность
Невозможно стратифицирование
с учетом многих переменных
Большие затраты на проведение
Кластерная выборка Легка в применении
Низкая точность
Эффективна с точки зрения за- Сложно рассчитать и оценить ретрат
зультаты
5 Статистические методы определения объема вероятностной выборки
Еще одним важным решением, принимаемым при планировании маркетингового исследования, помимо проектирования выборки, является определение ее объема.
Объем выборки зависит не только от бюджета маркетингового исследования, но и от:
1) важности разрабатываемого и принимаемого решения;
2) характера маркетингового исследования;
3) количественных переменных;
4) характера и методов анализа данных;
5) типа выборки;
6) объемов выборки, которые использовались ранее в подобных исследованиях;
7) изучаемых статистик;
8) гомогенности генеральной совокупности;
9) коэффициента охвата элементов исследования;
10) коэффициента завершенности исследования;
11) наличных времени и персонала.
Если при исследовании используется любая выборка, кроме последовательной, маркетологу-исследователю, потребный объем выборки нужно определить до начала исследования.
Одной из задач выборочного наблюдения является вычисление значений выборочных
статистик – описаний характеристик выборки (таких как, например, выборочное среднее и
выборочная доля) – для каждой возможной из них, которая формируется из изучаемой совокупности при определенном плане исследования, и применение их для оценки соответствующих истинных значений (параметров) генеральной совокупности. А процесс распространения результатов оценки выборки на оценку генеральной совокупности называется статистическим заключением.
На практике изучение всех возможных выборок из генеральной совокупности и их
отдельное изучение, как правило, невозможно из-за возможного большого количества. Например, если в совокупности двадцать элементов исследования, то выборок, в каждой из которых их будет по пять, можно составить:
S=
20!
N!
=
= 1 860 480
(N − n )! (20 − 5)!
Требуемый же объем выборки определяется на основе выборочного распределения
конкретной статистики, отражающего изменение выборочной оценки как функции заданной выборки.
Статистически определенный объем выборки – это чистый или конечный объем
выборки, полученный после исключения потенциальных респондентов, которые не отвечают
заданным критериям. В зависимости от коэффициентов охвата и завершенности может по-
15
требоваться намного больший объем исходной выборки. Решающее значение при определении объема выборки может иметь недостаток времени, денежных средств и подготовленных
специалистов.
5.1 Определение объема выборки методом доверительных интервалов при простой случайной (собственно случайной), систематической (механической) и кластерной
(типической) выборках
Определение объема выборки методом доверительных интервалов основано на ее
создании с использованием формулы средней (стандартной, среднеквадратической) ошибки
выборки σ X вокруг выборочного среднего значения статистики (признака) X :
D
σ
=
n
n
σX =
где:
(12.2)
D – дисперсия (генеральная дисперсия) статистики (признака);
σ – среднее квадратическое отклонение статистики (признака).
При этом для генеральной совокупности и выборки соответственно:
n
~
x=
∑x
i
(12.3)
i =1
N
n
xn =
где:
∑x
i
(12.4)
i =1
n
xi – значение статистики (признака) у i-го элемента.
В соответствии с доказанной в 1901 г. А.М. Ляпуновым теоремой, распределение выборочных средних (а следовательно, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией:
~



P  x − x  ≤ ∆ x  =



где:
1
2π
t
∫e
−t 2
2
dt
(12.5)
−t
t – коэффициент доверия;
∆ x – предельная ошибка выборки, которая дает возможность выяснить, в каких пределах находится величина генеральной средней, рассчитываемая по формуле:
∆ x = ±t
σ2
n
= ±t
σ
n
= ±t × σ x
(12.6)
Значения интеграла (12.5) приведены в табл. 12.5.
Например, поскольку коэффициент доверия t указывает на вероятность расхождения
~
x − x , т.е. на вероятность того, на какую величину генеральная средняя будет отличаться от
выборочной средней, то для t = 2,06 это может быть прочитано так: с вероятностью 0,9606
можно утверждать, что разность между выборочной и генеральной средними не превышает
2,06 средней ошибки выборки. Или другими словами, в 96,06% случаев ошибка репрезента-
16
тивности не выйдет за пределы ± 2,06σ x . Таким образом, чем больше пределы, в которых
допускается возможная ошибка, тем с большей вероятностью судят о ее величине.
~


Таблица 12.5 – Значения функции P  x − x ≤ ∆ x  =


доверия 0,00 ≤ t ≤ 4,99
t
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
0,00
0,0000
0,0797
0,1585
0,2358
0,3108
0,3829
0,4515
0,5161
0,5763
0,6319
0,6827
0,7287
0,7699
0,8064
0,8385
0,8664
0,8904
0,9109
0,9281
0,9426
0,9545
0,9643
0,9722
0,9786
0,9836
0,9876
0,9907
0,9931
0,9949
0,9963
0,9973
0,9981
0,9986
0,9990
0,9993
0,9995
0,9997
0,9998
0,9999
0,9999
0,9999
0,01
0,0080
0,0876
0,1663
0,2434
0,3182
0,3899
0,4581
0,5223
0,5821
0,6372
0,6875
0,7330
0,7737
0,8098
0,8415
0,8690
0,8926
0,9127
0,9297
0,9439
0,9556
0,9651
0,9729
0,9791
0,9841
0,9879
0,9910
0,9933
0,9951
0,9964
0,9974
0,9981
0,9987
0,9991
0,9994
0,9996
0,9997
0,9998
0,9999
0,9999
0,9999
0,02
0,0160
0,0955
0,1741
0,2510
0,3255
0,3969
0,4647
0,5285
0,5878
0,6424
0,6923
0,7373
0,7775
0,8132
0,8444
0,8715
0,8948
0,9146
0,9312
0,9451
0,9566
0,9660
0,9736
0,9797
0,9845
0,9883
0,9912
0,9935
0,9952
0,9965
0,9975
0,9982
0,9987
0,9991
0,9994
0,9996
0,9997
0,9998
0,9999
0,9999
0,9999
0,03
0,0239
0,1034
0,1819
0,2586
0,3328
0,4039
0,4713
0,5346
0,5935
0,6476
0,6970
0,7415
0,7813
0,8165
0,8473
0,8740
0,8969
0,9164
0,9327
0,9464
0,9576
0,9668
0,9743
0,9802
0,9849
0,9886
0,9915
0,9937
0,9953
0,9966
0,9976
0,9983
0,988
0,9991
0,9994
0,9996
0,9997
0,9998
0,9999
0,9999
0,9999
0,04
0,0319
0,1113
0,1897
0,2661
0,3401
0,4108
0,4778
0,5407
0,5991
0,6528
0,7017
0,7457
0,7850
0,8198
0,8501
0,8764
0,8990
0,9181
0,9342
0,9476
0,9586
0,9676
0,9749
0,9807
0,9853
0,9889
0,9917
0,9939
0,6655
0,9967
0,9976
0,9983
0,9988
0,9992
0,9994
0,9996
0,9997
0,9998
0,9999
0,9999
0,9999
1
2π
t
∫e
−t 2
2
dt для значений коэффициента
−t
0,05
0,0399
0,1192
0,1974
0,2737
0,3473
0,4177
0,4843
0,5467
0,6047
0,6579
0,7063
0,7499
0,7887
0,8230
0,8529
0,8789
0,9011
0,9199
0,9357
0,9488
0,9596
0,9684
0,9756
0,9812
0,9857
0,9892
0,9920
0,9940
0,9956
0,9968
0,9977
0,9984
0,9989
0,9992
0,9994
0,9996
0,9997
0,9998
0,9999
0,9999
0,9999
0,06
0,0478
0,1271
0,2051
0,2812
0,3545
0,4245
0,4907
0,5527
0,6102
0,6629
0,7109
0,7540
0,7923
0,8262
0,8557
0,8812
0,9031
0,9216
0,9371
0,9500
0,9606
0,9682
0,9762
0,9817
0,9861
0,9895
0,9922
0,9942
0,9958
0,9969
0,9978
0,9984
0,9989
0,9992
0,9995
0,9996
0,9997
0,9998
0,9999
0,9999
0,9999
0,07
0,0558
0,1350
0,2128
0,2886
0,3616
0,4313
0,4971
0,5587
0,6157
0,6679
0,7154
0,7580
0,7959
0,8293
0,8584
0,8836
0,9051
0,9233
0,9385
0,9512
0,9616
0,9700
0,9768
0,9822
0,9865
0,9898
0,9924
0,9944
0,9959
0,9970
0,9979
0,9985
0,9989
0,9992
0,9995
0,9996
0,9998
0,9998
0,9999
0,9999
0,9999
0,08
0,0638
0,1428
0,2205
0,2960
0,3688
0,4381
0,5035
0,5646
0,6211
0,6729
0,7199
0,7620
0,7994
0,8324
0,8611
0,8859
0,9070
0,9249
0,9399
0,9523
0,9625
0,9707
0,9774
09827
0,9869
0,9901
0,9926
0,9946
0,9960
0,9971
0,9979
0,9985
0,9990
0,9993
0,9995
0,9997
0,9998
0,9998
0,9999
0,9999
0,9999
0,09
0,0717
0,1507
0,2281
0,3035
0,3759
0,4448
0,5098
0,5705
0,6264
0,6778
0,7243
0,7660
0,8029
0,8355
0,8638
0,8882
0,9090
0,9265
0,9412
0,9534
0,9634
0,9715
0,9780
0,9832
0,9872
0,9904
0,9928
0,9947
0,9961
0,9972
0,9980
0,9986
0,9990
0,9993
0,9995
0,9997
0,9998
0,9998
0,9999
0,9999
0,9999
17
Зная выборочную среднюю статистики (признака) и предельную ошибку выборки
можно определить границы (пределы) (доверительный интервал), в которых заключена генеральная средняя:
~
x − t ×σ x ≤ x ≤ x + t ×σ x
(12.7)
Определение объема выборки методом доверительных интервалов проводится в следующем порядке:
1. Определяется степень точности (размер доверительного интервала) результатов обследования респондентов.
2. Устанавливается необходимое значение вероятности достоверности и в соответствии с ним из таблицы 12.5 выбирается коэффициент достоверности.
3. По итогам изучения вторичных источников или проведения пилотного исследования определяется значение среднего квадратического отклонения среднего генеральной совокупности. Если мера колеблемости признака неизвестна, то ее можно найти приближенно
по величине предполагаемого размаха статистики (признака) R по формуле:
σx =
R
6
(12.8)
4. Определяется объем выборки по формулам табл. 12.6.
Таблица 12.6 – Формулы для определения объема выборки при использовании вероятностных методов при установленном среднем значении статистики (признака)
Методы выборки
Простая случайная (собственно
случайная)
Систематическая (механическая)
С повторным отбором
n=
Кластерная (групповая, типическая)
t 2 × σ x2
∆2x
Без повторного отбора
n=
2
t2 ×σ x
n=
∆2x
t 2 × σ x2 × N
∆2x × N + t 2 × σ x2
2
n=
t2 ×σ x × N
2
∆2x × N + t 2 × σ x
5. Если объем выборки составляет 10% и больше от объема генеральной совокупности, то применяется окончательная коррекция совокупности. Затем необходимый объем выборки рассчитывается по формуле:
nc =
n× N
N + n −1
(12.9)
6. Если изначально среднее квадратическое отклонение совокупности σ было неизвестно и использовалось его предположительное значение (рассчитанное по формуле (12.8)),
то его следует повторно рассчитать после получения выборки по формуле:
∑ (x
n
σ=
i
−x
i =1
2
)
(12.10)
n
7. Используя формулы (12.2), (12.6) и (12.7), рассчитать исправленный доверительный
интервал, чтобы определить фактическую степень точности.
18
Иллюстративная задача 1
Условие:
Генеральная совокупность потребителей продукции компании составляет 10 450 семей. Совокупный среднемесячный доход каждый семьи в ходе пилотного опроса предварительно был установлен в размере 560 руб., а размах его значений – 270 руб.
Требуется определить объем выборки потребителей, который позволил бы установить
среднемесячный доход семей – потребителей продукции компании с точностью ±5 руб. с вероятностью 95%.
Решение:
1) степень точности в соответствии с условием задачи составляет ±5 руб;
2) в соответствии с указанным в условии задачи значение вероятности достоверности
установлено на уровне 95%, следовательно в соответствии с табл. 12.5 коэффициент достоверности t равен 1,96;
3) так как мера колеблемости признака пока конкретно неизвестна, то она находится
приближенно по формуле (12.8):
σ =
R 270
=
= 45,00 руб.
6
6
4) доверительный интервал в этом случае будет равен:
~
560 − 1,96 × 45 ≤ x ≤ 560 + 1,96 × 45
или
~
471,8 ≤ x ≤ 648,2
5) размер выборки при условии что выборка является простой случайной и отбор является
– бесповторным:
n=
t 2 × σ x2 × N
∆2x × N + t 2 × σ x2
=
1,96 2 × 45 2 × 10450
81293058
=
≈ 302,17 ≈ 302 семьи
2
2
2
5 × 10450 + 1,96 × 45
269029 ,24
– с повторным отбором:
n=
t 2 × σ x2
∆2x
=
1,96 2 × 45 2 7779 ,24
=
≈ 302,17 ≈ 311,17 ≈ 311 семей
52
25
6) так как размер требуемой выборки не превышает 10% генеральной совокупности,
то коррекция объема выборки производится не будет.
В том случае если изучаемая статистика (параметр) выборки является не средним значением, а долей, то объем выборки проводится в аналогичном порядке. Но при этом используются формулы, приведенные в табл. 12.7.
Таблица 12.7 – Формулы для определения объема выборки при использовании вероятностных методов при установленном значении выборочной доли
Методы выборки
Простая случайная (собственно
случайная)
Систематическая (механическая)
С повторным отбором
n=
t 2 × w × (1 − w)
∆2w
Без повторного отбора
n=
t 2 × w × (1 − w) × N
∆2w × N + t 2 × w × (1 − w)
19
окончание таблицы 12.7
Методы выборки
Кластерная (групповая, типическая)
С повторным отбором
Без повторного отбора
t 2 × w × (1 − w)
n=
∆2w
t 2 × w × (1 − w) × N
n= 2
∆ w × N + t 2 × w × (1 − w)
Иллюстративная задача 2
Условие:
Генеральная совокупность потребителей продукции торгового центра составляет
примерно 6 910 семей. Средняя доля потребителей, которые пользуются его дисконтными
картами, в ходе пилотного опроса предварительно была установлен в размере 64%, а размах
ее значения – примерно 1,8%.
Требуется определить объем выборки потребителей, который позволил бы установить
с точностью ±3% долю семей, пользующихся дисконтными картами, с вероятностями 98%.
Решение:
1) степень точности в соответствии с условием задачи составляет ±3% или 0,03;
2) в соответствии с указанным в условии задачи значение вероятности достоверности
установлено на уровне 98%, следовательно в соответствии с табл. 12.5 коэффициент достоверности t равен 2,325;
3) так как мера колеблемости признака пока конкретно неизвестна, то она находится
приближенно по формуле (12.8):
σ =
R 0,018
=
= 0,003
6
6
4) доверительный интервал в этом случае будет равен:
~
0,64 − 2,325 × 0,003 ≤ x ≤ 0,64 + 2,325 × 0,003
или
~
0,633 ≤ x ≤ 0,647
5) размер выборки при условии что выборка является простой случайной и отбор является
– бесповторным:
n=
=
t 2 × w × (1 − w ) × N
2,235 2 × 0,64 × (1 − 0,64 ) × 6910
=
=
∆2w × N + t 2 × w × (1 − w ) 0,03 2 × 6910 + 2,235 2 × 0,64 × (1 − 0,64 )
7952 ,72
≈ 1079 ,07 ≈ 1079 семей
7,37
– бесповторным:
n=
t 2 × w × (1 − w) 2,235 2 × 0,64 × (1 − 0,64 ) 1,151
=
=
≈ 1278,78 ≈ 1279 семей
∆2w
0,03 2
0,0009
6) так как размер требуемой выборки превышает 10% генеральной совокупности, то
коррекция объема выборки должна быть произведена. Сделаем это для бесповторной выборки:
20
nc =
1079 × 6910
≈ 933,39 ≈ 933 семьи
6910 + 1079 − 1
5.2 Корректировка статистически определенного объема выборки
Статистически определенный объем выборки представляет собой конечный (чистый)
объем, который необходимо получить, чтобы обеспечить расчет параметров с желательной
степенью точности и заданным уровнем достоверности. При проведении опросов этот объем
выражается в количестве завершенных интервью. Но для получения конечного объема выборки необходимо связаться с гораздо бóльшим количеством потенциальных респондентов,
т.е. начальный объем выборки должен намного превышать конечный, поскольку коэффициенты охвата и завершенности обычно составляют меньше чем 100%.
Коэффициентом охвата называется степень наличия или процент людей, подходящих для участия в исследовании. Этот коэффициент определяет, какое количество контактов
с людьми необходимо осуществить, чтобы в итоге получить объем выборки, соответствующий заданным критериям.
При определении объема выборки необходимо учитывать ожидаемые отказы людей,
соответствующих критериям исследования. Коэффициент завершенности указывает на процент респондентов, соответствующих критериям отбора, которые полностью прошли интервью.
Таким образом, количество респондентов, которое необходимо отобрать, определяется начальным объемом выборки:
n start =
n
=
IR × CR
n
k
∏q
i
× CR
(12.11)
i =1
где:
n – конечный объем выборки;
IR – коэффициент охвата респондентов;
qi – доля респондентов, соответствующих i-му критерию их отбора в выборку;
k – количество критериев, установленных для отбора респондентов в выборку;
CR – коэффициент завершенности.
5.3 Решение проблемы ненаблюдения при опросе респондентов и пути их устранения
Основными задачами, решение которых должно привести к увеличению числа ответов при проведении опроса в выборке являются:
1) увеличение коэффициента отклика и
2) корректировка результатов с учетом неполученных данных.
5.3.1 Увеличение коэффициента отклика респондентов
Высокий коэффициент отклика уменьшает вероятность возникновения существенной
ошибки неполучения данных.
Главными причинами низкого коэффициента отклика респондентов являются:
1) отказы от сотрудничества, вытекающие из нежелания или неспособности принимать участие в опросе;
2) отсутствие на месте.
Возможные методы увеличения этого показателя показаны на рис. 12.4.
Предварительное уведомление респондентов предполагает направление им письма с
сообщением о проведении почтового, телефонного или электронного опроса.
21
Методы увеличения коэффициента отклика
Уменьшение количества отказов
респондентов
Предварительное уведомление
Мотивация
респондентов
Вознаграждение респондентов
Неоднократные попытки установить контакт и периодическое напоминание об интервью
Оформление анкеты и
высокий уровень квалификации интервьюеров
Персонификация
респондентов
Уменьшение количества случаев, когда респондента нет на
месте
Повторные
звонки
Звонки в определенные часы
и дни
Рисунок 12.4 – Методы увеличения коэффициента отклика респондентов
Потенциальных респондентов можно привлечь, увеличив степень их заинтересованности участия в опросе с помощью последовательно расположенных вопросов, используя
следующие способы (стратегии) мотивации:
1) стратегию «снизу вверх», когда интервью начинается с относительно небольших
просьб о согласии дать ответы на несложные вопросы с постепенным переходом к предложению принять участие в опросе или эксперименте;
2) стратегию «сверху вниз», когда интервью начинается с существенной просьбы (например, приобрести или опробовать товар) с постепенным переходом к предложению принять участие в опросе или эксперименте.
Вознаграждение как денежное, так и неденежное (в форме приза или награды) может
быть:
1) предварительным, которое предлагается во время проведения опроса или заполнения анкеты;
2) обещанным, которое выдается только тем респондентам, которые полностью прошли опрос.
5.3.2 Корректировка результатов с учетом неполученных данных
При проведении опроса интервьюер и исследователь регулярно должен рассчитывать
процент неответивших респондентов и, по возможности, оценивать влияние неполучения
данных на результат исследования.
Даже если оценка последствий ненаблюдения невозможна, все равно в процессе анализа и оценки полученной информации необходимы некоторые корректировки. Методами
такой корректировки являются:
1) проведение отдельного опроса подгруппы неответивших респондентов с помощью
телефона или индивидуального интервью и распространение полученных значений на всех
неответивших респондентов;
22
2) замена респондентов, не ответивших на вопросы данного исследования, на респондентов, не ответившими на вопросы аналогичного исследования, проведенного ранее. При
этом:
– возможно предложение вознаграждения
– причины неполучения данных в обоих исследованиях должны совпадать,
– категории респондентов должны быть аналогичными,
– временной интервал между исследованиями должен быть коротким;
3) подстановка других элементов основы выборки (которая разделена на подгруппы,
внутренне однородные по характеристикам респондентов, но с различными значениями коэффициента отклика) вместо неответивших респондентов;
4) субъективная оценка исследователем причин и вероятных последствий неполучения данных на основе собственного опыта и доступной информации;
5) распространение на неответивших респондентов тенденции между ответами респондентов более раннего и более позднего исследований;
6) взвешивание, предполагающее внесение исследователем поправки на отсутствие
ответов при применении к данным различных весов в зависимости от коэффициента отклика
(значение весомости ответов, может быть, например, обратно пропорционально коэффициентам откликов в подгруппах респондентов);
7) приписывание или присваивание исследователем значений исследуемой характеристики неответившим респондентам, учитывая индентичность переменных, присущих неответившим и ответившим респондентам.
Download