Основа выборки - Sampling frame
В статистике , А структура выборки является исходным материалом или устройство , из которого образец втягивается. Это список всех тех , кто в популяции , которые могут быть выбраны, и может включать в себя отдельные лица, семьи или учреждения.
Важность основы выборки подчеркивают Джессен, Салант и Диллман.
Во многих практических ситуациях рама - это вопрос выбора планировщика геодезии, а иногда и критический. [...] Некоторые очень важные исследования вообще не проводятся из-за отсутствия очевидной основы; другие, из-за ошибочных кадров, закончились катастрофой или облаком сомнений .
- Раймонд Джеймс Джессен
Получение и организация основы выборки
В самых простых случаях, например, при работе с партией материала из производственного цикла или с использованием переписи , можно идентифицировать и измерить каждый отдельный элемент в генеральной совокупности и включить любой из них в нашу выборку; это называется прямым отбором элементов . Однако во многих других случаях это невозможно; либо потому, что это слишком дорого (охват каждого гражданина страны), либо невозможно (охват всех живущих людей).
Создав структуру, существует несколько способов ее организации для повышения эффективности и результативности. Именно на этом этапе исследователь должен решить, действительно ли выборка будет представлять собой всю совокупность и, следовательно, будет ли это перепись .
Этот список также должен облегчить доступ к выбранным единицам выборки . Фрейм также может предоставлять дополнительную «вспомогательную информацию» о своих элементах; когда эта информация связана с переменными или группами интересов, ее можно использовать для улучшения дизайна обследования. Хотя это не обязательно для простой выборки, основа выборки, используемая для более сложных методов выборки, таких как стратифицированная выборка , может содержать дополнительную информацию (например, демографическую информацию ). Например, список избирателей может включать имя и пол; эту информацию можно использовать для гарантии того, что выборка, взятая из этого фрейма, охватывает все интересующие демографические категории. (Иногда вспомогательная информация менее ясна; например, номер телефона может предоставить некоторую информацию о местонахождении.
Качество основы выборки
Идеальная основа выборки должна обладать следующими качествами:
- все блоки имеют логический числовой идентификатор
- можно найти все объекты - их контактная информация, местоположение на карте или другая важная информация присутствует
- фрейм организован логично, систематично
- в структуре есть дополнительная информация об единицах, которая позволяет использовать более сложные структуры выборки
- в кадре присутствует каждый элемент интересующей совокупности
- каждый элемент популяции присутствует в кадре только один раз
- в кадре отсутствуют элементы, не относящиеся к интересующей нас популяции
- данные "актуальны"
Типы рамок выборки
Самый простой тип фрейма - это список элементов совокупности (предпочтительно всего населения) с соответствующей контактной информацией. Например, при опросе общественного мнения возможные рамки выборки включают список избирателей или телефонный справочник . Другие основы выборки могут включать записи о занятости, списки школьных классов, файлы пациентов в больнице, организации, перечисленные в тематической базе данных, и так далее. На более практическом уровне рамки выборки имеют форму компьютерных файлов .
Не во всех фреймах явно перечислены элементы совокупности; некоторые перечисляют только «кластеры». Например, карту улиц можно использовать в качестве рамки для поквартирного обследования; хотя он не показывает отдельные дома, мы можем выбрать улицы на карте, а затем выбрать дома на этих улицах. Это дает некоторые преимущества: такой фрейм будет включать людей, которые недавно переехали и еще не вошли в список фреймов, обсужденных выше, и его может быть проще использовать, потому что он не требует хранения данных для каждой единицы в генеральной совокупности, только для меньшее количество кластеров.
Проблемы с рамками выборки
Основа выборки должна быть репрезентативной для населения, и это вопрос, выходящий за рамки статистической теории, требующий заключения экспертов по конкретному изучаемому предмету. Во всех вышеупомянутых кадрах отсутствуют некоторые люди, которые будут голосовать на следующих выборах, и есть некоторые люди, которые не будут голосовать; некоторые кадры будут содержать несколько записей для одного и того же человека. Люди, не попавшие в кадр, не имеют никаких шансов попасть в выборку.
Поскольку основанная на кластерах структура содержит меньше информации о генеральной совокупности, она может накладывать ограничения на план выборки, возможно, требуя использования менее эффективных методов выборки и / или усложняя интерпретацию полученных данных.
Статистическая теория говорит нам о неопределенностях при экстраполяции от выборки к структуре. Следует ожидать, что образцы кадров всегда будут содержать некоторые ошибки. В некоторых случаях это может привести к смещению выборки . Такую предвзятость следует свести к минимуму и выявить, хотя полностью избежать ее в реальном мире практически невозможно. Не следует также предполагать, что таковыми являются источники, претендующие на объективность и репрезентативность.
При определении рамок необходимо учитывать практические, экономические, этические и технические вопросы. Необходимость получения своевременных результатов может помешать расширить рамки далеко в будущее. Трудности могут быть очень серьезными, когда совокупность и структура не пересекаются . Это особая проблема при прогнозировании, когда выводы о будущем делаются на основе исторических данных . Фактически, в 1703 году, когда Якоб Бернулли предложил Готфриду Лейбницу возможность использования исторических данных о смертности для прогнозирования вероятности ранней смерти живого человека, Готфрид Лейбниц осознал проблему, ответив:
Природа установила закономерности, берущие начало в возвращении событий, но только по большей части. Новые болезни наводняют человечество, так что сколько бы экспериментов вы ни проводили над трупами, вы тем самым не ограничили природу событий, чтобы в будущем они не могли меняться.
- Готфрид Лейбниц
Лесли Киш сформулировал четыре основные проблемы основ выборки:
- Отсутствующие элементы: Некоторые представители населения не включены в кадр.
- Посторонние элементы: в кадр включены лица, не являющиеся членами населения.
- Повторяющиеся записи: член населения опрашивается более одного раза.
- Группы или кластеры: во фрейме перечислены кластеры, а не отдельные лица.
Проблемы, подобные перечисленным, могут быть выявлены с помощью предварительных обследований и пилотных исследований .