Основа выборки - Sampling frame

В статистике , А структура выборки является исходным материалом или устройство , из которого образец втягивается. Это список всех тех , кто в популяции , которые могут быть выбраны, и может включать в себя отдельные лица, семьи или учреждения.

Важность основы выборки подчеркивают Джессен, Салант и Диллман.

Во многих практических ситуациях рама - это вопрос выбора планировщика геодезии, а иногда и критический. [...] Некоторые очень важные исследования вообще не проводятся из-за отсутствия очевидной основы; другие, из-за ошибочных кадров, закончились катастрофой или облаком сомнений .

-  Раймонд Джеймс Джессен

Получение и организация основы выборки

В самых простых случаях, например, при работе с партией материала из производственного цикла или с использованием переписи , можно идентифицировать и измерить каждый отдельный элемент в генеральной совокупности и включить любой из них в нашу выборку; это называется прямым отбором элементов . Однако во многих других случаях это невозможно; либо потому, что это слишком дорого (охват каждого гражданина страны), либо невозможно (охват всех живущих людей).

Создав структуру, существует несколько способов ее организации для повышения эффективности и результативности. Именно на этом этапе исследователь должен решить, действительно ли выборка будет представлять собой всю совокупность и, следовательно, будет ли это перепись .

Этот список также должен облегчить доступ к выбранным единицам выборки . Фрейм также может предоставлять дополнительную «вспомогательную информацию» о своих элементах; когда эта информация связана с переменными или группами интересов, ее можно использовать для улучшения дизайна обследования. Хотя это не обязательно для простой выборки, основа выборки, используемая для более сложных методов выборки, таких как стратифицированная выборка , может содержать дополнительную информацию (например, демографическую информацию ). Например, список избирателей может включать имя и пол; эту информацию можно использовать для гарантии того, что выборка, взятая из этого фрейма, охватывает все интересующие демографические категории. (Иногда вспомогательная информация менее ясна; например, номер телефона может предоставить некоторую информацию о местонахождении.

Качество основы выборки

Идеальная основа выборки должна обладать следующими качествами:

  • все блоки имеют логический числовой идентификатор
  • можно найти все объекты - их контактная информация, местоположение на карте или другая важная информация присутствует
  • фрейм организован логично, систематично
  • в структуре есть дополнительная информация об единицах, которая позволяет использовать более сложные структуры выборки
  • в кадре присутствует каждый элемент интересующей совокупности
  • каждый элемент популяции присутствует в кадре только один раз
  • в кадре отсутствуют элементы, не относящиеся к интересующей нас популяции
  • данные "актуальны"

Типы рамок выборки

Самый простой тип фрейма - это список элементов совокупности (предпочтительно всего населения) с соответствующей контактной информацией. Например, при опросе общественного мнения возможные рамки выборки включают список избирателей или телефонный справочник . Другие основы выборки могут включать записи о занятости, списки школьных классов, файлы пациентов в больнице, организации, перечисленные в тематической базе данных, и так далее. На более практическом уровне рамки выборки имеют форму компьютерных файлов .

Не во всех фреймах явно перечислены элементы совокупности; некоторые перечисляют только «кластеры». Например, карту улиц можно использовать в качестве рамки для поквартирного обследования; хотя он не показывает отдельные дома, мы можем выбрать улицы на карте, а затем выбрать дома на этих улицах. Это дает некоторые преимущества: такой фрейм будет включать людей, которые недавно переехали и еще не вошли в список фреймов, обсужденных выше, и его может быть проще использовать, потому что он не требует хранения данных для каждой единицы в генеральной совокупности, только для меньшее количество кластеров.

Проблемы с рамками выборки

Основа выборки должна быть репрезентативной для населения, и это вопрос, выходящий за рамки статистической теории, требующий заключения экспертов по конкретному изучаемому предмету. Во всех вышеупомянутых кадрах отсутствуют некоторые люди, которые будут голосовать на следующих выборах, и есть некоторые люди, которые не будут голосовать; некоторые кадры будут содержать несколько записей для одного и того же человека. Люди, не попавшие в кадр, не имеют никаких шансов попасть в выборку.

Поскольку основанная на кластерах структура содержит меньше информации о генеральной совокупности, она может накладывать ограничения на план выборки, возможно, требуя использования менее эффективных методов выборки и / или усложняя интерпретацию полученных данных.

Статистическая теория говорит нам о неопределенностях при экстраполяции от выборки к структуре. Следует ожидать, что образцы кадров всегда будут содержать некоторые ошибки. В некоторых случаях это может привести к смещению выборки . Такую предвзятость следует свести к минимуму и выявить, хотя полностью избежать ее в реальном мире практически невозможно. Не следует также предполагать, что таковыми являются источники, претендующие на объективность и репрезентативность.

При определении рамок необходимо учитывать практические, экономические, этические и технические вопросы. Необходимость получения своевременных результатов может помешать расширить рамки далеко в будущее. Трудности могут быть очень серьезными, когда совокупность и структура не пересекаются . Это особая проблема при прогнозировании, когда выводы о будущем делаются на основе исторических данных . Фактически, в 1703 году, когда Якоб Бернулли предложил Готфриду Лейбницу возможность использования исторических данных о смертности для прогнозирования вероятности ранней смерти живого человека, Готфрид Лейбниц осознал проблему, ответив:

Природа установила закономерности, берущие начало в возвращении событий, но только по большей части. Новые болезни наводняют человечество, так что сколько бы экспериментов вы ни проводили над трупами, вы тем самым не ограничили природу событий, чтобы в будущем они не могли меняться.

-  Готфрид Лейбниц

Лесли Киш сформулировал четыре основные проблемы основ выборки:

  1. Отсутствующие элементы: Некоторые представители населения не включены в кадр.
  2. Посторонние элементы: в кадр включены лица, не являющиеся членами населения.
  3. Повторяющиеся записи: член населения опрашивается более одного раза.
  4. Группы или кластеры: во фрейме перечислены кластеры, а не отдельные лица.

Проблемы, подобные перечисленным, могут быть выявлены с помощью предварительных обследований и пилотных исследований .

Ссылки