Сбор данных - Data collection

Пример сбора данных в биологических науках: пингвины Адели идентифицируются и взвешиваются каждый раз, когда они пересекают автоматизированные весы на пути в море или из моря.

Сбор данных - это процесс сбора и измерения информации о целевых переменных в установленной системе, который затем позволяет ответить на соответствующие вопросы и оценить результаты. Сбор данных - это компонент исследования во всех областях обучения, включая физические и социальные науки , гуманитарные науки и бизнес . Хотя методы различаются в зависимости от дисциплины, акцент на обеспечении точного и честного сбора остается неизменным. Целью сбора всех данных является сбор качественных доказательств, которые позволяют анализу дать убедительные и достоверные ответы на поставленные вопросы. Сбор и проверка данных состоят из четырех этапов, когда они включают проведение переписи, и семи этапов, когда они включают выборку.

Независимо от области исследования или предпочтения определения данных ( количественных или качественных ), точный сбор данных имеет важное значение для поддержания целостности исследования. Выбор подходящих инструментов сбора данных (существующих, модифицированных или вновь разработанных) и подробных инструкций по их правильному использованию снижает вероятность ошибок .

Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются как определенными, так и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием достоверных данных. Этот процесс обеспечивает как основу для измерения, так и в некоторых случаях указание на то, что следует улучшить.

Существует 5 распространенных методов сбора данных:

  1. закрытые опросы и викторины,
  2. открытые опросы и анкеты,
  3. Индивидуальные интервью,
  4. фокус-группы и
  5. прямое наблюдение.

DMP и сбор данных

DMP - это аббревиатура от платформы управления данными. Это централизованная система хранения и анализа данных. DMP, в основном используемые маркетологами, существуют для компиляции и преобразования больших объемов данных в различимую информацию. Маркетологи могут захотеть получать и использовать первые, вторые и сторонние данные. DMP позволяют это сделать, потому что они представляют собой совокупную систему DSP (платформа на стороне спроса) и SSP (платформа на стороне предложения). Когда дело доходит до рекламы, DMP являются неотъемлемой частью оптимизации и направления маркетологов в будущих кампаниях. Эта система и ее эффективность являются доказательством того, что категоризированные, проанализированные и скомпилированные данные гораздо полезнее, чем необработанные данные.

Сбор данных на z / OS

z / OS - широко используемая операционная система для мэйнфреймов IBM . Он разработан, чтобы предложить стабильную, безопасную и постоянно доступную среду для приложений, работающих на мэйнфрейме. Рабочие данные - это данные, которые система z / OS производит при запуске. Эти данные указывают на работоспособность системы и могут использоваться для определения источников проблем с производительностью и доступностью в системе. Анализ операционных данных аналитическими платформами дает понимание и рекомендуемые действия для повышения эффективности работы системы, а также для решения или предотвращения проблем. IBM Z Common Data Provider собирает операционные данные ИТ из систем z / OS, преобразует их в расходный формат и передает их на аналитические платформы.

IBM Z Common Data Provider поддерживает сбор следующих рабочих данных:

  • Данные средств управления системой (SMF)
  • Данные журнала из следующих источников:
    • Журнал заданий, вывод, который записывается в определение данных (DD) выполняющимся заданием.
    • Файл журнала z / OS UNIX, включая системный журнал системных служб UNIX (syslogd)
    • Кластер метода доступа к виртуальному хранилищу с последовательным входом (VSAM)
    • системный журнал z / OS (SYSLOG)
    • Сообщения IBM Tivoli NetView для z / OS
    • Журнал IBM WebSphere Application Server для z / OS High Performance Extensible Logging (HPEL)
    • Отчеты IBM Resource Measurement Facility (RMF) Monitor III
  • Данные пользовательского приложения, операционные данные из собственных приложений пользователей

Проблемы целостности данных

Основная причина сохранения целостности данных - поддержка обнаружения ошибок в процессе сбора данных. Эти ошибки могут быть сделаны намеренно (преднамеренная фальсификация) или непреднамеренно ( случайные или систематические ошибки ).

Есть два подхода, которые могут защитить целостность данных и обеспечить научную достоверность результатов исследований, изобретенных Крэддиком, Кроуфордом, Роудсом, Редиканом, Рукенбродом и Лоусом в 2003 году:

  • Гарантия качества - все действия, выполняемые перед сбором данных
  • Контроль качества - все действия, выполняемые во время и после сбора данных

Гарантия качества

Его основное внимание уделяется предотвращению, которое в первую очередь является рентабельной деятельностью по защите целостности сбора данных. Стандартизация протокола лучше всего демонстрирует эту рентабельную деятельность, которая разработана в подробном и подробном руководстве по процедурам сбора данных. Риск не выявить проблемы и ошибки в процессе исследования, очевидно, вызван плохо написанными инструкциями. Перечислены несколько примеров таких сбоев:

  • Неопределенность сроков, методов и определения ответственного лица
  • Частичный список предметов, которые необходимо было забрать
  • Расплывчатое описание инструментов сбора данных вместо строгих пошаговых инструкций по проведению тестов
  • Неспособность распознать точное содержание и стратегии обучения и переподготовки сотрудников, ответственных за сбор данных
  • Неясные инструкции по использованию, настройке и калибровке оборудования для сбора данных
  • Нет заранее определенного механизма для документирования изменений в процедурах, которые происходят во время расследования.

Контроль качества

Поскольку действия по контролю качества происходят во время или после сбора данных, все детали тщательно документируются. Существует необходимость в четко определенной коммуникационной структуре в качестве предварительного условия для создания систем мониторинга. Неуверенность в потоке информации не рекомендуется, поскольку плохо организованная структура связи ведет к слабому мониторингу, а также может ограничивать возможности для обнаружения ошибок. Контроль качества также отвечает за идентификацию действий, необходимых для исправления неправильных методов сбора данных, а также за минимизацию таких случаев в будущем. Команда с большей вероятностью не осознает необходимость выполнения этих действий, если их процедуры написаны расплывчато и не основаны на обратной связи или образовании.

Проблемы со сбором данных, требующие незамедлительных действий:

  • Систематические ошибки
  • Нарушение протокола
  • Мошенничество или нарушение научной этики
  • Ошибки в отдельных элементах данных
  • Проблемы с производительностью отдельных сотрудников или сайта

Смотрите также

использованная литература

внешние ссылки