Ложноположительная ставка - False positive rate

В статистике при выполнении множественных сравнений коэффициент ложноположительных результатов (также известный как коэффициент выпадений или ложных тревог) - это вероятность ложного отклонения нулевой гипотезы для конкретного теста . Частота ложных срабатываний рассчитывается как отношение количества отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общего количества фактических отрицательных событий (независимо от классификации).

Ложноположительным скорость (или «ложные тревоги») , как правило , относится к продолжительности ложного положительного соотношения .

Определение

Уровень ложных срабатываний

где - количество ложных срабатываний, - количество истинных отрицаний и - общее количество истинных отрицаний.

Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и поддерживающих ее критериев (например, FWER или FDR ), которые были предварительно определены исследователем.

При выполнении нескольких сравнений в статистической основе , такие , как указаны выше, то ложный положительный коэффициент (также известный как отношение ложных тревог , в отличие от ложных срабатываний скорости / ложная тревога скорости ) обычно относится к вероятности ложно отклонения нулевой гипотезы для конкретного тест . Используя предложенную здесь терминологию, это просто .

Так как V является случайной величиной , и является константой ( ), ложный положительный коэффициент также случайная величина, в диапазоне от 0-1. Частота ложных срабатываний (или «частота ложных тревог») обычно относится к ожидаемому соотношению ложных срабатываний , выраженному как .

Стоит отметить, что эти два определения («коэффициент ложных срабатываний» / «процент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в упомянутой статье используется ложноположительный «коэффициент», а не его «коэффициент».

Классификация множественных проверок гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, что у нас есть m нулевых гипотез, обозначенных как H 1 H 2 , ...,  H m . Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование результатов каждого типа по всем H i   дает следующие случайные величины:

Нулевая гипотеза верна (H 0 ) Альтернативная гипотеза верна (H A ) Общее
Тест объявлен значимым V S р
Тест объявлен несущественным U Т
Общее м

В m проверках гипотез, из которых являются истинными нулевыми гипотезами, R - наблюдаемая случайная величина, а S , T , U и V - ненаблюдаемые случайные величины .

Сравнение с другими показателями ошибок

Хотя частота ложных срабатываний математически равна частоте ошибок типа I , она рассматривается как отдельный термин по следующим причинам:

  • Частота ошибок типа I часто связана с априорной установкой уровня значимости исследователем: уровень значимости представляет собой приемлемую частоту ошибок, учитывая, что все нулевые гипотезы верны ( гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. Д.)
В отличие от этого, частота ложных срабатываний связана с последующим результатом, который представляет собой ожидаемое количество ложных срабатываний, деленное на общее количество гипотез при реальной комбинации истинных и ложных нулевых гипотез (без учета «глобального нулевая гипотеза). Поскольку количество ложных срабатываний - это параметр, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.
  • Более того, коэффициент ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (например, «уровень ложных срабатываний определенного диагностического устройства составляет 1%»), в то время как ошибка типа I - это термин, связанный со статистическими тестами, где значение слово «положительный» не так однозначно (например, «ошибка типа I теста составляет 1%»).

Также не следует путать частоту ложных срабатываний с частотой ошибок в семье , которая определяется как . По мере увеличения количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.

Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложного обнаружения : в то время как первая определяется как , вторая определяется как .

Смотрите также

Рекомендации

  1. ^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. DOI : 10.1056 / NEJM198810133191501 . PMID   3419477 .