Ложноположительная ставка - False positive rate
В статистике при выполнении множественных сравнений коэффициент ложноположительных результатов (также известный как коэффициент выпадений или ложных тревог) - это вероятность ложного отклонения нулевой гипотезы для конкретного теста . Частота ложных срабатываний рассчитывается как отношение количества отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общего количества фактических отрицательных событий (независимо от классификации).
Ложноположительным скорость (или «ложные тревоги») , как правило , относится к продолжительности ложного положительного соотношения .
Определение
Уровень ложных срабатываний
где - количество ложных срабатываний, - количество истинных отрицаний и - общее количество истинных отрицаний.
Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и поддерживающих ее критериев (например, FWER или FDR ), которые были предварительно определены исследователем.
При выполнении нескольких сравнений в статистической основе , такие , как указаны выше, то ложный положительный коэффициент (также известный как отношение ложных тревог , в отличие от ложных срабатываний скорости / ложная тревога скорости ) обычно относится к вероятности ложно отклонения нулевой гипотезы для конкретного тест . Используя предложенную здесь терминологию, это просто .
Так как V является случайной величиной , и является константой ( ), ложный положительный коэффициент также случайная величина, в диапазоне от 0-1.
Частота ложных срабатываний (или «частота ложных тревог») обычно относится к ожидаемому соотношению ложных срабатываний , выраженному как .
Стоит отметить, что эти два определения («коэффициент ложных срабатываний» / «процент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в упомянутой статье используется ложноположительный «коэффициент», а не его «коэффициент».
Классификация множественных проверок гипотез
В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, что у нас есть m нулевых гипотез, обозначенных как H 1 , H 2 , ..., H m . Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование результатов каждого типа по всем H i дает следующие случайные величины:
Нулевая гипотеза верна (H 0 ) | Альтернативная гипотеза верна (H A ) | Общее | |
---|---|---|---|
Тест объявлен значимым | V | S | р |
Тест объявлен несущественным | U | Т | |
Общее | м |
- m - общее количество проверенных гипотез
- это количество истинных нулевых гипотез , неизвестный параметр
- количество истинных альтернативных гипотез
- V - количество ложных срабатываний (ошибка типа I) (также называемых «ложными открытиями»).
- S - количество истинных положительных результатов (также называемых «истинными открытиями»).
- T - количество ложноотрицательных результатов (ошибка типа II)
- U - количество истинных негативов
- это количество отклоненных нулевых гипотез (также называемых «открытиями», истинными или ложными)
В m проверках гипотез, из которых являются истинными нулевыми гипотезами, R - наблюдаемая случайная величина, а S , T , U и V - ненаблюдаемые случайные величины .
Сравнение с другими показателями ошибок
Хотя частота ложных срабатываний математически равна частоте ошибок типа I , она рассматривается как отдельный термин по следующим причинам:
- Частота ошибок типа I часто связана с априорной установкой уровня значимости исследователем: уровень значимости представляет собой приемлемую частоту ошибок, учитывая, что все нулевые гипотезы верны ( гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. Д.)
- В отличие от этого, частота ложных срабатываний связана с последующим результатом, который представляет собой ожидаемое количество ложных срабатываний, деленное на общее количество гипотез при реальной комбинации истинных и ложных нулевых гипотез (без учета «глобального нулевая гипотеза). Поскольку количество ложных срабатываний - это параметр, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.
- Более того, коэффициент ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (например, «уровень ложных срабатываний определенного диагностического устройства составляет 1%»), в то время как ошибка типа I - это термин, связанный со статистическими тестами, где значение слово «положительный» не так однозначно (например, «ошибка типа I теста составляет 1%»).
Также не следует путать частоту ложных срабатываний с частотой ошибок в семье , которая определяется как . По мере увеличения количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.
Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложного обнаружения : в то время как первая определяется как , вторая определяется как .
Смотрите также
Рекомендации
- ^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. DOI : 10.1056 / NEJM198810133191501 . PMID 3419477 .