Уровень ложного покрытия - False coverage rate

В статистике коэффициент ложного покрытия (FCR) - это средний коэффициент ложного покрытия , то есть не покрытия истинных параметров, среди выбранных интервалов.

FCR обеспечивает одновременное покрытие на уровне (1 -  α ) × 100% для всех параметров, рассматриваемых в задаче. FCR имеет прочную связь с коэффициентом ложного обнаружения (FDR). Оба метода решают проблему множественных сравнений , FCR с доверительных интервалов (CI) и FDR с точки зрения P-значения.

FCR был необходим из-за опасностей, вызванных выборочным выводом. Исследователи и ученые, как правило, сообщают или выделяют только ту часть данных, которая считается значимой, без четкого указания различных гипотез, которые были рассмотрены. Поэтому необходимо понимать, каким образом ложно покрываются данные. Существует множество процедур FCR, которые можно использовать в зависимости от длины КИ - выбранные Бонферрони - скорректированные по Бонферрони, скорректированные КИ, выбранные по ЧД (Benjamini and Yekutieli 2005). Стимулирование выбора одной процедуры над другой состоит в том, чтобы обеспечить как можно более узкий CI и сохранить FCR. Для экспериментов с микрочипами и других современных приложений существует огромное количество параметров , часто десятки тысяч и более, и очень важно выбрать наиболее эффективную процедуру.

FCR был впервые представлен Даниэлем Йекутиели в его докторской диссертации в 2001 году.


Определения

Не держать средства FCR , когда , где это число верных гипотез нуль, является количество бракованных гипотезы, является количество ложных срабатываний, а это уровень значимости. Интервалы с одновременной вероятностью охвата могут контролировать FCR, чтобы он был ограничен .

Классификация нескольких тестов гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число m нулевых гипотез, обозначенных как H 1H 2 , ...,  H m . Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование каждого типа результата по всем H i   дает следующие случайные величины:

Нулевая гипотеза верна (H 0 ) Альтернативная гипотеза верна (H A ) Общее
Тест объявлен значимым V S р
Тест объявлен несущественным U Т
Общее м

В m проверках гипотез, которые являются истинными нулевыми гипотезами, R - наблюдаемая случайная величина, а S , T , U и V - ненаблюдаемые случайные величины .

Проблемы, решаемые FCR

Выбор

Выбор приводит к снижению среднего покрытия. Выбор может быть представлен как обусловливание события, определенного данными, и может повлиять на вероятность охвата CI для одного параметра . Равным образом проблема выбора меняет основной смысл P-значений . Процедуры FCR считают, что цель условного покрытия, следующего за любым правилом выбора для любого набора (неизвестных) значений параметров, невозможно достичь. Возможно более слабое свойство, когда речь идет о выборочных КЭ, что позволяет избежать ложных заявлений о покрытии. FCR - это показатель охвата интервала после выбора. Следовательно, даже несмотря на то, что КИ 1 -  α не предлагает выборочного ( условного ) покрытия, вероятность построения КИ без покрытия не превышает α , где

Выбор и множественность

При столкновении как с множественностью (вывод о множественных параметрах), так и с выбором , ожидаемая доля охвата по выбранным параметрам при 1 − α не только не эквивалентна ожидаемой доле отсутствия охвата при α, но и последнее уже не может быть обеспечено с помощью построение маргинальных КЭ для каждого выбранного параметра. Процедуры FCR решают эту проблему, принимая ожидаемую долю параметров, не охваченных их CI, среди выбранных параметров, где эта доля равна 0, если параметр не выбран. Эта частота ложных заявлений о покрытии (FCR) является свойством любой процедуры, которое определяется способом выбора параметров и способом построения нескольких интервалов.

Контрольные процедуры

Процедура Бонферрони (выбранная Бонферрони - скорректированная по Бонферрони) для одновременной КИ

Одновременные КИ с процедурой Бонферрони, когда у нас есть m параметров, каждый маргинальный КИ построен на уровне 1 - α / m. Без выбора эти КЭ предлагают одновременное покрытие в том смысле, что вероятность того, что все КЭ покрывают свои соответствующие параметры, составляет по крайней мере 1 - α. к сожалению, даже такое сильное свойство не обеспечивает свойство условной уверенности после выбора.

FCR для выбранной Бонферрони - одновременной КИ с поправкой на Бонферрони

Процедура Бонферрони – Бонферрони не может предложить условное покрытие, однако она контролирует FCR при <α. На самом деле она делает это слишком хорошо, в том смысле, что FCR слишком близко к 0 для больших значений θ. Выбор интервалов основан на тестировании Бонферрони, после чего строятся КИ Бонферрони. FCR оценивается как вычисляется доля интервалов, не охватывающих их соответствующие параметры среди построенных CI (устанавливая пропорцию на 0, когда ни один не выбран). Если отбор основан на нескорректированном индивидуальном тестировании и построены нескорректированные CI.

Отобранные КИ с поправкой на FCR

В процедуре BH для FDR после сортировки значений p P (1) ≤ • • • ≤ P ( m ) и вычисления R = max { j  : P ( j ) ≤ jq / m }, R нулевые гипотезы, для которых P ( i ) ≤ Rq / m отклоняются. Если тестирование проводится с использованием процедуры Бонферрони, то нижняя граница FCR может упасть значительно ниже желаемого уровня q , что означает, что интервалы слишком длинные. Напротив, применение следующей процедуры, которая объединяет общую процедуру с контрольным тестированием FDR в процедуре BH, также дает нижнюю границу для FCR, q / 2 ≤ FCR. Эта процедура точна в том смысле, что для некоторых конфигураций FCR приближается к q .

1. Отсортируйте значения p, используемые для проверки m гипотез относительно параметров, P (1) ≤ • • • ≤ P ( m ).

2. Вычислить R = max { i  : P ( i ) ≤ iq / m }.

3. Выберите параметры R, для которых P ( i ) ≤ Rq / m , соответствующие отклоненным гипотезам.

4. Постройте КИ 1 -  Rq / m для каждого выбранного параметра.

Смотрите также

Ссылки

Сноски

Другие источники