Тщательность и точность - Accuracy and precision

В наборе измерений точность - это близость измерений к определенному значению, а точность - это близость измерений друг к другу.

У точности есть два определения:

  1. Чаще всего это описание систематических ошибок , мера статистической погрешности ; низкая точность вызывает разницу между результатом и «истинным» значением. ISO называет это истиной .
  2. В качестве альтернативы ISO определяет точность как описание комбинации обоих типов ошибок наблюдений, указанных выше (случайных и систематических), поэтому высокая точность требует как высокой точности, так и высокой достоверности.

Точность - это описание случайных ошибок , мера статистической изменчивости .

Проще говоря, учитывая набор точек данных из повторных измерений одной и той же величины, можно сказать, что набор точен, если их среднее значение близко к истинному значению измеряемой величины, в то время как набор можно назвать точным. если значения близки друг к другу. В первом, более общем определении «точности», приведенном выше, эти две концепции не зависят друг от друга, поэтому можно сказать, что конкретный набор данных является либо точным, либо точным, либо тем и другим, либо ни одним из них.

Общее техническое определение

Точность - это близость результатов измерения к истинному значению; Прецизионность - это степень, в которой повторные (или воспроизводимые ) измерения в неизменных условиях показывают одинаковые результаты.

В области науки и техники точность системы измерения - это степень близости измерения величины к ее истинному значению . Точность измерительной системы, связанная с воспроизводимостью и повторяемостью , - это степень, в которой повторные измерения в неизменных условиях показывают одинаковые результаты . Хотя два слова «точность» и «точность» могут быть синонимами в разговорной речи , они намеренно противопоставляются в контексте научного метода .

Область статистики , где интерпретация измерений играет центральную роль, предпочитает использовать термины систематическая ошибка и изменчивость вместо точности и точности: систематическая ошибка - это степень неточности, а изменчивость - это степень неточности.

Система измерения может быть точной, но не точной, точной, но не точной, ни то, ни другое. Например, если эксперимент содержит систематическую ошибку , то увеличение размера выборки обычно увеличивает точность, но не улучшает точность. Результатом была бы последовательная, но неточная цепочка результатов ошибочного эксперимента. Устранение систематической ошибки повышает точность, но не меняет ее.

Система измерения считается действительной, если она является точной и точной . Связанные термины включают смещение ( неслучайные или направленные эффекты, вызванные фактором или факторами, не связанными с независимой переменной ) и ошибку (случайная изменчивость).

Терминология также применяется к косвенным измерениям, то есть значениям, полученным с помощью вычислительной процедуры из наблюдаемых данных.

В дополнение к точности и прецизионности измерения могут также иметь разрешение измерения , которое является наименьшим изменением базовой физической величины, вызывающей отклик при измерении.

В численном анализе точность - это также близость расчета к истинному значению; а точность - это разрешение представления, обычно определяемое количеством десятичных или двоичных цифр.

С военной точки зрения, точность относится в первую очередь к точности стрельбы ( justesse de tir ), точности стрельбы, выражаемой близостью группировки выстрелов в центре цели и вокруг нее .

Количественная оценка

В промышленных приборах точность - это допуск измерения или передача прибора, который определяет пределы ошибок, допускаемых при использовании прибора в нормальных условиях эксплуатации.

В идеале измерительное устройство должно быть точным и точным, с измерениями, близкими к истинному значению и плотно сгруппированными вокруг него. Точность и точность процесса измерения обычно устанавливаются путем многократного измерения некоторого прослеживаемый эталонного стандарта . Такие стандарты определены в Международной системе единиц (сокращенно SI от французского: Système international d'unités ) и поддерживаются национальными организациями по стандартизации, такими как Национальный институт стандартов и технологий в США.

Это также применимо, когда измерения повторяются и усредняются. В этом случае правильно применяется термин стандартная ошибка : точность среднего равна известному стандартному отклонению процесса, деленному на квадратный корень из числа усредненных измерений. Кроме того, центральная предельная теорема показывает, что распределение вероятностей усредненных измерений будет ближе к нормальному распределению, чем распределение индивидуальных измерений.

По точности можно выделить:

  • разница между средним значением измерений и эталонным значением, смещение . Для калибровки необходимо установить и скорректировать смещение .
  • комбинированный эффект этого и точности.

В науке и технике принято неявно выражать точность и / или прецизионность с помощью значащих цифр . Если явно не указано иное, допустимая погрешность составляет половину значения последнего значимого места. Например, запись 843,6 м, или 843,0 м, или 800,0 м будет означать запас 0,05 м (последнее значащее место - это десятое место), а запись 843 м будет означать погрешность 0,5 м ( последние значащие цифры - единицы измерения).

Значение 8000 м с конечными нулями и без десятичной точки является неоднозначным; конечные нули могут быть или не рассматриваться как значащие цифры. Чтобы избежать этой двусмысленности, число может быть представлено в экспоненциальной нотации: 8,0 × 10 3  м означает, что первый ноль является значимым (отсюда и запас в 50 м), а 8 000 × 10 3  м означает, что все три нуля значимы, что дает запас 0,5 м. Точно так же можно использовать кратное основной единице измерения: 8,0 км эквивалентно 8,0 × 10 3  м. Указывает запас 0,05 км (50 м). Однако использование этого соглашения может привести к ошибкам ложной точности при приеме данных из источников, которые ему не подчиняются. Например, источник, сообщающий число вроде 153 753 с точностью +/- 5000, выглядит так, как будто имеет точность +/- 0,5. Согласно соглашению, это число было бы округлено до 154 000 человек.

В качестве альтернативы, в научном контексте, если желательно указать погрешность с большей точностью, можно использовать такое обозначение, как 7,54398 (23) × 10 −10 м, что означает диапазон от 7,54375 до 7,54421 × 10 −10. м.

Точность включает:

  • повторяемость - вариация, возникающая, когда все усилия прилагаются для поддержания постоянных условий с использованием одного и того же инструмента и оператора, и повторяющиеся в течение короткого периода времени; и
  • воспроизводимость - вариации, возникающие при использовании одного и того же процесса измерения разными приборами и операторами в течение более длительных периодов времени.

В инженерии за прецизионность часто понимают трехкратное стандартное отклонение выполненных измерений, что соответствует диапазону, в котором могут выполняться 99,73% измерений. Например, специалист по эргономике, измеряющий человеческое тело, может быть уверен, что 99,73% извлеченных им измерений находятся в пределах ± 0,7 см - при использовании системы обработки GRYPHON - или ± 13 см - при использовании необработанных данных.

Определение ISO (ISO 5725)

Согласно ISO 5725-1, точность состоит из правильности (близости результатов измерения к истинному значению) и точности (повторяемости или воспроизводимости измерения).

Изменение значения этих терминов произошло с публикацией серии стандартов ISO 5725 в 1994 году, что также отражено в выпуске 2008 года «Международного словаря метрологии BIPM» (VIM), пункты 2.13 и 2.14.

Согласно ISO 5725-1, общий термин «точность» используется для описания близости измерения к истинному значению. Когда этот термин применяется к наборам измерений одной и той же измеряемой величины , он включает компонент случайной ошибки и компонент систематической ошибки. В этом случае правильность - это близость среднего значения набора результатов измерений к фактическому (истинному) значению, а точность - это близость согласия между набором результатов.

ISO 5725-1 и VIM также избегают использования термина « предвзятость », ранее указанного в BS 5497-1, потому что он имеет разные коннотации за пределами областей науки и техники, например, в медицине и юриспруденции.

В бинарной классификации

Точность также используется как статистическая мера того, насколько хорошо тест двоичной классификации правильно определяет или исключает условие. То есть точность - это доля правильных прогнозов (как истинно положительных, так и истинно отрицательных ) среди общего числа изученных случаев. Таким образом, он сравнивает оценки вероятности до и после тестирования . Чтобы сделать контекст понятным с помощью семантики, его часто называют «точностью Rand» или « индексом Rand ». Это параметр теста. Формула для количественной оценки двоичной точности:

где TP = истинный положительный результат ; FP = ложное срабатывание ; TN = истинно отрицательный ; FN = ложноотрицательный

Обратите внимание, что в этом контексте концепции правильности и точности, определенные в ISO 5725-1, не применимы. Одна из причин заключается в том, что не существует единственного «истинного значения» количества, а скорее два возможных истинных значения для каждого случая, в то время как точность является средним значением для всех случаев и, следовательно, принимает во внимание оба значения. Однако термин « точность» используется в этом контексте для обозначения другой метрики, происходящей из области поиска информации ( см. Ниже ).

В психометрии и психофизике

В психометрии и психофизике термин « точность» взаимозаменяем с « достоверностью» и « постоянной ошибкой» . Точность - это синоним надежности и переменной ошибки . Достоверность инструмента измерения или психологического теста устанавливается путем эксперимента или корреляции с поведением. Надежность устанавливается с помощью различных статистических методов, обычно с помощью теста на внутреннюю согласованность, такого как альфа Кронбаха, чтобы убедиться, что наборы связанных вопросов имеют связанные ответы, а затем сравнения этих связанных вопросов между контрольной и целевой популяциями.

В логическом моделировании

В логическом моделировании распространенной ошибкой при оценке точных моделей является сравнение логической имитационной модели с имитационной моделью транзисторной схемы . Это сравнение различий в точности, а не точности. Точность измеряется по отношению к деталям, а точность измеряется по отношению к реальности.

В информационных системах

Информационно-поисковые системы, такие как базы данных и поисковые системы в Интернете , оцениваются по множеству различных показателей , некоторые из которых выводятся из матрицы путаницы , которая делит результаты на истинно положительные (документы получены правильно), истинные отрицательные (документы получены неправильно), ложные срабатывания (документы получены неверно) и ложноотрицательные (документы неправильно не получены). Обычно используемые метрики включают понятия точности и отзыва . В этом контексте точность определяется как доля извлеченных документов, которые имеют отношение к запросу (истинные положительные результаты, разделенные на истинные + ложные срабатывания), с использованием набора достоверных результатов, выбранных людьми. Отзыв определяется как доля извлеченных релевантных документов по сравнению с общим количеством релевантных документов (истинные положительные результаты, разделенные на истинные положительные результаты + ложно отрицательные). Реже используется показатель точности, который определяется как общее количество правильных классификаций (истинно положительных плюс истинно отрицательных), деленное на общее количество документов.

Ни один из этих показателей не учитывает ранжирование результатов. Ранжирование очень важно для поисковых систем, потому что читатели редко проходят мимо первой страницы результатов, а в сети слишком много документов, чтобы вручную классифицировать их все в зависимости от того, должны ли они быть включены или исключены из данного поиска. Добавление отсечки для определенного количества результатов в некоторой степени учитывает ранжирование. Точность измерения в k , например, является мерой точности при просмотре только десяти лучших (k = 10) результатов поиска. Более сложные показатели, такие как дисконтированная совокупная прибыль , учитывают каждый отдельный рейтинг и чаще используются там, где это важно.

Смотрите также

использованная литература

внешние ссылки