История статистики - History of statistics

Статистика в современном смысле этого слова начала развиваться в 18 веке в ответ на новые потребности индустриальных суверенных государств . Развитие статистики было, в частности, тесно связано с развитием европейских государств после Вестфальского мира (1648 г.), а также с развитием теории вероятностей , которая поставила статистику на прочную теоретическую основу, а отец статистики - Муханад. Авейс Мохамед .

В ранние времена значение ограничивалось информацией о штатах, особенно демографическими данными, такими как население. Позже он был расширен, чтобы включить все наборы информации всех типов, а позже он был расширен, чтобы включить анализ и интерпретацию таких данных. Говоря современным языком, «статистика» означает как наборы собранной информации, как в национальных счетах и записях о температуре , так и аналитическую работу, которая требует статистических выводов . Статистическая деятельность часто связана с моделями, выраженными с помощью вероятностей , отсюда и связь с теорией вероятностей. Высокие требования к обработке данных сделали статистику ключевым приложением вычислений. Ряд статистических концепций оказывает важное влияние на широкий круг наук. К ним относятся план экспериментов и подходы к статистическому выводу, такие как байесовский вывод , каждый из которых может рассматриваться как имеющий свою собственную последовательность в развитии идей, лежащих в основе современной статистики.

Вступление

К 18 - м века, термин « статистика » назначила систематический сбор в демографических и экономических данных государств. На протяжении как минимум двух тысячелетий эти данные представляли собой в основном таблицы человеческих и материальных ресурсов, которые могли облагаться налогом или использоваться в военных целях. В начале 19 века сбор данных усилился, а значение «статистики» расширилось и теперь включает дисциплину, связанную со сбором, обобщением и анализом данных. Сегодня данные собираются, статистические данные вычисляются и широко распространяются в правительстве, бизнесе, большинстве наук и спорте и даже во многих сферах деятельности. Электронные компьютеры позволили ускорить более сложные статистические вычисления, даже если они упростили сбор и агрегирование данных. Один аналитик данных может иметь доступный набор файлов данных с миллионами записей, каждая из которых содержит десятки или сотни отдельных измерений. Они собирались с течением времени в результате компьютерной деятельности (например, фондовой биржи) или компьютеризированных датчиков, кассовых регистров и т. Д. Затем компьютеры создают простые и точные сводки и позволяют проводить более утомительный анализ, например, требующий инвертирования большой матрицы или выполнения сотен шагов итераций, которые никогда не будут выполняться вручную. Более быстрые вычисления позволили статистикам разработать «требующие интенсивного использования компьютера» методы, которые могут рассматривать все перестановки, или использовать рандомизацию, чтобы посмотреть на 10 000 перестановок проблемы, чтобы оценить ответы, которые нелегко определить количественно только с помощью теории.

Термин « математическая статистика » обозначает математические теории вероятностей и статистических выводов , которые используются в статистической практике . Однако связь между статистикой и теорией вероятностей возникла довольно поздно. В 19 веке статистика все чаще использовала теорию вероятностей , первые результаты которой были обнаружены в 17 и 18 веках, особенно при анализе азартных игр (азартных игр). К 1800 году астрономия использовала вероятностные модели и статистические теории, особенно метод наименьших квадратов . Ранняя теория вероятностей и статистика были систематизированы в 19 веке, а статистические рассуждения и вероятностные модели использовались социологами для развития новых наук экспериментальной психологии и социологии , а также учеными- физиками в области термодинамики и статистической механики . Развитие статистических рассуждений было тесно связано с развитием индуктивной логики и научного метода , которые уводят статистиков от более узкой области математической статистики. Большая часть теоретических работ была уже доступна к тому времени, когда появились компьютеры для их использования. К 1970-м годам Джонсон и Коц выпустили сборник из четырех томов статистических распределений (1-е изд., 1969-1972 гг.), Который до сих пор является бесценным источником.

Прикладную статистику можно рассматривать не как область математики, а как автономную математическую науку , такую ​​как информатика и исследования операций . В отличие от математики, статистика берет свое начало в государственном управлении . Приложения возникли рано в демографии и экономике ; Сегодня крупные области микро- и макроэкономики - это «статистика» с упором на анализ временных рядов. С акцентом на обучение на основе данных и составление точных прогнозов статистика также была сформирована по областям академических исследований, включая психологическое тестирование, медицину и эпидемиологию . Идеи статистического тестирования во многом пересекаются с наукой о принятии решений . Заботясь о поиске и эффективном представлении данных , статистика частично пересекается с информатикой и информатикой .

Этимология

Посмотрите статистику в Викисловаре , бесплатном словаре.

Термин статистика в конечном итоге происходит от нового латинского statisticum collegium («государственный совет») и итальянского слова statista («государственный деятель» или « политик »). Немецкий Statistik , первый введенный Ахенвалль (1749), первоначально назначенный анализ данных о состоянии , означающий «науку о государстве» (тогда политическая арифметика на английском языке). Он приобрел значение сбора и классификации данных в целом в начале 19 века. Он был введен на английский язык в 1791 году сэром Джоном Синклером, когда он опубликовал первый из 21 тома под названием « Статистический отчет Шотландии» .

Таким образом, первоначальной основной целью Statistik были данные для использования правительственными и (часто централизованными) административными органами. Сбор данных о штатах и ​​населенных пунктах продолжается, в основном через национальные и международные статистические службы . В частности, переписи предоставляют часто обновляемую информацию о населении .

Первой книгой, в названии которой была «статистика», была «Вклад в статистику естественного движения населения» (1845 г.) Фрэнсиса Г.П. Нейсона, актуария Управления по делам инвалидов и общей жизни.

Истоки теории вероятностей

Основные формы статистики использовались с начала цивилизации. Ранние империи часто сопоставляли переписи населения или регистрировали торговлю различными товарами. Династия Хань и Римская империя были одними из первых государств, которые тщательно собирали данные о размере населения империи, географической области и богатстве.

Использование статистических методов восходит к 5 веку до нашей эры. Историк Фукидид в своей « Истории Пелопоннесской войны» описывает, как афиняне рассчитали высоту стены Платеи , посчитав количество кирпичей в не оштукатуренной части стены, достаточно близко расположенной к ним, чтобы можно было их сосчитать. Подсчет несколько раз повторил несколько солдат. За наиболее частое значение (в современной терминологии - мода ), определенное таким образом, принималось наиболее вероятное значение количества кирпичей. Умножение этого значения на высоту кирпичей, использованных в стене, позволило афинянам определить высоту лестниц, необходимых для масштабирования стен.

Пробировка является проверкой чистоты чеканки в Королевском монетном дворе который проводится на регулярной основе с 12 - го века. Само испытание основано на методах статистической выборки. После чеканки серии монет - первоначально из десяти фунтов серебра - одну монету поместили в Pyx - ящик в Вестминстерском аббатстве . По истечении определенного периода - теперь один раз в год - монеты удаляются и взвешиваются. Затем образец монет, извлеченный из коробки, проверяется на чистоту.

Nuova Cronica , 14-го века история Флоренции банкиром флорентийской и официального Джованни Виллани , включает в себя много статистической информации о населении, таинств, коммерции и торговли, образования и религиозных объектов и было описано как первое введение статистики как положительный элемент в истории, хотя ни термин, ни концепция статистики как отдельной области еще не существовали.

Среднее арифметическое , хотя это понятие было известно грекам, не было обобщено более чем на два значения до 16 века. Изобретение Саймоном Стевином в 1585 году десятичной системы , вероятно, облегчило эти вычисления. Этот метод был впервые применен в астрономии Тихо Браге, который пытался уменьшить ошибки в своих оценках местоположения различных небесных тел.

Идея медианы возникла в книге Эдварда Райта по навигации ( Некоторые ошибки в навигации ) в 1599 году в разделе, посвященном определению местоположения с помощью компаса. Райт считал, что это значение, скорее всего, будет правильным значением в серии наблюдений.

Сэр Уильям Петти , экономист 17 века, который использовал ранние статистические методы для анализа демографических данных.

Рождение статистики часто датируется 1662 годом, когда Джон Граунт вместе с Уильямом Петти разработали ранние человеческие статистические методы и методы переписи населения, которые обеспечили основу для современной демографии . Он составил первую таблицу дожития, в которой указаны вероятности выживания для каждого возраста. В его книге « Естественные и политические наблюдения, сделанные на счетах смертности» использовался анализ списков смертности, чтобы сделать первую статистически обоснованную оценку населения Лондона . Он знал, что в Лондоне ежегодно совершается около 13 000 похорон и что на одиннадцать семей ежегодно умирают три человека. Он подсчитал из приходских записей, что средний размер семьи составлял 8 человек, и подсчитал, что население Лондона составляло около 384 000 человек; это первое известное использование оценщика отношения . Лаплас в 1802 году оценил население Франции аналогичным методом; подробности см. в § История оценки отношения.

Хотя первоначальный объем статистики ограничивался данными, полезными для управления, в XIX веке этот подход был распространен на многие области научного или коммерческого характера. Математические основы этого предмета во многом основывались на новой теории вероятностей , впервые предложенной в 16 веке Джероламо Кардано , Пьером де Ферма и Блезом Паскалем . Христиан Гюйгенс (1657) дал самую раннюю известную научную трактовку этого предмета. В трудах Якоба Бернулли « Ars Conjectandi» (посмертно, 1713 г.) и Абрахама де Муавра « Доктрина шансов» (1718 г.) этот предмет рассматривается как раздел математики. В своей книге Бернулли представил идею представления полной уверенности как единицы, а вероятности как числа от нуля до единицы.

Ключевое раннее применение статистики в 18 веке касалось соотношения полов при рождении человека. Джон Арбетнот изучал этот вопрос в 1710 году. Арбетнот изучал записи о рождении в Лондоне за каждый из 82 лет с 1629 по 1710 год. Каждый год количество мужчин, рожденных в Лондоне, превышало количество женщин. Если рассматривать большее количество мужских или женских рождений как равновероятные, вероятность наблюдаемого результата составляет 0,5 ^ 82, или примерно 1 из 4,8360,0000,0000,0000,0000,0000; говоря современным языком, p -значение . Это исчезающе мало, что приводит Арбетнота к тому, что это было не случайностью, а божественным провидением: «Отсюда следует, что правит искусство, а не случайность». Эта и другие работы Арбутнота считаются «первым использованием критериев значимости », первым примером рассуждений о статистической значимости и моральной уверенности, и «… возможно, первым опубликованным отчетом о непараметрическом тесте …», в ​​частности критерием знаков ; подробности см. в разделе «Проверка знаков» § История .

Формальное изучение теории ошибок можно проследить до « Opera Miscellanea» Роджера Котса (посмертно, 1722 г.), но мемуары, подготовленные Томасом Симпсоном в 1755 г. (напечатанные в 1756 г.), впервые применили теорию к обсуждению ошибок наблюдения. В переиздании (1757 г.) этого мемуара излагаются аксиомы, согласно которым положительные и отрицательные ошибки равновероятны и что существуют определенные назначаемые пределы, в которые можно предположить, что все ошибки попадают в них; обсуждаются непрерывные ошибки и дается кривая вероятности. Симпсон обсудил несколько возможных распределений ошибок. Сначала он рассмотрел равномерное распределение, а затем дискретное симметричное треугольное распределение, а затем непрерывное симметричное треугольное распределение. Тобиас Майер в своем исследовании либрации от Луны ( Kosmographische Nachrichten , Нюрнберг, 1750), изобрел первый формальный метод для оценки неизвестных величин обобщенного усреднения наблюдений при одинаковых обстоятельствах усреднения групп аналогичных уравнений.

Роджер Джозеф Боскович в 1755 году в своей работе о форме земли предложил в своей книге De Litteraria Expeditione per pontificiam ditionem ad dimetiendos duos meridiani gradus a PP. Maire et Boscovicli, что истинная ценность серии наблюдений будет такой, которая минимизирует сумму абсолютных ошибок. В современной терминологии это значение - медиана. Первый пример того, что позже стало известно как нормальная кривая, был изучен Абрахамом де Муавром , построившим эту кривую 12 ноября 1733 года. Де Муавр изучал количество выпавших орлов при подбрасывании «честной» монеты.

В 1761 году Томас Байес доказал теорему Байеса, а в 1765 году Джозеф Пристли изобрел первые временные диаграммы.

Иоганн Генрих Ламберт в своей книге 1765 года Anlage zur Architectonic предложил полукруг как распределение ошибок:

с -1 < x <1.

Графики плотности вероятности для распределения Лапласа .

Пьер-Симон Лаплас (1774 г.) сделал первую попытку вывести правило комбинации наблюдений из принципов теории вероятностей. Он изобразил закон вероятности ошибок кривой и вывел формулу для среднего значения трех наблюдений.

Лаплас в 1774 году заметил, что частота ошибки может быть выражена как экспоненциальная функция от ее величины, если не учитывать ее знак. Это распределение теперь известно как распределение Лапласа . Лагранж предложил параболическое фрактальное распределение ошибок в 1776 году.

В 1778 году Лаплас опубликовал свой второй закон ошибок, в котором он отметил, что частота ошибки пропорциональна экспоненте квадрата ее величины. Впоследствии это было переоткрыто Гауссом (возможно, в 1795 г.), и теперь оно наиболее известно как нормальное распределение, которое имеет центральное значение в статистике. Это распределение было впервые названо нормальным распределением К. С. Пирсом в 1873 году, который изучал ошибки измерения, когда объект падал на деревянную основу. Он выбрал термин " нормальный" из-за того, что он часто встречается в переменных, встречающихся в природе.

Лагранж также предложил в 1781 году два других распределения ошибок - приподнятый косинус и логарифмическое распределение .

Лаплас дал (1781 г.) формулу закона легкости ошибки (термин, придуманный Джозефом Луи Лагранжем , 1774 г.), но формулу , которая привела к неуправляемым уравнениям. Даниэль Бернулли (1778) ввел принцип максимального произведения вероятностей системы одновременных ошибок.

В 1786 году Уильям Плейфер (1759-1823) ввел идею графического представления в статистику. Он изобрел линейную диаграмму , гистограмму и гистограмму и включил их в свои работы по экономике , Коммерческий и политический атлас . В 1795 году он изобрел круговую диаграмму и круговую диаграмму, которые он использовал для отображения эволюции импорта и экспорта Англии. Эти последние диаграммы привлекли всеобщее внимание, когда он опубликовал примеры в своем Статистическом Требнике в 1801 году.

Лаплас, исследуя движения Сатурна и Юпитера в 1787 году, обобщил метод Майера, используя различные линейные комбинации одной группы уравнений.

В 1791 году сэр Джон Синклер ввел термин «статистика» на английский язык в своих « Статистических отчетах Шотландии» .

В 1802 году Лаплас оценил население Франции в 28 328 612 человек. Он рассчитал эту цифру, используя количество рождений в предыдущем году и данные переписи для трех общин. Данные переписи этих общин показали, что в них проживает 2 037 615 человек, а число рождений - 71 866 человек. Предполагая, что эти образцы были репрезентативными для Франции, Лаплас произвел свою оценку для всего населения.

Карл Фридрих Гаусс , математик, разработавший метод наименьших квадратов в 1809 году.

Метод наименьших квадратов , который был использован , чтобы свести к минимуму ошибки в данных измерений , была опубликована независимо Лежандр (1805), Роберт Адрейн (1808), и Гаусс (1809). Гаусс использовал этот метод в своем знаменитом предсказании 1801 года местоположения карликовой планеты Церера . Наблюдения, на которых основывал свои расчеты Гаусс, были сделаны итальянским монахом Пиацци.

Методу наименьших квадратов предшествовало использование среднего наклона регрессии. Этот метод минимизирует сумму абсолютных отклонений. Метод оценки этого наклона был изобретен Роджером Джозефом Босковичем в 1760 году, который он применил в астрономии.

Термин вероятная ошибка ( der wahrscheinliche Fehler ) - среднее отклонение от среднего - был введен в 1815 году немецким астрономом Фредериком Вильгельмом Бесселем . Антуан Огюстен Курно в 1843 году первым использовал термин медиана ( valeur médiane ) для значения, которое делит распределение вероятностей на две равные половины.

Другими участниками теории ошибок были Эллис (1844 г.), Де Морган (1864 г.), Глейшер (1872 г.) и Джованни Скиапарелли (1875 г.). Формула Петерса (1856) для «вероятной ошибки» отдельного наблюдения широко использовалась и вдохновляла раннюю робастную статистику (устойчивую к выбросам : см . Критерий Пирса ).

В 19 веке в число авторов статистической теории входили Лаплас, С. Лакруа (1816), Литтроу (1833), Дедекинд (1860), Гельмерт (1872), Лоран (1873), Лиагр, Дидион, Де Морган и Буль .

Густав Теодор Фехнер использовал медианное значение ( Centralwerth ) в социологических и психологических явлениях. Ранее он использовался только в астрономии и смежных областях. Фрэнсис Гальтон впервые использовал английский термин медиана в 1881 году, ранее использовав термины среднее значение в 1869 году и среднее значение в 1880 году.

Кетле (1796-1874), еще один важный основатель статистики, ввел понятие «среднего человека» ( l'Homme Moyen ) как средство понимания сложных социальных явлений , таких как уровень преступности , число браков , и уровень самоубийств .

Первые тесты нормального распределения были изобретены немецким статистиком Вильгельмом Лексисом в 1870-х годах. Единственные доступные ему наборы данных, которые он смог показать, были нормально распределенными, - это коэффициенты рождаемости.

Развитие современной статистики

Хотя истоки статистической теории лежат в достижениях теории вероятностей в XVIII веке, современная область статистики возникла только в конце XIX и начале XX века в три этапа. Первую волну на рубеже веков возглавляли работы Фрэнсиса Гальтона и Карла Пирсона , которые преобразовали статистику в строгую математическую дисциплину, используемую для анализа не только в науке, но также в промышленности и политике. Вторая волна 1910-х и 20-х годов была инициирована Уильямом Сили Госсетом и достигла своей кульминации в прозрениях Рональда Фишера . Это включало разработку более совершенных моделей экспериментов , проверки гипотез и методов для использования с небольшими выборками данных. Последняя волна, которая в основном представляла собой усовершенствование и расширение более ранних разработок, возникла в результате совместной работы Эгона Пирсона и Ежи Неймана в 1930-х годах. Сегодня статистические методы применяются во всех областях, связанных с принятием решений, для получения точных выводов из сопоставленного массива данных и для принятия решений в условиях неопределенности на основе статистической методологии.

Оригинальный логотип Королевского статистического общества , основанного в 1834 году.

Первые статистические органы были созданы в начале 19 века. Королевское статистическое общество было основано в 1834 году и Флоренс Найтингейл , ее первой женщиной - членом, является пионером в применении статистического анализа к проблемам здоровья для содействия эпидемиологическим понимания и практики общественного здравоохранения. Однако методы, которые использовались тогда, не могли считаться современной статистикой сегодня.

В книге оксфордского ученого Фрэнсиса Исидро Эджворта « Метретика: или метод измерения вероятности и полезности» (1887) вероятность рассматривается как основа индуктивного мышления, а его более поздние работы сосредоточены на «философии случая». Его первая работа по статистике (1883) исследовал закон ошибок ( нормальное распределение ), и его методы статистики (1885 г.) ввел раннюю версию распределения Стьюдента , то разложение Эджворта , в ряд Эджворта , метод трансформации варьировать а асимптотическая теория оценок максимального правдоподобия.

Норвежец Андерс Николай Кьер представил концепцию стратифицированной выборки в 1895 году. Артур Лион Боули ввел новые методы выборки данных в 1906 году, работая над социальной статистикой. Хотя статистические исследования социальных условий начались с работ Чарльза Бута «Жизнь и труд людей в Лондоне» (1889–1903) и Сибома Раунтри «Бедность, исследование городской жизни» (1901), Боули, ключевое нововведение состояла из использования методов случайной выборки . Кульминацией его усилий стал « Новый обзор жизни и труда Лондона» .

Фрэнсис Гальтон считается одним из основоположников статистической теории. Его вклад в эту область включал введение понятий стандартного отклонения , корреляции , регрессии и применение этих методов для изучения множества человеческих характеристик - роста, веса, длины ресниц и других. Он обнаружил, что многие из них можно подогнать к нормальному распределению кривой.

Гальтон представил в Nature в 1907 году статью о полезности медианы. Он проверил точность 787 предположений о весе быка на деревенской ярмарке. Фактический вес составлял 1208 фунтов: среднее предположение составляло 1198. Предположения были явно ненормально распределены.

Публикация Гальтона « Естественного наследования» в 1889 году вызвала интерес у блестящего математика Карла Пирсона , работавшего тогда в Университетском колледже Лондона , и он основал дисциплину математической статистики. Он подчеркивал статистическую основу научных законов и продвигал их изучение, а его лаборатория привлекала студентов со всего мира, которых привлекали его новые методы анализа, в том числе Удный Йоль . Его работа расширилась, чтобы охватить области биологии , эпидемиологии , антропометрии, медицины и социальной истории . В 1901 году вместе с Уолтером Велдоном , основателем биометрии , и Гальтоном он основал журнал Biometrika как первый журнал по математической статистике и биометрии.

Его работа и работа Гальтона лежат в основе многих «классических» статистических методов, которые широко используются сегодня, включая коэффициент корреляции , определяемый как момент произведения; метод моментов для подгонки распределений образцов; Система непрерывных кривых Пирсона, лежащая в основе ныне общепринятых непрерывных распределений вероятностей; Расстояние Хи - предвестник и частный случай расстояния Махаланобиса и P-значения , определяемого как мера вероятности дополнения мяча с гипотетическим значением в качестве центральной точки и расстоянием Хи в качестве радиуса. Он также ввел термин «стандартное отклонение».

Он также основал теорию статистической проверки гипотез , критерий хи-квадрат Пирсона и анализ главных компонент . В 1911 году он основал первый в мире университетский статистический факультет в Университетском колледже Лондона .

Вторая волна математической статистики была основана Рональдом Фишером, который написал два учебника: « Статистические методы для научных работников» , опубликованные в 1925 году, и « План экспериментов» в 1935 году, которые должны были определить академические дисциплины в университетах по всему миру. Он также систематизировал предыдущие результаты, поставив их на прочную математическую основу. В его основополагающей статье 1918 года «Корреляция между родственниками на основе предположения о менделевском наследовании» впервые использовался статистический термин « дисперсия» . В 1919 году на экспериментальной станции Ротамстед он начал серьезное исследование обширных коллекций данных, записанных за многие годы. В результате была выпущена серия отчетов под общим названием « Исследования изменчивости сельскохозяйственных культур». В 1930 году он опубликовал «Генетическую теорию естественного отбора», в которой применил статистику к эволюции .

В течение следующих семи лет он первым разработал принципы планирования экспериментов (см. Ниже) и разработал свои исследования дисперсионного анализа. Он продолжил свои исследования статистики малых выборок. Возможно, что еще более важно, он начал свой систематический подход к анализу реальных данных как трамплин для разработки новых статистических методов. Он разработал вычислительные алгоритмы для анализа данных из его сбалансированных экспериментальных проектов. В 1925 году эта работа привела к публикации его первой книги « Статистические методы для научных работников» . В последующие годы эта книга претерпела множество изданий и переводов и стала стандартным справочником для ученых во многих дисциплинах. В 1935 году за этой книгой последовала книга « План экспериментов» , которая также получила широкое распространение.

В дополнение к дисперсионному анализу Фишер назвал и продвигал метод оценки максимального правдоподобия . Фишер также зародился понятие достаточности , вспомогательной статистика , линейного дискриминатор Фишера и информации Фишера . Его статья О распределении уступая функции ошибок нескольких хорошо известных статистических данных (1924) представил хи-квадрат критерий Пирсона и Госсет «s т в тех же рамках, что и гауссова распределения , и его собственный параметр в анализе дисперсии г Фишера -распределение (чаще используется спустя десятилетия в форме F-распределения ). Уровень значимости 5%, по-видимому, был введен Фишером в 1925 году. Фишер заявил, что отклонения, превышающие вдвое стандартное отклонение, считаются значительными. До этого отклонения, превышающие трехкратную вероятную ошибку, считались значительными. Для симметричного распределения вероятная ошибка составляет половину межквартильного размаха. Для нормального распределения вероятная ошибка составляет примерно 2/3 стандартного отклонения. Похоже, что критерий 5% Фишера уходит корнями в предыдущую практику.

Другие важные вклады в это время включены Спирмен «s коэффициент ранговой корреляции , который был полезным расширением коэффициента корреляции Пирсона. Уильям Сили Госсет , английский статистик, более известный под псевдонимом Стьюдент , представил t-распределение Стьюдента , непрерывное распределение вероятностей, полезное в ситуациях, когда размер выборки невелик и стандартное отклонение населения неизвестно.

Эгон Пирсон (сын Карла) и Ежи Нейман ввели понятия «ошибка типа II », мощность теста и доверительные интервалы . Ежи Нейман в 1934 году показал, что стратифицированная случайная выборка в целом является лучшим методом оценки, чем целенаправленная (квотная) выборка.

Дизайн экспериментов

Джеймс Линд провел первое в истории клиническое испытание в 1747 году, пытаясь найти лекарство от цинги .

В 1747 году, работая хирургом в HM Bark Salisbury , Джеймс Линд провел контролируемый эксперимент по разработке лекарства от цинги . В этом исследовании кейсы его испытуемых «были настолько похожи, насколько я мог их представить», то есть он предоставил строгие требования для входа, чтобы уменьшить посторонние вариации. Мужчины были парными, что обеспечивало блокировку . С современной точки зрения, главное, чего не хватает, - это рандомизированное распределение субъектов для лечения.

Сегодня Линда часто называют экспериментатором, который постоянно учитывает каждый фактор. Аналогичные эксперименты с однократным использованием одного фактора (OFAT) были проведены на исследовательской станции Ротамстед в 1840-х годах сэром Джоном Лоусом для определения оптимального неорганического удобрения для использования на пшенице.

Теория статистического вывода была разработана Чарльзом С. Пирсом в « Иллюстрациях логики науки » (1877–1878) и « Теория вероятного вывода » (1883), двух публикациях, в которых подчеркивалась важность вывода на основе рандомизации в статистика. В другом исследовании, Пирс рандомизирован добровольцы в слепом , дизайн повторных измерений , чтобы оценить их способность различать веса.

Эксперимент Пирса вдохновил других исследователей в области психологии и образования, которые в 1800-х годах развили исследовательскую традицию рандомизированных экспериментов в лабораториях и специализированных учебниках. Пирса также способствовало первое издание на английском языке на качестве конструкции оптимальной для регрессии - модели в 1876. новаторского дизайна оптимальной для полиномиальной регрессии был предложен Gergonne в 1815. В 1918 Kirstine Смит опубликовал оптимальные конструкции для многочленов степени шесть (и меньше) .

Использование последовательности экспериментов, дизайн каждого из которых может зависеть от результатов предыдущих экспериментов, включая возможное решение прекратить эксперименты, было впервые предложено Абрахамом Вальдом в контексте последовательных проверок статистических гипотез. Доступны обзоры оптимальных последовательных планов и адаптивных планов . Одним из специфических типов последовательного дизайна является «двурукий бандит», обобщенный до многорукого бандита , ранняя работа над которым была проделана Гербертом Роббинсом в 1952 году.

Термин «план экспериментов» (DOE) происходит от ранней статистической работы, выполненной сэром Рональдом Фишером . Андерс Хальд описал его как «гения, который почти в одиночку создал основы современной статистической науки». Фишер положил начало принципам планирования экспериментов и развил свои исследования « дисперсионного анализа ». Возможно, что еще более важно, Фишер начал свой систематический подход к анализу реальных данных как трамплин для разработки новых статистических методов. Он начал уделять особое внимание труду, связанному с необходимыми вычислениями, выполняемыми вручную, и разработал методы, которые были столь же практичны, сколь и основаны на строгости. В 1925 году эта работа завершилась публикацией его первой книги « Статистические методы для научных работников» . В последующие годы она вошла во многие издания и переводы и стала стандартной справочной работой для ученых во многих дисциплинах.

Методология планирования экспериментов была предложена Рональдом А. Фишером в его новаторской книге « Планирование экспериментов» (1935), которая также стала стандартом. В качестве примера он описал, как проверить гипотезу о том, что некая женщина может различать только по вкусу, молоко или чай было сначала помещено в чашку. Хотя это звучит как легкомысленное заявление, оно позволило ему проиллюстрировать самые важные идеи экспериментального дизайна: увидеть, как Леди дегустирует чай .

Достижения в области сельскохозяйственной науки позволили объединить более крупное городское население и меньшее количество ферм. Но для учёных-растениеводов, чтобы должным образом учесть сильно различающиеся географические климатические условия и потребности выращивания, было важно дифференцировать местные условия выращивания. Чтобы экстраполировать эксперименты с местными культурами на национальный масштаб, им пришлось экономно расширить тестирование образцов сельскохозяйственных культур на все население. По мере развития статистических методов (в первую очередь эффективности запланированных экспериментов вместо экспериментов по одному фактору), репрезентативный факторный план экспериментов начал делать возможным значимое распространение результатов экспериментальной выборки на популяцию в целом. . Но было трудно решить, насколько репрезентативна была выбрана выборка сельскохозяйственных культур. Методология факторного дизайна показала, как оценивать и корректировать любые случайные вариации в выборке, а также в процедурах сбора данных.

Байесовская статистика

Пьер-Симон, маркиз де Лаплас, главный ранний разработчик байесовской статистики.

Термин байесовский относится к Томасу Байесу (1702–1761), который доказал, что вероятностные пределы могут быть наложены на неизвестное событие. Однако именно Пьер-Симон Лаплас (1749–1827) ввел (в качестве принципа VI) то, что сейчас называется теоремой Байеса, и применил ее к небесной механике , медицинской статистике, надежности и юриспруденции . Когда было доступно недостаточно знаний, чтобы указать информированного апостола, Лаплас использовал единообразные априорные решения в соответствии со своим « принципом недостаточной причины ». Лаплас предполагал единообразные априорные решения скорее из соображений математической простоты, чем из философских соображений. Лапласа также ввела примитивные версии сопряженных априорий и теоремы о Мизесе и Bernstein , в соответствии с которым апостериорными , соответствующими изначально отличающимися априориями в конечном счете , согласны, так как число наблюдений увеличиваются. Этот ранний байесовский вывод, в котором использовались единообразные априорные значения в соответствии с принципом недостаточной причины Лапласа , был назван « обратной вероятностью » (потому что он выводит в обратном направлении от наблюдений к параметрам или от следствий к причинам).

После 1920-х годов обратная вероятность была в значительной степени вытеснена набором методов, разработанных Рональдом А. Фишером , Ежи Нейманом и Эгоном Пирсоном . Их методы стали называть частотной статистикой . Фишер отверг байесовскую точку зрения, написав, что «теория обратной вероятности основана на ошибке и должна быть полностью отвергнута». Однако в конце своей жизни Фишер выразил большее уважение к эссе Байеса, которое, как считал Фишер, предвосхитило его собственный, реперный подход к вероятности; Фишер по-прежнему утверждал, что взгляды Лапласа на вероятность были «ложным вздором». Нейман начинал как «квазибайесовец», но впоследствии разработал доверительные интервалы (ключевой метод в частотной статистике), потому что «вся теория выглядела бы лучше, если бы она была построена с самого начала без ссылки на байесовство и априорные факторы». Слово байесовское появилось примерно в 1950 году, а к 1960-м годам оно стало термином, предпочитаемым теми, кто недоволен ограниченностью частотной статистики.

В 20-м веке идеи Лапласа получили дальнейшее развитие в двух разных направлениях, что породило объективные и субъективные течения в байесовской практике. В потоке объективистов статистический анализ зависит только от предполагаемой модели и проанализированных данных. Не нужно принимать никаких субъективных решений. Напротив, «субъективные» статистики отрицают возможность полностью объективного анализа для общего случая.

В дальнейшем развитии идей Лапласа субъективные идеи предшествовали объективистским позициям. Идея о том, что «вероятность» следует интерпретировать как «субъективную степень веры в суждение», была предложена, например, Джоном Мейнардом Кейнсом в начале 1920-х годов. Эта идея была развита Бруно де Финетти в Италии ( Fondamenti Logici del Ragionamento Probabilistico , 1930) и Фрэнком Рэмси в Кембридже ( Основы математики , 1931). Подход был разработан для решения проблем с частотным определением вероятности, а также с более ранним объективистским подходом Лапласа. Субъективные байесовские методы получили дальнейшее развитие и популяризацию в 1950-х годах Л. Дж. Сэвиджем .

Цель байесовский вывод в дальнейшем была разработана Гарольд Джеффрис в Кембриджском университете . Его основополагающая книга «Теория вероятностей» впервые появилась в 1939 году и сыграла важную роль в возрождении байесовского взгляда на вероятность . В 1957 году Эдвин Джейнс продвигал концепцию максимальной энтропии для построения априорных значений , которая является важным принципом при формулировании объективных методов, в основном для дискретных задач. В 1965 году двухтомная работа Денниса Линдли «Введение в вероятность и статистику с байесовской точки зрения» представила байесовские методы широкой аудитории. В 1979 году Хосе-Мигель Бернардо представил эталонный анализ , который предлагает общую применимую основу для объективного анализа. К другим известным сторонникам байесовской теории вероятностей относятся И. Дж. Гуд , Б. О. Купман , Ховард Райффа , Роберт Шлайфер и Алан Тьюринг .

В 1980-х годах наблюдался резкий рост исследований и приложений байесовских методов, в основном связанный с открытием методов Монте-Карло с цепями Маркова , которые устранили многие вычислительные проблемы и растущий интерес к нестандартным сложным приложениям. Несмотря на рост байесовских исследований, большая часть обучения в бакалавриате по-прежнему основана на частотной статистике. Тем не менее, байесовские методы широко приняты и используются, например, в области машинного обучения .

Важные участники статистики

использованная литература

Библиография

внешние ссылки