Машинное обучение - Machine learning


Из Википедии, свободной энциклопедии

Машина обучения (ML) является научным исследованием об алгоритмах и статистических моделях , которые компьютерные системы используют для эффективного выполнения конкретной задачи без использования явных инструкций, опираясь на модель и вывод вместо этого. Он рассматривается как подмножество искусственного интеллекта . Алгоритмы машинного обучения построить математическую модель выборки данных, известные как « обучающих данные », для того , чтобы сделать предсказание или решение , не будучи явно запрограммированными для выполнения этой задачи. Алгоритмы машинного обучения используются в приложениях электронной фильтрации , обнаружения сетевых вторжений и компьютерного зрения , где оно неосуществимо разработать алгоритм конкретных инструкций для выполнения этой задачи. Машинное обучение тесно связано с вычислительной статистики , которая фокусируется на прогнозировании с использованием компьютеров. Изучение математической оптимизации предоставляет методы, теорию и прикладные области в области машинного обучения. Интеллектуальный анализ данных является полем исследования в области машинного обучения, и фокусируется на разведочном анализе данных с помощью неконтролируемого обучения . При его применении через бизнес - задачи, машинное обучение также упоминаются как прогностический анализ .

содержание

Обзор машинного обучения

Название машинного обучения был придуман в 1959 году Артуром Самуила . Том М. Митчелл предоставил широко цитируемый, более формальное определение алгоритмов , изучаемых в области машинного обучения: «Компьютерная программа называется извлечь из опыта Е относительно некоторого класса задач Т и производительности меры P , если его производительность в задачах в T , как измерено с помощью Р , улучшается с опытом Е «. Это определение задач , в которых машинное обучение обеспокоено предлагает принципиально операционное определение , а не определение поля в когнитивный терминах. Это следует Алан Тьюринг предложение «s в своей статье„ Вычислительные машины и разум “, в которой вопрос„Могут ли машины думать?“ заменяются на вопросе «Может ли машина делать то , что мы (как мыслящие сущности) можно сделать?». В предложении Тьюринга различные характеристики , которые могут быть одержим мыслительной машины и различные последствия в построении одной подвергаются.

задачи машинного обучения

Опорных векторы Контролируемая модель обучения , которая делит данные в регионы , разделенных линейной границей . Здесь линейная граница делит черные круги от белого.

Задачи обучения машины подразделяются на несколько основных категорий. В контролируемом обучении , алгоритм строит математическую модель из набора данных , который содержит как входы и желаемые выходы. Например, если задача была определить , содержит ли изображение определенный объект, обучающих данных для контролируемого алгоритма обучения будет включать в себя изображения с и без этого объекта (вход), и каждое изображение будет иметь метку (вывод) , обозначающий ли он содержал объект. В особых случаях, ввод может быть только частично, или ограничивается специальной обратной связи. Полуобучаемое обучение алгоритмы разработка математические моделей из неполных данных обучения, где часть входной выборки не имеет меток.

Классификация алгоритмов и регрессионные алгоритмы типа контролируемого обучения. Алгоритмы классификации используются , когда выходы ограничивается ограниченным набором значений. Для алгоритма классификации , которая фильтрует сообщения электронной почты, вход был бы входящей электронной почты, и результат будет имя папки , в которой в файл по электронной почте. Для алгоритма , который идентифицирует спам, то выход будет предсказание либо «спам» или «не спам», представлены булевыми значениями истинных и ложных. Регрессионные алгоритмы названы по их непрерывным выходам, то есть они могут иметь любое значение в пределах диапазона. Примеры непрерывного значения являются температура, длина, или цена объекта.

В неконтролируемом обучении , алгоритм строит математическую модель из набора данных , который содержит только входы и нет желаемых выходных меток. Алгоритмы неконтролируемого обучения используются , чтобы найти структуру данных, как группировка или кластеризации точек данных. Неконтролируемое обучение может обнаружить закономерности в данных, и может сгруппировать входы в категории, как и в художественном обучении . Снижение Размерность представляет собой процесс сокращения числа «особенностей», или входов, в наборе данных.

Активное обучение алгоритмы доступ желаемых результатов (подготовка этикетки) для ограниченного набора входных данных на основе бюджета, а также оптимизировать выбор материалов , для которых он будет приобретать учебные этикетки. При использовании в интерактивном режиме , они могут быть представлены к человеческому пользователю для маркировки. Обучения Армирования алгоритмы дают обратную связь в виде положительного или отрицательного подкрепления в динамичной среде, и используются в автономных транспортных средствах или в процессе обучения , чтобы играть в игру против человека. Другие специализированные алгоритмы машинного обучения включают в себя тему моделирование , где компьютерная программа дается набор естественных языковых документов и находит другие документы , которые охватывают аналогичные темы. Алгоритмы машинного обучения могут быть использованы , чтобы найти ненаблюдаемую функцию плотности вероятности в оценке плотности проблем. Мета обучения алгоритмов узнать свой собственный индуктивный уклон на основе предыдущего опыта. В робототехнике развития , обучения робота алгоритмы генерирует свои собственные последовательности опыта обучения, также известный как учебный план, чтобы совокупно приобретать новые навыки через самонаводящиеся разведки и социальное взаимодействие с людьми. Эти роботы используют руководящие механизмы , такие как активное обучение, созревания двигательных синергию и подражание.

История и отношения к другим полям

Артур Сэмюэль , американский пионер в области компьютерных игр и искусственного интеллекта , ввел термин «машинного обучения» в 1959 году в то время как IBM . В научной деятельности, машинного обучения выросла из стремления к области искусственного интеллекта. Уже в первые дни ИИ , как академическая дисциплина, некоторые исследователи были заинтересованы в том , чтобы машины узнать из данных. Они попытались подойти к проблеме с различными символическими методами, а также то , что было тогда называемых « нейронных сетей »; это были в основном персептроны и другие модели , которые позже были найдены , чтобы быть reinventions этих обобщенных линейных моделей статистики. Вероятностные рассуждения было также использованы, особенно в автоматизированной медицинской диагностике.

Тем не менее, все большее внимание на логическом, подходе , основанном на знаниях вызвало разрыв между ИИ и машинного обучения. Вероятностные системы страдала от теоретических и практических проблем сбора и представления данных. К 1980 году, экспертные системы были доминировать AI, а статистика была немилость. Работа на символическом / обучении , основанные на знаниях были продолжать в AI, что приводит к индуктивному логическому программированию , но более статистическая линия исследования теперь вне области ИИ собственно в распознавании образов и поиске информации . Исследования нейронных сетей были покинуты ИИ и информатики примерно в то же время. Эта линия также была продолжена вне поля AI / CS, как « коннекционизма », исследователи из других дисциплин , в том числе Хопфилда , Rumelhart и Хинтон . Их главный успех пришел в середине 1980-х годов с переосмысления обратного распространения .

Машинное обучение, реорганизовано в отдельное поле, начал развиваться в 1990 - е годы. Поле изменило свою цель от достижения искусственного интеллекта для решения разрешимых проблем практического характера. Это внимание переключилось от символических подходов она унаследовала от ИИ, и к методам и моделям , заимствованным из статистики и теории вероятностей . Он также выгода от увеличения доступности цифровой информации, а также возможности распространять его через Интернет .

Отношение к интеллектуальному анализу данных

Машинное обучение и данные добыча часто используют одни и те же методы и значительно перекрывают друг друг, но в то время как машинное обучение фокусируется на предсказании, на основе известных свойств , извлеченной из обучающих данных, интеллектуальный анализ данных фокусируется на открытии части (ранее) неизвестные свойства в данных (это этап анализа обнаружения знаний в базах данных). Интеллектуальный анализ данных использует множество методов машинного обучения, но и с различными целями; с другой стороны, машинное обучение также использует методы интеллектуального анализа данных , как «неконтролируемое обучение» или как шаг предварительной обработки для повышения точности обучаемой. Большая часть путаницы между этими двумя научными сообществами (которые часто имеют отдельные конференции и отдельные журналы, ECML PKDD будучи основным исключением) исходит из основных допущений , с которыми они работают: в машинном обучении, производительность обычно оценивается по отношению к способности воспроизвести известное знание, в то время как обнаружение знаний и интеллектуального анализа данных (KDD) ключевой задачей является обнаружение ранее неизвестного знания. Оценивается по отношению к известным знаниям, неинформированный (неконтролируемый) метод легко будет превзошел другими контролируемыми методами, в то время как в типичной задаче KDD, под контроль метода не может быть использована из - за недоступности данных обучения.

Отношение к оптимизации

Машинное обучение также имеет тесные связи с оптимизацией : многие проблемы обучения сформулированы в виде минимизации некоторой функции потерь на обучающем множестве примеров. Функции потерь выражают расхождение между предсказаниями моделей обучаясь и реальными проблемными случаями (например, в классификации, один хочет , чтобы присвоить метку к экземплярам, а модели обучаются правильно предсказать заранее присвоены метки набора Примеры). Разница между этими двумя областями возникает от цели обобщения: в то время как алгоритмы оптимизации могут свести к минимуму потери на обучающем наборе, машинного обучения связана с минимизацией потерь на невидимых образцах.

Отношение к статистике

Машинное обучение и статистика тесно связанные с ними области. По словам Майкла И. Иордана , идеи машинного обучения, методологических принципов в теоретические инструменты, имели долгую предысторию в статистике. Он также предложил термин науки данных в качестве заполнителя для вызова общего поля.

Лео Бреймана различает два статистических моделирование парадигм: модель данных и алгоритмические модели, в которой «алгоритмическая модель» означает более или менее алгоритмы машинного обучения , как случайный лес .

Некоторые статистики приняли методы из машинного обучения, что приводит к комбинированному полю , что они называют статистическое обучение .

теория

Сердечник задачей обучающегося является обобщение из своего опыта. Обобщение в этом контексте является способностью обучающей машины точно выполнять на новых, невидимых примерах / заданиях после испытав обучения набора данных. Примеры обучения из какого-нибудь вообще неизвестно распределения вероятностей (считаются представителем пространства вхождений) и обучающиеся должны построить общую модель об этом пространстве, что позволяет ей производить достаточно точные предсказания в новых случаях.

Вычислительный анализ алгоритмов машинного обучения и их эффективность является филиалом теоретической информатики , известной как вычислительная теория обучения . Поскольку подготовка множество конечны и будущее является неопределенным, теория обучения , как правило , не дает гарантию выполнения алгоритмов. Вместо этого, вероятностные оценки по производительности являются довольно распространенным явлением. Разложение диагонально-дисперсия является одним из способов количественного обобщения ошибки .

Для лучшей производительности в контексте обобщения, сложность гипотезы должна соответствовать сложностям функции , лежащей в основе данных. Если гипотеза является менее сложной , чем функция, то модель имеет underfit данные. Если сложность модели увеличивается в ответ, то ошибка обучения уменьшается. Но если гипотеза слишком сложна, то модель с учетом переобучения и обобщения будет хуже.

В дополнение к часам производительности вычислений теоретики обучения изучают временную сложность и целесообразность обучения. В вычислительной теории обучения, вычисление считается возможным , если это может быть сделано в полиномиальное время . Есть два вида сложности времени результатов. Положительные результаты показывают , что определенный класс функций можно узнать в полиномиальное время. Отрицательные результаты показывают , что некоторые классы не могут быть изучены в полиномиальное время.

подходы

Типы алгоритмов обучения

Типы алгоритмов машинного обучения отличаются в своем подходе, тип данных, они ввод и вывод, а также тип задачи или проблем, которые они призваны решать.

Контролируемое и полуобучаемое обучение

Контролируемые алгоритмы обучения построить математическую модель набора данных , который содержит как входы и желаемые выходы. Данные известны как обучающие данные , и состоят из множества обучающих примеров. Каждый учебный пример имеет один или несколько входов и желаемый результат, также известный как контрольный сигнал. В случае полуобучаемой алгоритмов обучения, некоторые из учебных примеров не хватает желаемых результатов. В математической модели, каждый обучающий пример представлен в массиве или вектора, а также обучающих данных с помощью матрицы . С помощью итеративной оптимизации с целевой функцией , контролируемые алгоритмы обучения обучения функции , которые могут быть использованы для прогнозирования выхода , связанный с новыми входами. Оптимальная функция позволит алгоритму правильно определить выход для входов , которые не были частью обучающих данных. Алгоритм , который повышает точность его результатов или прогнозов с течением времени , как говорят, научился выполнять эту задачу.

Контролируемые алгоритмы обучения включают в себя классификацию и регресс . Алгоритмы классификации используется , когда выходы ограничены ограниченным набор значений, а также алгоритмы регрессии используется , когда выходные сигналы могут иметь любое числовое значение в пределах диапазона. Обучение Сходства является областью контролируемого машинного обучения тесно связан с регрессией и классификацией, но цель состоит в том, чтобы извлечь из примеров , используя функцию подобия , которая измеряет , как аналогичные или связанные два объекта. Он имеет приложения в рейтинге , рекомендательных систем , визуального отслеживания идентичности, проверка лица и верификации диктора.

Неконтролируемое обучение

Неконтролируемые алгоритмы обучения принимают набор данных , который содержит только входы, и найти структуру данных, как группировка или кластеризации точек данных. Поэтому алгоритмы узнать из тестовых данных , которые не были помечены, классифицируются или по категориям. Вместо того , чтобы реагировать на обратную связь, неконтролируемые алгоритмы обучения идентификации сходств в данных и реагируют на основании наличия или отсутствия таких общностей в каждой новой порции данных. Центральное применение неконтролируемого обучения в области оценки плотности в статистике , хотя без присмотра обучения включает в себя другие домены , связанные с обобщением и объяснения особенностей данных.

Кластерный анализ является предоставлением набора наблюдений на подмножества (называемые кластеры ) , так что наблюдения в пределах одного кластера аналогичны согласно одному или более критериям predesignated, в то время как наблюдения , сделанные из различных кластеров неодинаковы. Различные методы кластеризации делают различные предположения о структуре данных, часто определяется некоторым сходством метрики и оценены, например, от внутренней компактности , или сходства между членами одного и того же кластера, и разделения , разница между кластерами. Другие методы основаны на оценочной плотности и связности графа .

обучение Армирование

Обучение Армирование является областью машинного обучения касается того , как программное обеспечение , агенты должны принимать меры в среде так, чтобы максимизировать некоторое представление о совокупной награды. Благодаря своей общности, поле изучаются во многих других областях, такие , как теория игр , теория управления , исследование операций , теория информации , моделирование на основе оптимизация , многоагентные системы , роя интеллект , статистика и генетические алгоритмы . В машинном обучении, окружающая среда , как правило , представлена в виде принятия марковского процесса (MDP). Многие алгоритмы обучения армирования используют динамические программные методы. Алгоритмы обучения Армирования не предполагают знание точной математической модели MDP, и используются , когда точные модели неосуществимые. Алгоритмы обучения Армирования используются в автономных транспортных средствах или в процессе обучения , чтобы играть в игру против человека.

Процессы и методы

Различные процессы, способы и методы могут быть применены к одному или более типам алгоритмов машинного обучения для повышения их эффективности.

обучения Характеристики

Несколько алгоритмы обучения направлены на выявление лучшего представления материалов , представленных в ходе обучения. Классические примеры включают анализ основных компонентов и кластерный анализ. Алгоритмы обучения Feature, называемые также представлением алгоритмов обучения, часто пытаются сохранить информацию на своем входе , но и трансформировать его таким образом , что делает его полезным, часто в качестве стадии предварительной обработки перед выполнением классификации или предсказания. Этот метод позволяет восстановить входов , поступающих от неизвестного распределения данных порождающей, но при этом не обязательно верны конфигурации, которые неправдоподобно под этим распределением. Это заменяет ручную функцию инженерию , и позволяет машину , чтобы узнать , как функцию и использовать их для выполнения конкретной задачи.

Обучения Функция может быть под наблюдением или без присмотра. В подконтрольном обучении функций, функции усваиваются с использованием меченых входных данных. Примеры включают в себя искусственные нейронные сети , многослойные персептроны и контролируемый словарь обучение . В неконтролируемом обучении функций, функции усваиваются с немечеными входными данными. Примеры включают словарь обучения, независимый анализ компонентов , автоассоциатор , матричной прогонки и различные формы кластеризации .

Коллекторы обучение алгоритмы пытаются сделать это в соответствии с ограничением , что узнали представление маломерное. Разреженных кодирования алгоритмов пытаются сделать это при ограничении , что узнали представление является редким, это означает , что математическая модель имеет много нулей. Полилинейные обучения подпространства алгоритмы стремятся узнать низкоразмерное представление непосредственно из тензорных представлений для многомерных данных, без изменения формы их в более-мерные векторы. Глубокие обучающие алгоритмы обнаруживают несколько уровней представления, или иерархию функций, с более высоким уровнем, более абстрактные признаками , определенные в терминах (или генерировании) функции более низкого уровня. Утверждалось , что интеллектуальная машина одна , которая изучает представление , которое распутывает основные факторы изменения , которые объясняют наблюдаемые данные.

обучения Особенности мотивированы тем, что задачи машинного обучения, такие как классификация часто требуют ввода, которое математически и вычислительно удобно обрабатывать. Тем не менее, реальные данные, такие как изображения, видео и сенсорные данные не уступали попытки алгоритмический определить специфические особенности. В качестве альтернативы можно обнаружить такие признаки или представление через экспертизу, не полагаясь на явных алгоритмах.

Разреженный словарь обучение

Разреженный словарь обучение является методом обучения функции , где учебный пример представлен в виде линейной комбинации базисных функций , и предполагается , что быть разреженной матрицей . Метод сильно NP-трудной и трудно решить приближенно. Популярный эвристический метод разреженного словаря обучения является K-SVD алгоритма. Разреженный словарь обучение было применено в нескольких контекстах. В классификации, проблема заключается в определении , к которой принадлежит классам ранее невидимый пример обучения. Для словаря , где уже построен каждый класс, новый пример обучения связан с классом , который лучше всего скудно представленный соответствующим словарем. Разреженный словарь обучение также применяется в изображении де-зашумлении . Ключевая идея заключается в том, что чистый патч изображения может быть слабо представлена в словаре изображения, но шум не может.

обнаружение аномалий

В интеллектуальном анализе данных , обнаружение аномалии, также известный как аномальное значение обнаружения, является идентификацией редких предметов, событий или наблюдений , которые поднимают подозрение, значительно отличающимися от большинства данных. Как правило, аномальные элементы представляют собой проблему , такие как банковское мошенничество , структурный дефект, медицинские проблемы или ошибки в тексте. Аномалии называются останцы , новинки, шум, отклонений и исключений.

В частности, в контексте злоупотребления и обнаружения вторжения в сеть, интересные объекты часто не являются редкими объектами, но неожиданные всплески активности. Эта модель не прилипает к общей статистической определению выброса в качестве редкого объекта, и многих методов обнаружения выбросов (в частности, неконтролируемых алгоритмах) потерпит неудачу на таких данных, если оно не было надлежащим образом агрегируется. Вместо этого, алгоритм кластерного анализа может быть в состоянии обнаружить микро-кластеров, образованных этими узорами.

Три основных категорий аномальных методов обнаружения существует. Неконтролируемые методы обнаружения аномалии обнаружение аномалий в немеченоге тестовых данных, установленных в предположении, что большинство случаев в наборе данных являются нормальным, путем поиска экземпляров, которые кажутся, чтобы соответствовать меньшей мере, к остальной части набора данных. Контролируемые методы обнаружения аномалий требуется набор данных, который был помечен как «нормальный» и «ненормальный» и включает в себя обучение классификатор (ключевое значение для многих других задач статистической классификации является присущая несбалансированным характер аномальное значение обнаружения). Пол-контролируемые методы обнаружения аномалий построить модель, представляющую нормальное поведение от заданного нормального тренировочного набора данных, а затем проверить вероятность экземпляра теста, чтобы быть сгенерирована с помощью модели.

деревья решений

Обучения дерева решений используют дерево решений , как прогнозная модель , чтобы перейти от наблюдений о предмете (представленном в ветвях) к выводам о целевой стоимости элемента (представленной в листах). Это один из прогностических методов моделирования , используемых в статистике, интеллектуального анализа данных и машинного обучения. Модели деревьев , где целевая переменная может принимать дискретный набор значений называются деревья классификации; в этих структурах дерева, листы представляют собой класс метку и ветви представляют конъюнкции функций , которые приводят к этим классу меткам. Деревья решений , где целевая переменная может принимать непрерывные значения ( как правило , реальные числа ), называются регрессионные деревья. В анализе решений, дерево решений можно использовать для визуального и четко представлять решения и принятия решений . В горнодобывающей промышленности данных, дерево решений описывают данные, но в результате дерево классификации может быть входом для принятия решений.

Ассоциативные правила

Обучения правило Ассоциация является основанной на правилах машинного обучения метод для выявления взаимосвязей между переменными в больших базах данных. Он предназначен для выявления строгих правил , обнаруженных в базах данных с помощью какой - то мере «интересности». Такой подход на основе правил порождает новые правила , как он анализирует больше данных. Конечная цель, предполагая , что набор данных достаточно велико, чтобы помочь машину имитировать человеческий мозг выделение признаков и абстрактные ассоциации возможность для данных , которые не были классифицированы.

Правило на основе машинного обучения является общим термином для любого машинного метода обучения , который идентифицирует, узнаёт, или эволюционирует «правила» для хранения, обработки или применения знаний. Определяющей характеристикой алгоритма машинного обучения на основе правил является определение и использование набора реляционных правил , которые в совокупности представляют собой знания , захваченное системой. Это в отличии от других алгоритмов машинного обучения , которые обычно идентифицируют особую модель , которая может быть универсально применена к любому экземпляру для того , чтобы сделать прогноз. Правило на основе подходы машинного обучения включают в себя обучающие системы классификаторов , изучение правил ассоциации и искусственные иммунные системы .

На основе концепции сильных правил, Ракеш Агравал , Томаш Имиелински и Арун Свами введены ассоциативные правила для выявления закономерностей между продуктами в данной транзакции крупномасштабной записанного пунктом-продаже (POS) системы в супермаркетах. Например, правило содержится в данном супермаркете продаж будет означать , что если клиент покупает лук и картофель вместе, они, вероятно, также покупает гамбургер мясо. Такая информация может быть использована в качестве основы для принятия решений о маркетинговых мероприятиях , таких как рекламные ценообразования или продукта размещение . В дополнение к анализу рыночной корзины , ассоциативные правила используются сегодня в областях применения , в том числе горнодобывающей промышленности веб использования , обнаружения вторжений , непрерывного производства и биоинформатики . В отличии от добычи последовательности , обучение правила ассоциации , как правило , не учитывает порядок элементов либо в рамках сделки или через сделку.

Изучение система классификаторов (ЛВП) представляет собой семейство алгоритмов машинного обучения на основе правил , которые сочетают в себе компонент обнаружения, как правило , в генетический алгоритм , с компонентом обучения, выполняя либо контролируемое обучение , обучение с подкреплением , или неконтролируемое обучением . Они стремятся определить набор контекстно-зависимые правил , которые вместе хранят и применяют знания в кусочно образом, чтобы сделать предсказание.

Индуктивное логическое программирование (ЦЛП) является подходом к правилу обучения с использованием логического программирования в виде однородное представления для входных примеров, фоновых знаний и гипотез. Учитывая кодирование известных фоновых знаний и набор примеров , представленных в качестве логической базы данных фактов, система ИЛПА будет выводить гипотетическую логическую программу , которая влечет за собой все положительную и какие - либо негативные примеры. Индуктивный программирование является смежной области , который рассматривает любые языки программирования для представления гипотез (и не только логическое программирование), такие как функциональные программы .

Индуктивный логика программирования особенно полезна в биоинформатике и обработки естественного языка . Гордон Плоткин и Эхуд Шапиро заложили первоначальную теоретическую основу для индуктивного машинного обучения в логической обстановке. Шапиро построили свою первую реализацию (модель системы Умозаключение) в 1981 году: программа на Прологе , которая индуктивно выведенный логические программы из положительных и отрицательных примеров. Термин индуктивный здесь относится к философской индукции, что указывает на теорию , чтобы объяснить наблюдаемые факты, а не математической индукции, доказывающие свойство для всех членов хорошо упорядоченного множества.

модели

Искусственные нейронные сети

Искусственная нейронная сеть представляет собой взаимосвязанную группу узлов, сродни обширной сети нейронов в головном мозге . Здесь каждый узел круговой представляет собой искусственный нейрон , а стрелка представляет собой соединение с выходом одного искусственного нейрона к входу других.

Искусственные нейронные сети (ИНС), или Коннекшионистские системы, являются вычислительными системы неопределенно , вдохновленных биологическими нейронными сетями , которые представляют собой животное мозги . Сама нейронная сеть не алгоритм, а скорее основа для многих различных алгоритмов машинного обучения для совместной работы и обработки сложных входных данных. Такие системы «учиться» для выполнения задач, рассматривая примеры, как правило , не программируются с любыми правилами конкретных задач.

ИНС является модель , основанная на наборе подключенных устройств или узлов , называемых « искусственных нейронов », который свободно моделировать нейроны в биологическом мозге . Каждое соединение, как синапсы в биологическом мозге , может передавать информацию, «сигнал», от одного искусственного нейрона к другому. Искусственный нейрон , который принимает сигнал может обрабатывать его , а затем сигнализировать дополнительные искусственные нейроны , подключенные к нему. В общих реализациях ИНСА, сигнал на связи между искусственными нейронами является действительным числом , а выход каждого искусственного нейрона вычисляются с помощью некоторой нелинейной функции от суммы его входов. Связи между искусственными нейронами, называется «ребром». Искусственные нейроны и края , как правило , имеют вес , который регулирует в качестве учебных средств. Вес увеличивает или уменьшает мощность сигнала при соединении. Искусственные нейроны могут иметь порог таким образом, что сигнал посылается только , если суммарный сигнал пересекает этот порог. Как правило, искусственные нейроны объединяются в слои. Различные слои могут выполнять различные виды преобразований на их входах. Сигналы перемещаются от первого слоя (входной слой), до последнего слоя (выходной слой), возможно , после прохождения слоев несколько раз.

Первоначальная цель подхода ИНС для решения проблемы таким же образом , что человеческий мозг будет. Тем не менее, с течением времени, внимание переехало в выполнении конкретных задач, что приводит к отклонениям от биологии . Искусственные нейронные сети были использованы на различных задач, в том числе компьютерного зрения , распознавания речи , машинного перевода , социальной сети фильтрации, играя в настольные и видеоигры и медицинской диагностики .

Глубокое изучение состоит из нескольких скрытых слоев в искусственной нейронной сети. Этот подход пытается смоделировать образ процессов мозга человека свет и звук в зрение и слух. Некоторые успешные приложения глубокого изучения являются компьютерным зрением и распознавание речи .

Поддержка векторной машины

Поддержка векторная машина (SVM), также известная как поддержка векторных сети, представляет собой набор связанных курируемых учебных методов , используемые для классификации и регрессии. Принимая во внимание множество обучающих примеров, каждый из которых помечен как принадлежащие к одной из двух категорий, алгоритм SVM обучения строит модель , которая предсказывает , попадает ли новый пример в одну категорию или другой. Алгоритм SVM обучения является не- вероятностным , двоичным , линейный классификатором , хотя методы , такими как Platt масштабирование существует , чтобы использовать SVM в вероятностной настройке классификации. Помимо выполнения линейной классификации, SVMs может эффективно выполнять нелинейную классификацию , используя то , что называется ядро трюк , неявно отображение их вклад в многомерных пространствах художественных.

байесовская сеть

Простая байесовская сеть. Дождевые влияет ли активированные разбрызгиватель, и оба дождя и влияние спринклерной ли трава влажная.

Байесовская сеть, сеть веры или ориентированная ациклическая графическая модель является вероятностной графической моделью , которая представляет собой набор случайных величин и их условную независимость с ориентированным ациклическим графом (DAG). Например, байесовская сеть может представлять вероятностные связи между заболеваниями и симптомами. Указанные симптомы, сеть может быть использована для вычисления вероятности наличия различных заболеваний. Эффективные алгоритмы существуют , которые выполняют умозаключение и обучение. Байесовские сети , которые моделируют последовательность переменных, как речевые сигналы или белковые последовательности , называются динамическими байесовские сетями . Обобщения байесовской сети , которые могут представлять и решать проблемы , решения в условиях неопределенности, называются влияния диаграмм .

Генетические алгоритмы

Генетический алгоритм (ГА) представляет собой алгоритм поиска и эвристический метод , который имитирует процесс естественного отбора , с использованием методов , такие как мутация и кроссовером для создания новых генотипов в надежде найти хорошие решения данной проблемы. В машинном обучении, генетические алгоритмы были использованы в 1980 - х и 1990 - х годах. С другой стороны , методы машинного обучения были использованы для повышения эффективности генетических и эволюционных алгоритмов .

Приложения

Приложения для машинного обучения включают в себя:


В 2006 году онлайн кинокомпания Netflix провела первый « Netflix Prize конкуренции» , чтобы найти программу , чтобы лучше прогнозировать предпочтения пользователей и повысить точность на существующем алгоритме рекомендации Cinematch фильма , по крайней мере , на 10%. Совместная группа в составе исследователей из AT & T Labs - исследовательский в сотрудничестве с командами Большого Хаоса и прагматический Теория построил ансамбль модели , чтобы выиграть главный приз в 2009 году за $ 1 млн. Вскоре после того , как приз был присужден, Netflix понял , что рейтинги зрителей были не самыми лучшими показателями их моделей просмотра ( „все рекомендации“) , и они изменили свою рекомендацию двигателя соответственно. В 2010 году The Wall Street Journal пишет о фирме Rebellion Research и их использование машинного обучения для прогнозирования финансового кризиса. В 2012 году один из основателей Sun Microsystems , Винод Косла , предсказал , что 80% медицинских врачей рабочих мест будет потеряно в течение следующих двух десятилетий в автоматизированной машине обучения медицинского диагностического программного обеспечения. В 2014 году сообщалось , что алгоритм машинного обучения был применен в области истории искусства для изучения изобразительного искусства картины, и что это , возможно, выявленные ранее влияния между художниками.

Ограничения

Несмотря на то, машинное обучение было преобразующим в некоторых областях, программы машинного обучения часто не обеспечивают ожидаемый результат. Причины этого многочисленны: отсутствие (подходящие) данных, отсутствие доступа к данным, предвзятость данных, проблемы конфиденциальности, плохо подобранные задачи и алгоритмы, неправильные инструменты и людям, нехватка ресурсов, и проблемы оценки.

В 2018 году, само вождение автомобиля от Uber не удалось обнаружить пешехода, который был убит после столкновения. Попытки использовать машинное обучение в области здравоохранения с IBM Watson системы не в состоянии поставить даже после нескольких лет времени и миллиардов инвестиций.

предвзятость

Машинное обучение подходы , в частности , могут страдать от различных смещений данных. Система машинного обучения на подготовке текущих клиентов только не может быть в состоянии предсказать потребности новых групп клиентов, которые не представлены в обучающих данных. Когда обучение на искусственные данных, машинное обучение, скорее всего, подобрать те же конституционные и бессознательные предубеждения уже присутствует в обществе. Языковые модели , извлеченные из данных были показаны, содержат человеческие подобные перекосы. Системы машинного обучения , используемые для оценки уголовного риска были установлены, что предубеждение против чернокожих людей. В 2015 году Google фотографии часто маркировать черные люди , как гориллы, а в 2018 году это еще не был хорошо решен, но Google , как сообщается, до сих пор используют обходной путь , чтобы удалить все гориллу из обучающих данных, и , таким образом , был не в состоянии распознавать реальные горилл на все. Аналогичные проблемы с признанием небелых людей были обнаружены во многих других системах. В 2016 году Microsoft протестировали Chatbot , что узнал из твиттера, и он быстро поднял расистскую и сексистские язык. Из - за таких проблем, эффективное использование машинного обучения может занять больше времени , которые должны быть приняты в других областях. Забота о снижении смещения в машинном обучении и продвигая его использование для человеческого блага все чаще выражаются искусственными учеными разведки, в том числе Fei-Fei Li , который напоминает инженер , что «Там нет ничего искусственного интеллекта ... Это вдохновило людьми, он создан людьми , и, самое главное, она воздействует на людей. это мощный инструмент , который мы только начинаем понимать, и это глубокая ответственность «.

оценка модели

Модели классификации машинного обучения может быть проверена с помощью методов оценки точности как оттягивание метод, который разбивает данные в обучающем и тестовом наборе (условно 2/3 обучающего набора и 1/3 испытательного набора назначения) и оценивает производительность модели обучения на тест набор. Для сравнения, N-fold- перекрестной проверки методы случайным образом разбивают данные к подмножествам , где экземпляры к-1 из данных , используемые для обучения модели , когда экземпляр КТИ используются для проверки предсказательной способности обучающей модели. В дополнение к оттягивание и кросс-валидации методов, бутстрапе , какие образцы п экземпляры с заменой из набора данных, могут быть использованы для оценки точности модели.

В дополнение к общей точности, исследователи часто сообщают чувствительность и специфичность означает истинный положительный тариф (TPR) и истинный отрицательный Rate (TNR) соответственно. Кроме того , исследователи иногда сообщают о ложных срабатываний (FPR), а также ложноотрицательных (FNR). Тем не менее, эти показатели являются отношения , которые не раскрывают их числители и знаменатели. Общая эксплуатационная характеристика (ТОС) является эффективным методом , чтобы выразить диагностическую способность модели. ТОС показывает числитель и знаменатель из ранее упомянутых ставок, таким образом , ТОС предоставляет больше информации , чем обычно используемого приемник рабочей характеристики (ROC) и связанную с ней зона РПЦ под кривым (AUC).

Этика

Машинное обучение ставит множество этических вопросов . Системы , которые обучаются на наборах данных , собранных с помощью уклонов могут проявлять эти перекосы при использовании ( алгоритмическое смещение ), таким образом , оцифровка культурных предрассудков. Например, используя работу найма данных из фирмы с расистской политикой приема на работе может привести к системе машинного обучения , повторяющей уклон скоринга претендентов на работу против сходства с предыдущими успешными заявителями. Ответственный сбор данных и документации алгоритмических правил , используемых система , таким образом , является важной частью машинного обучения.

Поскольку язык содержит уклоны, машина подготовленной на языке корпусах обязательно также узнать смещение.

Другие формы этических проблем, не связанные с личными пристрастиями, более видели в здравоохранении. Есть опасения среди специалистов в области здравоохранения, что эти системы не могут быть разработаны в интересах общественности, а также приносящую доход машин. Это особенно верно в Соединенных Штатах, где есть вечная этическая дилемма улучшения медико-санитарной помощи, но и увеличение прибыли. Например, алгоритмы могут быть разработаны, чтобы предоставить пациентам ненужные тесты или лекарства, в которых патентованные владельцы алгоритма держат пакеты акций. Существует огромный потенциал для машинного обучения в области здравоохранения, чтобы обеспечить профессионалам отличный инструмент для диагностики, самолечением, и даже план пути восстановления для пациентов, но это не будет происходить до тех пор, личные пристрастия, упомянутых выше, и эти «жадность» смещает адресованы.

Программного обеспечения

Программное обеспечение люксы , содержащие различные алгоритмы машинного обучения включают в себя следующее:

Свободное программное обеспечение с открытым исходным кодом

Фирменное программное обеспечение с бесплатным и открытым исходным кодом изданиями

Проприетарное программное обеспечение

Журналы

Конференции

Смотрите также

Рекомендации

дальнейшее чтение


Искусственный интеллект: современный подход (третье издание)

внешняя ссылка