Трансферное обучение - Transfer learning

Трансферное обучение (TL) - это исследовательская проблема в машинном обучении (ML), которая фокусируется на хранении знаний, полученных при решении одной проблемы, и применении их к другой, но связанной проблеме. Например, знания, полученные при обучении распознаванию автомобилей, могут применяться при попытке распознать грузовики. Эта область исследований имеет некоторое отношение к долгой истории психологической литературы по передаче обучения , хотя практические связи между этими двумя областями ограничены. С практической точки зрения повторное использование или перенос информации из ранее изученных задач для обучения новым задачам может значительно повысить эффективность выборки агента обучения с подкреплением .

История

В 1976 году Стево Бозиновски и Анте Фулгози опубликовали статью, в которой явно рассматривались вопросы трансферного обучения при обучении нейронных сетей. В статье представлена ​​математическая и геометрическая модель трансфертного обучения. В 1981 году был представлен отчет о применении трансферного обучения в обучении нейронной сети на наборе данных изображений, представляющих буквы компьютерных терминалов. Экспериментально продемонстрировано как положительное, так и отрицательное трансферное обучение.

В 1993 году Лориен Пратт опубликовал статью о переносе в машинном обучении , в которой сформулировал алгоритм передачи, основанный на различимости (DBT).

В 1997 году Пратт и Себастьян Трун отредактировали специальный выпуск Machine Learning, посвященный трансферному обучению, и к 1998 году эта область расширилась, включив многозадачное обучение вместе с более формальным анализом его теоретических основ. «Обучение учиться» под редакцией Труна и Пратта представляет собой обзор этого предмета за 1998 год.

Трансферное обучение также применялось в когнитивной науке , при этом Пратт также был гостем, редактировавшим выпуск журнала Connection Science о повторном использовании нейронных сетей посредством переноса в 1996 году.

Эндрю Нг сказал в своем учебнике NIPS 2016, что TL станет следующим фактором коммерческого успеха ML после контролируемого обучения, чтобы подчеркнуть важность TL.

Определение

Определение трансферного обучения дается с точки зрения доменов и задач. Домен состоит из: пространства признаков и предельного распределения вероятностей , где . Для конкретной области, задача состоит из двух компонентов: пространства меток и целевой функции прогнозирования . Функция используется для прогнозирования соответствующей метки нового экземпляра . Эта задача, обозначенная как , изучается на основе обучающих данных, состоящих из пар , где и .

Учитывая исходную область и задачу обучения , целевую область и задачу обучения , где или , переносное обучение направлено на то, чтобы помочь улучшить обучение целевой прогностической функции при использовании знаний в и .

Приложения

Доступны алгоритмы для трансферного обучения в логических сетях Маркова и байесовских сетях . Трансферное обучение также применялось к обнаружению подтипов рака, использованию зданий , общей игре , классификации текста , распознаванию цифр, медицинской визуализации и фильтрации спама .

В 2020 году было обнаружено, что из-за их схожей физической природы передача обучения возможна между электромиографическими (ЭМГ) сигналами от мышц при классификации поведения электроэнцефалографических (ЭЭГ) мозговых волн из области распознавания жестов в область распознавания психического состояния. Также было отмечено, что эта взаимосвязь работает наоборот, показывая, что ЭЭГ также может быть использована для классификации ЭМГ дополнительно. Эксперименты отметили, что точность нейронных сетей и сверточных нейронных сетей была улучшена за счет передачи обучения как в первую эпоху (до любого обучения, т. Е. По сравнению со стандартным случайным распределением весов), так и в асимптоте (конец процесса обучения). . То есть алгоритмы улучшаются за счет воздействия на другой домен. Более того, конечный пользователь предварительно обученной модели может изменить структуру полностью связанных слоев для достижения превосходной производительности.

Смотрите также

использованная литература

Источники