Трансферное обучение - Transfer learning
Трансферное обучение (TL) - это исследовательская проблема в машинном обучении (ML), которая фокусируется на хранении знаний, полученных при решении одной проблемы, и применении их к другой, но связанной проблеме. Например, знания, полученные при обучении распознаванию автомобилей, могут применяться при попытке распознать грузовики. Эта область исследований имеет некоторое отношение к долгой истории психологической литературы по передаче обучения , хотя практические связи между этими двумя областями ограничены. С практической точки зрения повторное использование или перенос информации из ранее изученных задач для обучения новым задачам может значительно повысить эффективность выборки агента обучения с подкреплением .
История
В 1976 году Стево Бозиновски и Анте Фулгози опубликовали статью, в которой явно рассматривались вопросы трансферного обучения при обучении нейронных сетей. В статье представлена математическая и геометрическая модель трансфертного обучения. В 1981 году был представлен отчет о применении трансферного обучения в обучении нейронной сети на наборе данных изображений, представляющих буквы компьютерных терминалов. Экспериментально продемонстрировано как положительное, так и отрицательное трансферное обучение.
В 1993 году Лориен Пратт опубликовал статью о переносе в машинном обучении , в которой сформулировал алгоритм передачи, основанный на различимости (DBT).
В 1997 году Пратт и Себастьян Трун отредактировали специальный выпуск Machine Learning, посвященный трансферному обучению, и к 1998 году эта область расширилась, включив многозадачное обучение вместе с более формальным анализом его теоретических основ. «Обучение учиться» под редакцией Труна и Пратта представляет собой обзор этого предмета за 1998 год.
Трансферное обучение также применялось в когнитивной науке , при этом Пратт также был гостем, редактировавшим выпуск журнала Connection Science о повторном использовании нейронных сетей посредством переноса в 1996 году.
Эндрю Нг сказал в своем учебнике NIPS 2016, что TL станет следующим фактором коммерческого успеха ML после контролируемого обучения, чтобы подчеркнуть важность TL.
Определение
Определение трансферного обучения дается с точки зрения доменов и задач. Домен состоит из: пространства признаков и предельного распределения вероятностей , где . Для конкретной области, задача состоит из двух компонентов: пространства меток и целевой функции прогнозирования . Функция используется для прогнозирования соответствующей метки нового экземпляра . Эта задача, обозначенная как , изучается на основе обучающих данных, состоящих из пар , где и .
Учитывая исходную область и задачу обучения , целевую область и задачу обучения , где или , переносное обучение направлено на то, чтобы помочь улучшить обучение целевой прогностической функции при использовании знаний в и .
Приложения
Доступны алгоритмы для трансферного обучения в логических сетях Маркова и байесовских сетях . Трансферное обучение также применялось к обнаружению подтипов рака, использованию зданий , общей игре , классификации текста , распознаванию цифр, медицинской визуализации и фильтрации спама .
В 2020 году было обнаружено, что из-за их схожей физической природы передача обучения возможна между электромиографическими (ЭМГ) сигналами от мышц при классификации поведения электроэнцефалографических (ЭЭГ) мозговых волн из области распознавания жестов в область распознавания психического состояния. Также было отмечено, что эта взаимосвязь работает наоборот, показывая, что ЭЭГ также может быть использована для классификации ЭМГ дополнительно. Эксперименты отметили, что точность нейронных сетей и сверточных нейронных сетей была улучшена за счет передачи обучения как в первую эпоху (до любого обучения, т. Е. По сравнению со стандартным случайным распределением весов), так и в асимптоте (конец процесса обучения). . То есть алгоритмы улучшаются за счет воздействия на другой домен. Более того, конечный пользователь предварительно обученной модели может изменить структуру полностью связанных слоев для достижения превосходной производительности.
Смотрите также
- Кроссовер (генетический алгоритм)
- Адаптация домена
- Общая игра
- Многозадачное обучение
- Оптимизация многозадачности
использованная литература
Источники
- Трун, Себастьян; Пратт, Лориен (6 декабря 2012 г.). Учимся учиться . Springer Science & Business Media. ISBN 978-1-4615-5529-2.