Бесконечное изучение языка - Never-Ending Language Learning

Never-Ending Language Learning System ( NELL ) - это семантическая система машинного обучения , разработанная исследовательской группой в Университете Карнеги-Меллона и поддерживаемая грантами DARPA , Google , NSF и CNPq с частями системы, работающими на суперкомпьютерном кластере, предоставляемом Yahoo! .

Процесс и цели

NELL была запрограммирована ее разработчиками так, чтобы иметь возможность идентифицировать базовый набор фундаментальных семантических отношений между несколькими сотнями предопределенных категорий данных, таких как города, компании, эмоции и спортивные команды. С начала 2010 года исследовательская группа Карнеги-Меллона работает с NELL круглосуточно, просматривая сотни миллионов веб-страниц в поисках связей между информацией, которую она уже знает, и тем, что она находит в процессе поиска, - чтобы установить новые связи в способ, который предназначен для имитации того, как люди изучают новую информацию. Например, встретив пару слов «Пайкс-Пик», NELL заметит, что оба слова написаны с заглавной буквы, и выведет из второго слова, что это было название горы, а затем построит связь слов, окружающих эти два слова, чтобы сделать вывод другие соединения.

Цель Нелл и других систем семантического обучения, такие как IBM «s Watson системы, чтобы иметь возможность разрабатывать средства , отвечая на вопросы , поставленные пользователями на естественном языке, без вмешательства человека в этом процессе. Орен Этциони из Вашингтонского университета похвалил систему «непрерывное обучение, как если бы NELL проявляла любопытство самостоятельно, без особой помощи человека».

К октябрю 2010 года NELL удвоила количество связей, доступных в своей базе знаний, и узнала 440 000 новых фактов с точностью 87%. Руководитель группы Том М. Митчелл , председатель отдела машинного обучения в Карнеги-Меллон, описал, как NELL «самокорректируется, когда у него больше информации, по мере того, как он узнает больше», хотя иногда он приходит к неверным выводам. Накопленные ошибки, такие как вывод о том, что Интернет-файлы cookie являются своего рода выпечкой, привели NELL к выводу из фраз «Я удалил свои Интернет-файлы cookie» и «Я удалил свои файлы», что « компьютерные файлы » также относятся к категории выпечки. . Подобные явные ошибки исправляются каждые несколько недель членами исследовательской группы, и системе разрешается продолжить процесс обучения.

По состоянию на январь 2020 года последние собранные факты о проекте датируются февралем 2019 года.

Комментарии

В своей книге « Совместимость с людьми » в 2019 году Стюарт Рассел прокомментировал: «К сожалению, NELL доверяет только 3 процентам своих убеждений и полагается на экспертов-людей для регулярного устранения ложных или бессмысленных убеждений, таких как убеждения, что« Непал - это мир ». страна, также известная как Соединенные Штаты », а« ценность - это сельскохозяйственный продукт, который обычно разбивается на основу ».

Смотрите также

Рекомендации

внешние ссылки