Вычислительный юмор - Computational humor

Вычислительный юмор - это раздел компьютерной лингвистики и искусственного интеллекта, который использует компьютеры в исследованиях юмора . Это относительно новая территория, первая специализированная конференция была организована в 1996 году.

Первая «компьютерная модель чувства юмора» была предложена Сусловым еще в 1992 году. Исследование общей схемы обработки информации показывает возможность конкретной неисправности, обусловленной необходимостью быстрого удаления из сознания ложной версии. . Эта специфическая неисправность может быть идентифицирована с юмористическим эффектом по психологическим причинам: она точно соответствует теории разрешения несовместимости. Однако к хорошо известной роли двусмысленности добавляется принципиально новый компонент - время.

В биологических системах чувство юмора неизбежно развивается в процессе эволюции, поскольку его биологическая функция состоит в ускорении передачи обработанной информации в сознание и в более эффективном использовании ресурсов мозга. Реализация этого алгоритма в нейронных сетях естественным образом оправдывает гипотезу Спенсера о механизме смеха: удаление ложной версии соответствует обнулению некоторой части нейронной сети, а избыточная энергия нейронов выбрасывается в моторную кору, вызывая мышечные сокращения.

Для практической реализации этого алгоритма необходимы обширные базы данных, создание которых в автоматическом режиме было предложено недавно. В результате это магистральное направление не получило должного развития, и последующие исследования приняли несколько специализированную окраску.

Генераторы шуток

Поколение пун

Подход к анализу юмора - это классификация анекдотов. Следующим шагом является попытка генерировать анекдоты на основе правил, лежащих в основе классификации.

О простых прототипах компьютерной генерации слов было сообщено в начале 1990-х годов, основанных на программе генератора естественного языка , VINCI . Грэм Ричи и Ким Бинстед в своей исследовательской работе 1994 года описали компьютерную программу JAPE, предназначенную для создания каламбуров типа вопрос-ответ на основе общей, т. Е. Не юмористической, лексики. (Название программы является аббревиатурой от "Joke Analysis and Production Engine".) Некоторые примеры, выпущенные JAPE:

В: В чем разница между листьями и автомобилем?
A: Один вы чистите щеткой и грабите, другой торопитесь и тормозите.
В: Что вы называете странным рынком?
A: Причудливый базар.

С тех пор подход был улучшен, и последний отчет, датированный 2007 годом, описывает генератор шуток STANDUP, реализованный на языке программирования Java . Генератор STANDUP был протестирован на детях в рамках анализа его применимости для развития языковых навыков у детей с коммуникативными нарушениями, например, из-за церебрального паралича . (Название проекта является аббревиатурой от «Система для усиления диалога не говорящих с использованием каламбуров» и намеком на стендап-комедию .) Дети с энтузиазмом отреагировали на эту «языковую площадку» и показали заметные улучшения в некоторых типах языковых тестов.

Двое молодых людей, которые использовали систему в течение десяти недель, потчевали своих сверстников, сотрудников, семью и соседей шутками, такими как: «Что вы называете острой ракетой? Их радость и энтузиазм по поводу развлечения других вдохновляли.

Другой

Сток и Страппарава описали программу для генерации забавных сокращений .

«AskTheBrain» (2002) [1] использовал кластеризацию и байесовский анализ, чтобы связать концепции комическим образом.

Распознавание анекдота

Киддон и Брун (2011) разработали алгоритм статистического машинного обучения для определения того, содержит ли предложение двусмысленное выражение « Это то, что она сказала » . Существует реализация системы TWSS Киддона и Бруна на Python с открытым исходным кодом.

Тейлор и Мазлак сообщили о программе распознавания шуток . Подобные исследования важны при анализе взаимодействия человека с компьютером.

Применение методов машинного обучения для отличия текстов-шуток от не-шуток было описано Михалча и Страппарава (2006).

Takizawa et al. (1996) сообщили об эвристической программе для обнаружения каламбуров в японском языке .

В 2020 году был представлен новый набор контрольных данных и современная модель классификации, основанная на использовании трансферного обучения и встраивания предложений BERT . В статье достигнута 98% точность определения юмора.

Приложения

Возможное приложение для помощи в овладении языком описано в разделе «Генерация Pun». Еще одно предполагаемое использование генераторов шуток - в случаях постоянного предложения шуток, когда количество важнее качества. Еще одно очевидное, но отдаленное направление - автоматическое распознавание шуток.

Известно, что люди взаимодействуют с компьютерами аналогично взаимодействию с другими людьми, которое можно описать с точки зрения личности, вежливости, лести и группового фаворитизма. Таким образом, роль юмора во взаимодействии человека с компьютером изучается. В частности, было предложено создание юмора в пользовательском интерфейсе для облегчения взаимодействия с компьютерами.

Крейг МакДонаф реализовал генератор мнемонических предложений, который преобразует пароли в юмористические предложения. Основываясь на теории несоответствия юмора , предполагается, что полученные бессмысленные, но забавные предложения легче запомнить. Например, пароль AjQA3Jtv преобразуется в «Арафат присоединился к муравью Куэйла, а TARAR поставил под угрозу вазу Турмонда».

Связанные исследования

Джон Аллен Паулос известен своим интересом к математическим основам юмора. Его книга « Математика и юмор: исследование логики юмора» демонстрирует структуры, общие для юмора и формальных наук (математики, лингвистики), и развивает математическую модель шуток, основанную на теории катастроф .

Разговорные системы, которые были разработаны для участия в соревнованиях по тесту Тьюринга, обычно имеют возможность изучать юмористические анекдоты и анекдоты. Поскольку многие люди считают юмор чем-то особенным для людей, его появление в разговоре может быть весьма полезным для убеждения человека, проводящего допрос, в том, что скрытая сущность, которой может быть машина или человек, на самом деле является человеком.

Смотрите также

дальнейшее чтение

использованная литература