Вычислительный юмор - Computational humor
Вычислительный юмор - это раздел компьютерной лингвистики и искусственного интеллекта, который использует компьютеры в исследованиях юмора . Это относительно новая территория, первая специализированная конференция была организована в 1996 году.
Первая «компьютерная модель чувства юмора» была предложена Сусловым еще в 1992 году. Исследование общей схемы обработки информации показывает возможность конкретной неисправности, обусловленной необходимостью быстрого удаления из сознания ложной версии. . Эта специфическая неисправность может быть идентифицирована с юмористическим эффектом по психологическим причинам: она точно соответствует теории разрешения несовместимости. Однако к хорошо известной роли двусмысленности добавляется принципиально новый компонент - время.
В биологических системах чувство юмора неизбежно развивается в процессе эволюции, поскольку его биологическая функция состоит в ускорении передачи обработанной информации в сознание и в более эффективном использовании ресурсов мозга. Реализация этого алгоритма в нейронных сетях естественным образом оправдывает гипотезу Спенсера о механизме смеха: удаление ложной версии соответствует обнулению некоторой части нейронной сети, а избыточная энергия нейронов выбрасывается в моторную кору, вызывая мышечные сокращения.
Для практической реализации этого алгоритма необходимы обширные базы данных, создание которых в автоматическом режиме было предложено недавно. В результате это магистральное направление не получило должного развития, и последующие исследования приняли несколько специализированную окраску.
Генераторы шуток
Поколение пун
Подход к анализу юмора - это классификация анекдотов. Следующим шагом является попытка генерировать анекдоты на основе правил, лежащих в основе классификации.
О простых прототипах компьютерной генерации слов было сообщено в начале 1990-х годов, основанных на программе генератора естественного языка , VINCI . Грэм Ричи и Ким Бинстед в своей исследовательской работе 1994 года описали компьютерную программу JAPE, предназначенную для создания каламбуров типа вопрос-ответ на основе общей, т. Е. Не юмористической, лексики. (Название программы является аббревиатурой от "Joke Analysis and Production Engine".) Некоторые примеры, выпущенные JAPE:
- В: В чем разница между листьями и автомобилем?
- A: Один вы чистите щеткой и грабите, другой торопитесь и тормозите.
- В: Что вы называете странным рынком?
- A: Причудливый базар.
С тех пор подход был улучшен, и последний отчет, датированный 2007 годом, описывает генератор шуток STANDUP, реализованный на языке программирования Java . Генератор STANDUP был протестирован на детях в рамках анализа его применимости для развития языковых навыков у детей с коммуникативными нарушениями, например, из-за церебрального паралича . (Название проекта является аббревиатурой от «Система для усиления диалога не говорящих с использованием каламбуров» и намеком на стендап-комедию .) Дети с энтузиазмом отреагировали на эту «языковую площадку» и показали заметные улучшения в некоторых типах языковых тестов.
Двое молодых людей, которые использовали систему в течение десяти недель, потчевали своих сверстников, сотрудников, семью и соседей шутками, такими как: «Что вы называете острой ракетой? Их радость и энтузиазм по поводу развлечения других вдохновляли.
Другой
Сток и Страппарава описали программу для генерации забавных сокращений .
«AskTheBrain» (2002) [1] использовал кластеризацию и байесовский анализ, чтобы связать концепции комическим образом.
Распознавание анекдота
Киддон и Брун (2011) разработали алгоритм статистического машинного обучения для определения того, содержит ли предложение двусмысленное выражение « Это то, что она сказала » . Существует реализация системы TWSS Киддона и Бруна на Python с открытым исходным кодом.
Тейлор и Мазлак сообщили о программе распознавания шуток . Подобные исследования важны при анализе взаимодействия человека с компьютером.
Применение методов машинного обучения для отличия текстов-шуток от не-шуток было описано Михалча и Страппарава (2006).
Takizawa et al. (1996) сообщили об эвристической программе для обнаружения каламбуров в японском языке .
В 2020 году был представлен новый набор контрольных данных и современная модель классификации, основанная на использовании трансферного обучения и встраивания предложений BERT . В статье достигнута 98% точность определения юмора.
Приложения
Возможное приложение для помощи в овладении языком описано в разделе «Генерация Pun». Еще одно предполагаемое использование генераторов шуток - в случаях постоянного предложения шуток, когда количество важнее качества. Еще одно очевидное, но отдаленное направление - автоматическое распознавание шуток.
Известно, что люди взаимодействуют с компьютерами аналогично взаимодействию с другими людьми, которое можно описать с точки зрения личности, вежливости, лести и группового фаворитизма. Таким образом, роль юмора во взаимодействии человека с компьютером изучается. В частности, было предложено создание юмора в пользовательском интерфейсе для облегчения взаимодействия с компьютерами.
Крейг МакДонаф реализовал генератор мнемонических предложений, который преобразует пароли в юмористические предложения. Основываясь на теории несоответствия юмора , предполагается, что полученные бессмысленные, но забавные предложения легче запомнить. Например, пароль AjQA3Jtv преобразуется в «Арафат присоединился к муравью Куэйла, а TARAR поставил под угрозу вазу Турмонда».
Связанные исследования
Джон Аллен Паулос известен своим интересом к математическим основам юмора. Его книга « Математика и юмор: исследование логики юмора» демонстрирует структуры, общие для юмора и формальных наук (математики, лингвистики), и развивает математическую модель шуток, основанную на теории катастроф .
Разговорные системы, которые были разработаны для участия в соревнованиях по тесту Тьюринга, обычно имеют возможность изучать юмористические анекдоты и анекдоты. Поскольку многие люди считают юмор чем-то особенным для людей, его появление в разговоре может быть весьма полезным для убеждения человека, проводящего допрос, в том, что скрытая сущность, которой может быть машина или человек, на самом деле является человеком.
Смотрите также
дальнейшее чтение
- « Вычислительный юмор » Бинстеда К .; Nijholt, A .; Шток, O .; Strapparava, C .; Ritchie, G .; Manurung, R .; Боль, H .; Уоллер, А .; Оапос; Мара, Д., Интеллектуальные системы IEEE, том 21, выпуск 2, 2006 г., стр. 59-69 doi : 10.1109 / MIS.2006.22
- О. Сток, С. Страппарава и А. Нейхольт (ред.) « Первоапрельский семинар по вычислительному юмору». Proc. Twente Workshop on Language Technology 20 (TWLT20), ISSN 0929-0672, ITC-IRST, Тренто, Италия, апрель 2002 г., 146 стр.