Кисмет (робот) - Kismet (robot)

Кисмет сейчас находится в Музее Массачусетского технологического института в Кембридже, Массачусетс , США.

Кисмет - это голова робота, созданная в 1990-х годах в Массачусетском технологическом институте доктором Синтией Бризил в качестве эксперимента по аффективным вычислениям ; машина, которая может распознавать и моделировать эмоции . Название Кисмет происходит от турецкого слова, означающего «судьба» или иногда «удача».

Проектирование и строительство оборудования

Чтобы Kismet мог правильно взаимодействовать с людьми, он содержит устройства ввода, которые придают ему слуховые , визуальные и проприоцепционные способности. Кисмет имитирует эмоции с помощью различных выражений лица, вокализации и движений. Выражение лица создается за счет движений ушей, бровей, век, губ, челюсти и головы. Стоимость физических материалов оценивалась в 25 000 долларов США.

В дополнение к упомянутому выше оборудованию есть четыре Motorola 68332 , девять ПК 400 МГц и еще один ПК 500 МГц.

Программная система

Программная система социального интеллекта Kismet, или синтетическая нервная система (SNS), была разработана с учетом человеческих моделей разумного поведения. Он содержит шесть следующих подсистем.

Система извлечения функций низкого уровня

Эта система обрабатывает необработанную визуальную и слуховую информацию с камер и микрофонов. Система технического зрения Kismet может выполнять обнаружение глаз, обнаружение движения и, хотя и неоднозначно, обнаружение цвета кожи. Всякий раз, когда Kismet двигает головой, он на мгновение отключает свою систему обнаружения движения, чтобы избежать обнаружения собственного движения. Он также использует свои стереокамеры для оценки расстояния до объекта в поле зрения, например, для обнаружения угроз - больших, близких объектов с большим движением.

Аудиосистема Kismet в основном настроена на выявление аффектов в детской речи . В частности, он может обнаруживать пять различных типов аффективной речи: одобрение, запрет, внимание, комфорт и нейтральный. Классификатор аффективных намерений был создан следующим образом. Низкоуровневые характеристики, такие как средняя высота тона и дисперсия энергии (громкости), были извлечены из образцов записанной речи. Затем классы аффективных намерений были смоделированы как модель смеси Гаусса и обучены на этих выборках с использованием алгоритма максимизации ожидания . Классификация выполняется в несколько этапов: сначала высказывание классифицируется на одну из двух общих групп (например, успокаивающее / нейтральное против запрета / внимания / одобрения), а затем проводится более подробная классификация. Эта архитектура значительно улучшила производительность для трудно различимых классов, таких как одобрение («Ты умный робот») по сравнению с вниманием («Эй, Кисмет, сюда»).

Система мотивации

Доктор Бризил считает ее отношения с роботом «чем-то вроде взаимодействия между младенцем и опекуном, где я, по сути, сторож, а робот - как младенец». Обзор устанавливает отношения человека и робота в рамках обучения, а доктор Бризил обеспечивает основу для разработки Kismet. Он предлагает демонстрацию возможностей Kismet, представленных в виде эмоциональных выражений лица, которые передают «мотивационное состояние» робота. Доктор Бразил: «Это гнев (смех), крайний гнев, отвращение, волнение, страх, это счастье, это интерес, это печаль, удивление, это усталость, а это сон ».

В любой момент Кисмет может находиться только в одном эмоциональном состоянии. Однако Бризил заявляет, что Кисмет не в сознании, поэтому у него нет чувств.

Двигательная система

Кисмет говорит на протоязыке с множеством фонем, похожих на лепет ребенка. Он использует синтезатор голоса DECtalk и изменяет высоту тона, синхронизацию, артикуляцию и т. Д. Для выражения различных эмоций. Интонация используется для изменения вопросов и высказываний, похожих на утверждения. Синхронизация губ была важна для реалистичности, и разработчики использовали стратегию анимации: «простота - секрет успешной анимации губ». Таким образом, они не пытались идеально имитировать движения губ, а вместо этого «создавали визуальную короткую руку, которая не вызывает возражений у зрителя».

Смотрите также

использованная литература

внешние ссылки