Прямой голосовой ввод - Direct voice input

Прямой голосовой ввод ( DVI ) (иногда называемый управлением голосовым вводом ( VIC )) - это стиль человеко-машинного взаимодействия «HMI», при котором пользователь выполняет голосовые команды для выдачи инструкций машине .

DVI был использован в кабинах нескольких современных военных самолетов, таких как Eurofighter Typhoon , Lockheed Martin F-35 Lightning II , Dassault Rafale и Saab JAS 39 Gripen . Такие системы также использовались для различных других целей, включая промышленные системы управления и помощь в распознавании речи для людей с ограниченными возможностями.

Обзор

Системы DVI можно разделить на две основные категории функциональных возможностей: «зависимые от пользователя» и «независимые от пользователя». Система, зависящая от пользователя, требует создания персонального голосового шаблона для конкретного человека; шаблон для этого человека должен быть загружен на назначенный ему компьютер до использования системы DVI, чтобы он функционировал должным образом. Напротив, независимая от пользователя система не требует какого-либо личного голосового шаблона, поскольку предназначена для правильного ответа на голос любого пользователя. Их также можно разделить на «дискретное распознавание» и «непрерывное распознавание». Пользователи дискретной системы распознавания должны делать паузы между каждым словом, чтобы система DVI могла идентифицировать разделение между каждым словом, в то время как система распознавания непрерывной речи способна понимать нормальную скорость речи.

В середине 2000-х исследователи из Национальной аэрокосмической лаборатории в Нидерландах изучали использование DVI в симуляторе GRACE; Всего в последующем эксперименте приняли участие двенадцать пилотов. По имеющимся сведениям, проведенные тесты показали, что, хотя само оборудование функционировало хорошо, желательно несколько улучшений до реального развертывания на самолетах, поскольку операции DVI фактически занимали больше времени по сравнению с традиционными существующими методами. Рекомендации по улучшению включали принятие более простого синтаксиса , достижение большей скорости распознавания и уменьшение времени ответа; все возникшие проблемы были определены как технические и их можно было решить. Исследователи пришли к выводу, что в кабинах пилотов, особенно во время аварийных ситуаций, когда пилотам приходится действовать самостоятельно, система DVI может быть очень актуальной, но не имеет решающего значения во время большинства других возможных сценариев.

Примерно в то же время в рамках проекта SafeSound, координируемого Европейским Союзом , проводились оценки систем DVI для целей гражданской авиации . Он включал в себя наблюдение за рабочими нагрузками пилотов в реальных кабинах и сопоставление их с деятельностью пилота в имитаторах полета с использованием как обычных систем, так и помощи DVI. Проект был направлен на повышение безопасности полетов и снижение нагрузки как при наземных, так и при полетах за счет применения расширенных звуковых функций.

Приложения

Авиация

Перед его повсеместным развертыванием несколько обычных военных самолетов были преобразованы в испытательные системы DVI; Примеры включают Harrier AV-8B и F-16 VISTA . В другом случае симулятор F-16 Fighting Falcon компании General Dynamics был модифицирован с помощью DVI для исследования голосового управления, которое проводилось Королевскими ВВС Нидерландов . Испытания DVI также проводились на вертолетах , в том числе на Boeing AH-64 Apache , демонстрируя потенциал для повышения безопасности полетов и эффективности полетов.

Многочисленные современные истребители были оснащены системами DVI, часто в сочетании с различными другими схемами интерфейса человек-машина, такими как совместимые с HOTAS средства управления и другие передовые технологии управления. Комбинация схем управления Voice и HOTAS иногда упоминается как концепция "V-TAS". Известный истребитель, который будет оснащаться кабиной V-TAS, - это Eurofighter Typhoon . Lockheed Martin F-35 Lightning II также оснащен системой DVI, которая была разработана Adacel . Другие примеры включают Dassault Rafale и Saab JAS 39 Gripen .

Планировалось, что многие самолеты будут использовать DVI. На каком-то этапе ВВС США пытались интегрировать DVI в Lockheed Martin F-22 Raptor ; однако в конечном итоге было сочтено, что технология представляла слишком много технических рисков на тот момент, и поэтому от таких усилий пришлось отказаться.

Личное

К 1990 г. были продемонстрированы работающие прототипы цифровых систем распознавания слов; они продвигались с целью обеспечения эффективного человеко-машинного интерфейса для людей с ораторами с нарушениями речи. Применяемые методы включали в себя цифровую речь с временным кодированием и автоматический выбор набора токенов. Сообщается, что исследования этих ранних систем DVI включали использование автоматических диагностических процедур и ограниченные испытания с участием добровольцев.

В течение 2010-х годов различные компании предлагали широкой публике системы распознавания голоса. Одним из примеров является служба Google Voice , которая позволяет пользователям задавать вопросы с помощью пакета DVI, установленного на персональном компьютере , планшете или мобильном телефоне . Было разработано множество цифровых помощников , таких как Amazon Echo , Siri и Cortana , которые используют DVI для взаимодействия с пользователями.

Коммерческий

Технология DVI позволила широко развернуть автоматизированные телефонные системы. Многие компании обычно используют централизованные телефонные системы, которые направляют звонящих в нужный отдел с помощью таких методов. Различные производители автомобилей также оснастили свои дорожные транспортные средства системами DVI; они обычно позволяют водителям управлять информационно-развлекательными системами и взаимодействовать с мобильными телефонами с большим удобством, чем унаследованные методы.

В конце 1980-х годов проводились исследования использования систем DVI для управления станками с ЧПУ и другим производственным оборудованием. В течение 2010-х годов такие системы использовались для целей логистики и управления складами.

Рекомендации

  1. Перейти ↑ Jarrett, DN (2005), Cockpit Engineering. Олдершот, Ashgate Publishing Limited ISBN   978-0-7546-1751-8 .
  2. ^ a b c d e "Распознавание голоса" . computerhope.com. 16 мая 2020.
  3. ^ Зон, ГДР и Roerdink, М., (2007), с помощью голоса для контроля гражданской Flightdeck , отчет NLR-TP-2006-720, (Этот отчет основан на презентации прошедшей в HCI Aero, Сиэтл, США, 20- 22 сентября 2006 г.). [1] Архивировано 4 марта 2016 года в Wayback Machine.
  4. ^ «Практикум по будущим проектам станций управления и вопросам деятельности человека на атомных электростанциях» . Международное агентство по атомной энергии (МАГАТЭ). 8–10 мая 2006 г. С. 296–320.
  5. ^ a b Гиббон ​​Д., Мертинс И. и Мур Р.К. (2000) «Справочник по ресурсам, терминологии и оценке продуктов для мультимодальных и речевых диалоговых систем» (Международная серия Springer по инженерным наукам и информатике, том 565), Массачусетс, Kluwer Academic Publishers ISBN   978-0-7923-7904-1
  6. ^ Хантер, Дональд Джеймс (декабрь 2003 г.). «Определение задач летного экипажа для использования прямого голосового ввода (DVI) для снижения рабочей нагрузки пилота в AH-64D Apache Longbow» . trace.tennessee.edu.
  7. ^ Herdman, Крис., Johannsdottir, Камилла., Lessard, Линды., Jarmasz, Ежи. Черчилль, Лаура и Фаррелл, Филипп (январь 2001). «Значительные преимущества и затраты, связанные с интеграцией системы прямого голосового ввода (DVI) в среду вертолета с несколькими экипажами» . CS1 maint: использует параметр авторов ( ссылка )
  8. ^ Оуэн, Пол С. "Кабина Eurofighter". Eurofighter-typhoon.co.uk 7 декабря 1997 г. Дата обращения: 28 ноября 2009 г. Архивировано 28 августа 2008 г. на Wayback Machine
  9. ^ Schutte, Джон (10 октября 2007). «Исследователи отлаживают речевую систему пилота F-35» . af.mil . ВВС США. Архивировано из оригинального 23 апреля 2016 года.
  10. ^ Goebel, Грег. «Локхид Мартин F-22 Raptor». airvectors.net, 1 июля 2011 г. Дата обращения : 10 ноября 2012 г.
  11. ^ a b А. Г. Уорнер, Р. Д. Хьюз и Р. А. Кинг (1990). «Стратегия прямого голосового ввода человеко-машинного интерфейса для обеспечения голосового доступа для говорящих с серьезными нарушениями» . Конференция UK IT 1990. С. 279–285. CS1 maint: использует параметр авторов ( ссылка )
  12. ^ JY Чжу и CG Сюй (7 января 1988). «Исследование системы голосового ввода для станков с ЧПУ» . Нанкинский авиационный институт. CS1 maint: использует параметр авторов ( ссылка )
  13. ^ "Голосовые приложения" . lucasware.com . Дата обращения 9 августа 2020 .

внешние ссылки