Читатель экрана - Screen reader

Пример использования программы чтения с экрана, показывающей недоступные, читаемые и доступные документы.

Программа чтения с экрана - это разновидность вспомогательной технологии ( AT ), которая отображает текст и изображение в виде речи или шрифта Брайля. Программы чтения с экрана важны для слепых и полезны для людей с ослабленным зрением , неграмотных или людей с ограниченными способностями к обучению . Программы чтения с экрана - это программные приложения, которые пытаются передать пользователям то, что люди с нормальным зрением видят на дисплее, с помощью невизуальных средств, таких как преобразование текста в речь , звуковые значки или устройство Брайля . Они делают это, применяя широкий спектр методов, включая, например, взаимодействие с выделенными API-интерфейсами доступности , использование различных функций операционной системы (таких как межпроцессное взаимодействие и запрос свойств пользовательского интерфейса ) и использование методов подключения .

Microsoft Windows , операционные системы включили Microsoft рассказчик чтения с экрана начиная с Windows 2000 , хотя отдельные продукты , такие как Freedom Scientific «S коммерчески доступный JAWS для чтения с экрана и ZoomText экранная лупа и свободным и открытым исходным кодом для чтения с экрана NVDA Н.В. Access являются более популярными для этого операционная система. Apple , Inc. «s MacOS , IOS и tvOS включают VoiceOver как встроенный считыватель экрана, в то время как Google » s Android предоставляет читателю экрана Talkback и его Chrome OS можно использовать ChromeVox. Точно так же устройства на базе Android от Amazon предоставляют программу чтения с экрана VoiceView. Существуют также бесплатные программы чтения с экрана с открытым исходным кодом для Linux и Unix-подобных систем, таких как Speakup и Orca .

Типы

Командная строка (текст)

В ранних операционных системах , таких как MS-DOS , в которых использовались интерфейсы командной строки ( CLI ), отображение на экране состояло из символов, отображаемых непосредственно в экранный буфер в памяти и позиции курсора . Ввод осуществлялся с клавиатуры. Таким образом, вся эта информация может быть получена из системы либо путем перехвата потока информации вокруг системы и чтения экранного буфера, либо с помощью стандартного аппаратного выходного разъема и передачи результатов пользователю.

В 1980-х Исследовательский центр образования для лиц с ограниченными возможностями по зрению ( RCEVH ) при Университете Бирмингема разработал программу чтения с экрана для BBC Micro и NEC Portable.

Графический

Внеэкранные модели

С появлением графических пользовательских интерфейсов ( GUI ) ситуация усложнилась. GUI имеет символы и графики , нарисованные на экране в определенных позициях, и , следовательно , нет чисто текстового представления графических содержимого дисплея. Поэтому программы чтения с экрана были вынуждены использовать новые низкоуровневые методы, собирая сообщения из операционной системы и используя их для построения «внеэкранной модели», представления дисплея, на котором хранится требуемый текстовый контент.

Например, операционная система может отправлять сообщения, чтобы нарисовать командную кнопку и ее заголовок. Эти сообщения перехватываются и используются для построения закадровой модели. Пользователь может переключаться между элементами управления (например, кнопками), доступными на экране, а подписи и содержимое элементов управления будут прочитаны вслух и / или показаны на обновляемом дисплее Брайля .

Программы чтения с экрана могут также передавать информацию о меню, элементах управления и других визуальных конструкциях, чтобы позволить слепым пользователям взаимодействовать с этими конструкциями. Однако поддержание модели за кадром - серьезная техническая проблема; перехват низкоуровневых сообщений и поддержание точной модели - сложные задачи.

API специальных возможностей

Разработчики операционных систем и приложений попытались решить эти проблемы, предоставив средствам чтения с экрана способы доступа к содержимому дисплея без необходимости поддерживать модель вне экрана. Они включают предоставление альтернативных и доступных представлений того, что отображается на экране, доступ к которому осуществляется через API . Существующие API включают:

Программы чтения с экрана могут запрашивать у операционной системы или приложения, что в данный момент отображается, и получать обновления при изменении отображения. Например, программе чтения с экрана можно сказать, что текущий фокус находится на кнопке и заголовке кнопки, который должен быть передан пользователю. Этот подход значительно проще для разработчиков программ чтения с экрана, но не работает, когда приложения не соответствуют API специальных возможностей : например, Microsoft Word не соответствует API MSAA , поэтому программы чтения с экрана должны по-прежнему поддерживать модель вне экрана для Word. или найдите другой способ получить доступ к его содержимому. Один из подходов - использовать доступные сообщения операционной системы и объектные модели приложений в дополнение к API специальных возможностей .

Считается, что программы чтения с экрана могут получить доступ ко всему отображаемому контенту, который не является недоступным по своей сути. Веб-браузеры, текстовые процессоры, значки и окна, а также программы электронной почты - это лишь некоторые из приложений, успешно используемых пользователями программ чтения с экрана. Однако, по мнению некоторых пользователей, использование программы чтения с экрана значительно сложнее, чем использование графического интерфейса, и у многих приложений есть определенные проблемы, связанные с характером приложения (например, анимация) или несоблюдением стандартов доступности для платформы (например, Microsoft Word и активная доступность).

Программы и приложения для самостоятельного озвучивания

Некоторые программы и приложения имеют встроенную технологию озвучивания наряду с их основными функциями. Эти программы называются само-озвучивающими и могут быть формой вспомогательных технологий, если они предназначены для устранения необходимости использования программы чтения с экрана.

Облачный

Некоторые телефонные службы позволяют пользователям удаленно взаимодействовать с Интернетом. Например, TeleTender может читать веб-страницы по телефону и не требует специальных программ или устройств на стороне пользователя.

Интернет

Относительно новой разработкой в ​​этой области являются веб-приложения, такие как Spoken-Web, которые действуют как веб-порталы, управляя контентом, таким как обновления новостей, погода, научные и бизнес-статьи, для слабовидящих или слепых пользователей компьютеров. Другими примерами являются ReadSpeaker или BrowseAloud, которые добавляют функциональность преобразования текста в речь к веб-контенту. Основная аудитория таких приложений - это те, кто испытывает трудности с чтением из-за трудностей в обучении или языковых барьеров. Хотя функциональность остается ограниченной по сравнению с аналогичными настольными приложениями, основным преимуществом является повышение доступности указанных веб-сайтов при просмотре на общедоступных машинах, где у пользователей нет разрешения на установку специального программного обеспечения, что дает людям большую «свободу передвижения».

С развитием смартфонов возможность слушать письменные документы (текстовый веб-контент, PDF- документы, электронные письма и т. Д.) Во время вождения или во время аналогичной деятельности так же, как прослушивание музыки, принесет пользу гораздо более широкой аудитории, чем слабовидящим людям. Самыми известными примерами являются Siri для iOS , а также Google Now и Iris для Android . С выпуском Galaxy S III , Samsung также представил аналогичный интеллектуальный личный помощник под названием S Voice . В операционной системе BlackBerry 10 их смартфон Z30 также имеет функции голосового взаимодействия, которые аналогичны другим мобильным операционным системам .

Эта функциональность зависит от качества программного обеспечения, а также от логической структуры текста. Использование заголовков, знаков препинания, наличия альтернативных атрибутов для изображений и т. Д. Имеет решающее значение для хорошей вокализации. Кроме того, веб-сайт может иметь красивый внешний вид из-за использования соответствующего двухмерного позиционирования с помощью CSS, но его стандартная линеаризация, например, путем подавления любых CSS и Javascript в браузере, может быть непонятной.

Настройка

Большинство программ чтения с экрана позволяют пользователю выбрать, будет ли большая часть знаков препинания объявляться или игнорироваться. Некоторые программы чтения с экрана можно настроить для конкретного приложения с помощью сценариев . Одно из преимуществ сценариев состоит в том, что они позволяют пользователям делиться настройками, повышая доступность для всех. Например, у JAWS есть активное сообщество по обмену сценариями.

Многословие

Многословие - это функция программного обеспечения для чтения с экрана, предназначенная для пользователей компьютеров с ослабленным зрением. Элементы управления подробностью речи позволяют пользователям выбирать, какой речевой отклик они хотят услышать. В частности, настройки детализации позволяют пользователям создавать мысленную модель веб-страниц, отображаемых на экране их компьютера. Основываясь на настройках подробности, программа чтения с экрана информирует пользователей об определенных изменениях форматирования, например, когда фрейм или таблица начинается и заканчивается, где графика была вставлена ​​в текст или когда в документе появляется список.

Язык

Некоторые программы чтения с экрана могут читать текст на нескольких языках при условии, что язык материала закодирован в его метаданных .

Некоторые программы чтения с экрана также включают языковую многословность, которая автоматически определяет параметры подробности, связанные с языком вывода речи. Например, если пользователь перешел на веб-сайт в Великобритании, текст будет прочитан с английским акцентом .

Смотрите также

использованная литература

внешние ссылки