Компьютерный перевод - Computer-assisted translation

Автоматизированный перевод ( CAT ), также называемый машинным переводом ( MAT ) или машинным переводом, выполняемым человеком ( MAHT ), представляет собой использование программного обеспечения для помощи переводчику-человеку в процессе перевода . Перевод создается человеком, а некоторые аспекты процесса выполняются с помощью программного обеспечения; это контрастирует с машинным переводом (МП), в котором перевод создается компьютером, возможно, с некоторым вмешательством человека (например, предварительное редактирование и постредактирование).

Под CAT-программами обычно понимаются программы, которые специально облегчают сам процесс перевода. Большинство программ CAT имеют (а) возможность переводить различные форматы исходных файлов в единой среде редактирования без необходимости использования программного обеспечения, связанного с форматом файлов, для большей части или всего процесса перевода, (б) память переводов и (в) интеграция различных утилит или процессов, повышающих производительность и согласованность при переводе.

Ассортимент инструментов

Компьютерный перевод - это широкий и неточный термин, охватывающий целый ряд инструментов. Они могут включать:

Концепции

Программное обеспечение памяти переводов

Программы памяти переводов хранят ранее переведенные исходные тексты и их эквивалентные целевые тексты в базе данных и извлекают связанные сегменты во время перевода новых текстов.

Такие программы разбивают исходный текст на управляемые единицы, известные как «сегменты». Предложение исходного текста или подобная предложению единица (заголовки, заголовки или элементы в списке) могут считаться сегментом. Тексты также могут быть разделены на более крупные блоки, такие как абзацы, или небольшие, например, статьи. По мере того, как переводчик работает с документом, программа отображает каждый исходный сегмент по очереди и предоставляет предыдущий перевод для повторного использования, если он находит соответствующий исходный сегмент в своей базе данных. В противном случае программа позволяет переводчику ввести перевод для нового сегмента. После завершения перевода сегмента программа сохраняет новый перевод и переходит к следующему сегменту. В доминирующей парадигме память переводов, в принципе, представляет собой простую базу данных полей, содержащих сегмент исходного языка, перевод сегмента и другую информацию, такую ​​как дата создания сегмента, последний доступ, имя переводчика и так далее. Другой подход к памяти переводов не предполагает создания базы данных, вместо этого полагаясь на согласованные справочные документы.

Некоторые программы памяти переводов функционируют как автономные среды, в то время как другие функционируют как надстройка или макрос для коммерчески доступных текстовых процессоров или других программ для бизнеса. Дополнительные программы позволяют обрабатывать исходные документы из других форматов, такие как файлы настольных издательских систем, электронные таблицы или HTML- код, с помощью программы TM.

Программное обеспечение для языковых поисковых систем

Программное обеспечение для языковых поисковых систем - новинка для переводческой отрасли , обычно это Интернет-система, которая работает аналогично поисковым машинам в Интернете. Однако вместо того, чтобы искать в Интернете, языковая поисковая машина выполняет поиск в большом хранилище памяти переводов, чтобы найти ранее переведенные фрагменты предложений, фразы, целые предложения, даже полные абзацы, соответствующие сегментам исходного документа.

Поисковые системы по языку предназначены для использования современных поисковых технологий для выполнения поиска на основе исходных слов в контексте, чтобы гарантировать, что результаты поиска соответствуют значению исходных сегментов. Как и традиционные инструменты TM, ценность языковой поисковой системы в значительной степени зависит от репозитория памяти переводов, в котором она выполняет поиск.

Программное обеспечение для управления терминологией

Программное обеспечение для управления терминологией предоставляет переводчику средства автоматического поиска терминов, встречающихся в документе, в данной терминологической базе данных, либо путем автоматического отображения терминов в окне интерфейса программного обеспечения памяти переводов, либо с помощью горячих клавиш для просмотра записи в терминологической базе данных. Некоторые программы имеют другие комбинации горячих клавиш, позволяющие переводчику добавлять новые терминологические пары в терминологическую базу данных на лету во время перевода. Некоторые из более продвинутых систем позволяют переводчикам в интерактивном или пакетном режиме проверять, была ли использована правильная комбинация исходного и целевого терминов внутри и между сегментами памяти переводов в данном проекте. Также существуют независимые системы управления терминологией, которые могут обеспечивать функциональность рабочего процесса, визуальную таксономию, работать как тип средства проверки терминов (аналогично проверке орфографии, термины, которые использовались неправильно, помечаются) и могут поддерживать другие типы многоязычных классификаций аспектов терминов, такие как изображения, видео или звук.

Программное обеспечение для центровки

Программы выравнивания берут завершенные переводы, разделяют исходный и целевой текст на сегменты и пытаются определить, какие сегменты принадлежат друг другу, чтобы создать память переводов или другой справочный ресурс с содержанием. Многие программы выравнивания позволяют переводчикам вручную выравнивать несовпадающие сегменты. Полученное в результате выравнивание битекста (также известного как параллельный текст ) можно затем импортировать в программу памяти переводов для будущих переводов или использовать в качестве справочного документа.

Интерактивный машинный перевод

Интерактивный машинный перевод - это парадигма, в которой автоматическая система пытается предсказать перевод, который собирается произвести человек-переводчик, предлагая гипотезы перевода. Эти гипотезы могут быть либо полным предложением, либо частью предложения, которое еще предстоит перевести.

Дополненный перевод

Расширенный перевод - это форма перевода, выполняемого человеком в интегрированной технологической среде, которая предоставляет переводчикам доступ к подсегментным адаптивным машинным переводам (MT) и памяти переводов (TM), поиску терминологии (CAT) и автоматическому обогащению контента (ACE), чтобы помочь им work, что автоматизирует управление проектами, обработку файлов и другие вспомогательные задачи.

Основанный на концепции дополненной реальности , дополненный перевод стремится сделать переводчиков более продуктивными, предоставляя им актуальную информацию по мере необходимости. Эта информация адаптируется к привычкам и стилю отдельных переводчиков, чтобы ускорить их работу и повысить производительность. Он отличается от классического постдайтинга МП , при котором лингвисты проверяют целые тексты, переведенные машинами, тем, что он предоставляет машинный перевод и информацию в виде предложений, которые могут быть приняты полностью, отредактированы или проигнорированы, в зависимости от обстоятельств .

Расширенный перевод расширяет принципы, впервые разработанные в 1980-х годах, которые вошли в CAT-инструменты. Однако он объединяет несколько функций, которые ранее были дискретными, в одной среде. Например, исторически переводчикам приходилось покидать свои переводческие среды, чтобы проводить исследования терминологии, но в расширенной среде компонент ACE автоматически предоставлял бы ссылки на информацию о терминах и концепциях, встречающихся в тексте, непосредственно в среде.

По состоянию на май 2017 года не существует полных реализаций расширенной среды перевода, хотя отдельные разработчики создали частичные системы.

Смотрите также

использованная литература

внешние ссылки