Размещение - Postediting

После редактирования (или постредактирование ) является процессом , посредством которого люди поправки машинного перевода сгенерированных для достижения приемлемого конечного продукта. Публикующего редактора называют редактором . Концепция постредактирования связана с концепцией предварительного редактирования . В процессе перевода текста с помощью машинного перевода наилучшие результаты могут быть получены путем предварительного редактирования исходного текста - например, путем применения принципов управляемого языка  - и последующего редактирования машинного вывода. Он отличается от редактирования , которое относится к процессу улучшения текста, созданного человеком (процесс, который часто называют редактированием в области перевода). Отредактированный текст впоследствии может быть отредактирован, чтобы гарантировать качество выбранных языков, отредактированных для исправления простых ошибок.

Постредактирование включает исправление вывода машинного перевода, чтобы обеспечить его соответствие уровню качества, заранее согласованному между клиентом и постредактором. Легкое постредактирование направлено на то, чтобы сделать вывод просто понятным; полное постредактирование, чтобы сделать его еще и стилистически подходящим. С развитием машинного перевода полное постредактирование становится альтернативой ручному переводу. Практически все инструменты компьютерного перевода (CAT) теперь поддерживают постредактирование результатов машинного перевода.

Постредактирование и машинный перевод

Машинный перевод покинул лаборатории и начал использоваться по назначению в конце семидесятых в некоторых крупных учреждениях, таких как Европейская комиссия и Панамериканская организация здравоохранения , а затем, позже, в некоторых корпорациях, таких как Caterpillar и General Motors . Первые исследования постредактирования появились в восьмидесятых годах, связанных с этими реализациями. Для разработки соответствующих руководств и обучения члены Американской ассоциации машинного перевода (AMTA) и Европейской ассоциации машинного перевода (EAMT) в 1999 году создали Специальную группу по постредактированию.


После девяностых годов развитие компьютерных мощностей и возможностей подключения ускорило разработку машинного перевода и позволило его развертывать через веб-браузер, в том числе в качестве бесплатного полезного дополнения к основным поисковым системам ( Google Translate , Bing Translator , Yahoo! Babel Fish ). Более широкое признание несовершенного машинного перевода сопровождалось также более широким распространением постредактирования. Поскольку спрос на локализацию товаров и услуг растет такими темпами, которые невозможно удовлетворить с помощью человеческого перевода, даже без поддержки памяти переводов и других технологий управления переводами, отраслевые организации, такие как Общество пользователей автоматизации перевода (TAUS), ожидают, что машинный перевод и постредактирование будет играть гораздо большую роль в ближайшие несколько лет.

Использование машинного перевода предполагает иногда предварительное редактирование .

Легкое и полное постредактирование

В исследованиях восьмидесятых годов проводилось различие между степенями постредактирования, которые в контексте Службы переводов Европейской комиссии сначала определялись как обычные и быстрые или полные и быстрые. Легкое и полное постредактирование кажется наиболее часто используемой формулировкой.

Легкое постредактирование подразумевает минимальное вмешательство постредактора, поскольку строго необходимо, чтобы помочь конечному пользователю разобраться в тексте; ожидается, что клиент будет использовать его только для входящих целей, часто когда текст нужен срочно или имеет короткий промежуток времени.

Полное постредактирование предполагает более высокий уровень вмешательства для достижения определенного уровня качества, согласованного между клиентом и постредактором; ожидается, что результатом будет текст, который будет не только понятен, но и представлен некоторым стилистически подходящим образом, чтобы его можно было использовать для ассимиляции и даже для распространения, как для входящих, так и для исходящих целей.

На вершине полного постредактирования находится ожидание уровня качества, неотличимого от уровня качества перевода, выполненного человеком. Однако предполагалось, что переводчикам требуется меньше усилий для работы непосредственно с исходным текстом, чем для постредактирования версии, сгенерированной машиной. С развитием машинного перевода это может измениться. Для некоторых языковых пар и для некоторых задач, а также с движками, которые были настроены с использованием данных хорошего качества для конкретной предметной области, некоторые клиенты уже просят переводчиков постредактировать вместо перевода с нуля, полагая, что они достигнут аналогичного качества за более низкая стоимость.

Легкая / полная классификация, разработанная в девяностых годах, когда машинный перевод все еще существовал на компакт-дисках, также может не соответствовать достижениям в области машинного перевода в части легкого постредактирования. Для некоторых языковых пар и некоторых задач, особенно если исходный код был предварительно отредактирован, исходный машинный вывод может быть достаточно хорош для целей составления отчета, не требуя последующего вмешательства человека.

Эффективность постредактирования

Постредактирование используется, когда необработанный машинный перевод недостаточно хорош и человеческий перевод не требуется. Промышленность рекомендует использовать постредактирование, если оно может как минимум вдвое повысить производительность ручного перевода, а в случае легкого постредактирования даже в четыре раза больше.

Однако эффективность постредактирования трудно предсказать. Различные исследования, проведенные как в академических кругах, так и в промышленности, утверждают, что постредактирование, как правило, выполняется быстрее, чем перевод с нуля, независимо от языковых пар или опыта переводчиков. Однако нет согласия относительно того, сколько времени можно сэкономить с помощью постредактирования на практике (если оно вообще есть): хотя отрасль сообщает об экономии времени около 40%, некоторые академические исследования показывают, что экономия времени в реальных условиях работы с большей вероятностью будет между 0–20%. Профессионалы также сообщают об отрицательном приросте производительности, когда исправления требуют больше времени, чем перевод с нуля.

Постредактирование и языковая индустрия

По прошествии примерно тридцати лет постредактирование все еще остается «зарождающейся профессией». Что такое правильный профиль постредактора, еще до конца не изучено. Постредактирование частично совпадает с переводом и редактированием. Большинство думает, что идеальным постредактором будет переводчик, стремящийся обучиться конкретным необходимым навыкам, но есть некоторые, кто думает, что двуязычный без опыта перевода может быть легче обучить. Мало что известно о том, кто на самом деле являются постредакторами, склонны ли они быть профессиональными переводчиками, работают ли они в основном как штатные сотрудники или самостоятельно, и на каких условиях. Многие профессиональные переводчики не любят постредактирование, среди прочего, потому, что оно, как правило, оплачивается по более низким ставкам, чем обычные переводы, при этом Международная ассоциация профессиональных переводчиков (IAPTI) особенно активно об этом говорит.

Качество вывода машинного перевода для постредактирования выше и, следовательно, требует меньше усилий после редактирования, когда машинный перевод обеспечивается нейронным, вертикальным или специализированным механизмом машинного перевода . Повышение эффективности перевода можно измерить с помощью отслеживания времени лингвистов нужно исправить машинный перевод в той же среде перевода, такие как XTM Облако, системы управления переводом и компьютерный перевод инструмент, где постредактирование раз и результаты лингвистических оценок качества постредактированные тексты можно сравнивать.

Нет четких данных о том, насколько велик пирог постредактирования в переводческой отрасли. Недавний опрос показал, что это предлагают 50% поставщиков языковых услуг, но для 85% из них это составляет менее 10% их пропускной способности. Memsource , веб-инструмент для перевода, утверждает, что более 50 процентов переводов между английским и испанским, французским и другими языками было выполнено на его платформе, сочетающей память переводов с машинным переводом. Постредактирование также осуществляется через порталы краудсорсинга переводов, такие как Unbabel, которые к ноябрю 2014 года заявили , что постредактировали более 11 миллионов слов.

В любом случае оценки производительности и объема являются подвижными целями, поскольку достижения в области машинного перевода, в значительной степени обусловленные постредактированным текстом, возвращаемым в его движки, будут означать, что чем больше выполняется постредактирование, тем выше качество машинного перевода и более распространенного постредактирования.

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки