Романизация армянского языка - Romanization of Armenian

Существуют различные системы латинизации в армянском алфавите .

Системы транслитерации

Hübschmann-Meillet (1913)

В лингвистической литературе на классическом армянском языке обычно используется транслитерация Хюбшмана-Мейе (1913). Он использует объединяющую точку над отметкой U + 0307 для обозначения аспиратов, ṫ, cḣ, č̇, ṗ, k̇ . Некоторые документы были опубликованы с использованием похожего латинского диакритического знака dasia U + 0314, перевернутой запятой, объединяющей над буквой, которую легче различить визуально в t̔, ch̔, č̔, p̔, k̔ .

Однако правильная поддержка этих комбинированных диакритических знаков долгое время была плохой в прошлом и не была очень распространена во многих обычных приложениях, компьютерных шрифтах или системах рендеринга, поэтому некоторые документы были опубликованы с использованием в качестве возможных резервных вариантов их вариантов интервалов, таких как буква-модификатор точка над буквой ˙ U + 02D9, написанная после буквы, а не над ней, или перевернутая запятая ʻU + 02BB, написанная после буквы, а не над ней - или иногда пробел греческого spiritus asper ῾ U + 1FFE, или интервал серьезный акцент ˋ U + 02CB, даже если он слишком плоский, или даже обратная кавычка ASCII `U + 0060, или апостроф-кавычка ASCII 'U + 0027, когда путаницы не было.

Но сегодня предпочтительным символом является буква-модификатор левое полукольцо ʿ U + 02BF или буква-модификатор ʻU + 02BB или ʽ U + 02BD, которая является вариантом интервала диакритики дасия (исторически это также правильная адаптация к латинское письмо от греческого spiritus asper , см. грубое дыхание ) с тем преимуществом, что имеет отличную поддержку во многих латинских шрифтах, потому что он также является простым перевернутым.

Также не были решены некоторые двусмысленности при работе с современным армянским языком, который имеет два диалекта, причем оба используют две возможные орфографии (кроме того, в современных публикациях для классического армянского языка используется современная орфография).

BGN / PCGN (1981)

Латинизация BGN / PCGN (1981) использует правую одинарную кавычку для обозначения аспиратов, t ', ch', ts ', p', k ' , что является противоположностью исходной диакритики грубого дыхания .

Эта латинизация была принята ISO (1996 г.) и считается устаревшей. Эта система является свободной транскрипцией и необратима (без использования поиска в словаре), особенно для отдельных армянских букв, латинизированных в диграфы (эти необратимые или неоднозначные латинизации показаны в красной ячейке в таблице ниже) .

Некоторые армянские буквы имеют несколько латинизации в зависимости от контекста:

  • армянская гласная буква Ե / ե должна быть сначала латинизирована как ye или после знаков гласных Ե / ե, Է / է, Ը / ը, Ի / ի, Ո / ո, ՈՒ / ու и Օ / օ; во всех остальных случаях его следует латинизировать как e ;
  • армянская гласная буква Ո / ո должна быть сначала латинизирована как vo , за исключением слова եո, где она должна быть латинизирована как ov ; во всех остальных случаях его следует латинизировать как o ;
  • Армянская согласная буква Վ / վ следует латинизируется ЕВ первоначально, в изоляции или после гласного символов Ե / ե, Է / է, Ը / ը, Ի / ի, Ո / ո, ՈՒ / ու и Օ / օ; во всех остальных случаях его следует латинировать как ev .

ISO 9985 (1996)

ISO 9985 (1996) - международный стандарт транслитерации современного армянского алфавита. Как и в случае латинизации BGN / PCGN, правая одинарная кавычка используется для обозначения большинства аспиратов.

Эта система обратима, потому что она избегает использования диграфов и возвращается к Hübschmann-Meillet (однако некоторые диакритические знаки для гласных также изменены).

Серия аспиратов не рассматривается в стандарте ISO 9985 единообразно: в то время как pʼ, tʼ, cʼ, kʼ романизированы с апострофной меткой, без наддува չ č - нет, и вместо этого ее ненадежный аналог ճ транскрибируется č̣ с нижней точкой, нигде в другом месте не появляющейся. система. Обратите внимание, что в этой схеме č (обозначающий չ) конфликтует с транслитерацией Хюбшмана-Мейе (где он обозначает ճ).

Эта система рекомендуется для международного обмена библиографическими текстами (она также является основой упрощенной латинизации, найденной для локализации армянской топономии для транслитерации человеческих имен), где она очень хорошо работает с общей латинской кодировкой ISO / IEC 8859-2, используемой в Центральной Европа.

ALA-LC (1997)

Романизация ALA-LC (1997) в значительной степени совместима с BGN / PCGN, но возвращается к выражению аспиратов с помощью левой одинарной кавычки (на самом деле буква-модификатор левое полукольцо ʿ U + 02BF, шестнадцатеричный код US-MARC B0, то есть также используется для обозначения ayin на арабском языке, поэтому некоторые документы могут содержать либо предпочтительное левое полукольцо, либо иногда обратную кавычку ASCII `U + 0060).

Этот стандарт изменяет схему транслитерации, используемую между классическим / восточноармянским и западноармянским языками для армянских согласных, представленных заменой пар b против p , g против k , d против t , dz против ts и ch против j .

Во всех случаях и для того, чтобы латинизация была менее двусмысленной и обратимой,

  • мягкий знак (штрих, шестнадцатеричный код US-MARC A7) вставляется между двумя отдельными буквами, которые в противном случае интерпретировались бы как орграф (красный в таблице ниже) ; в латинизированных орграфах zh , kh , ts , dz , gh и ch, представляющих одну армянскую букву, нет штриха;
  • только с классической армянской орфографией гласная, представленная буквой e, будет представлена буквой y , когда она стоит в начальной позиции имени и за которой следует другая гласная; эта трудность исчезла в современном армянском языке с реформированной орфографией, которая в этом случае изменила исходную армянскую букву;
  • только в классической армянской орфографии гласная буква y будет представлена буквой h , если она стоит в начальной позиции слова или радикала в составном слове; эта трудность исчезла в современном армянском языке с реформированной орфографией, которая в этом случае изменила исходную армянскую букву.

Методы ввода только в формате ASCII

На различных армянских сайтах появились нестандартные транслитераторы, позволяющие вводить современный западноармянский или восточноармянский текст, используя только символы ASCII. Это неправильный транслитератор, но он может быть удобен для пользователей, у которых нет армянской клавиатуры.

Несмотря на то, что эти методы ввода широко используются, они не соответствуют каким-либо утвержденным международным или армянским стандартам, поэтому не рекомендуются для латинизации армянского языка. Обратите внимание, что методы ввода распознают латинские диграфы zh, dz, gh, tw, sh, vo, ch, rr для классического или восточноармянского языка и zh, dz, tz, gh, vo, ch, rr для западноармянского языка, но предлагают нет способа устранить неоднозначность слов, в которых не следует распознавать орграфы.

Некоторые армянские буквы вводятся как латинские диграфы, за ними также может следовать одинарная кавычка ASCII (которая действует как единственный распознаваемый буквенный модификатор), но эта цитата не всегда означает, что предполагаемая армянская буква должна быть с придыханием (это может быть обратным для ввода ch ' ), он также используется как модификатор гласной. Из-за неоднозначности тексты необходимо исправлять, вводя промежуточный фиктивный символ перед вводом второй латинской буквы или кавычки, а затем удаляя фиктивный символ, чтобы автоматический преобразователь ввода сохранял различимость армянских букв.

Таблицы транслитерации

Некоторые армянские буквы имеют очень разные фонетические звуки между классическим или восточноармянским и западноармянским, поэтому использование армянских букв в двух подветвях языка различается.

Это видно в таблице ниже, раскрашивая транслитерации, характерные для классического или восточноармянского языка, на зеленом фоне, а транслитерации для западноармянского языка - на синем фоне. Остальные буквы транслитерируются независимо от языковой ветви. Тем не менее, ячейки с красным фоном содержат транслитерации, которые зависят от контекста (и могут в некоторых случаях создавать двусмысленность, только романизации ISO 9985 и Hübschmann-Meillet не используют никаких контекстно-зависимых неоднозначных диграфов для транскрибирования простых армянских букв, которые не являются лигатурами, но первая несовместима с его представлением придыхательных согласных и несовместима со всеми другими системами для пары букв).

Армянская письменность столица Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ
0531 0532 0533 0534 0535 0536 0537 0538 0539 053A 053B 053C 053D 053E 053F 0540 0541 0542 0543 0544
крохотный ա բ գ դ ե զ է ը թ ժ ի լ խ ծ կ հ ձ ղ ճ մ
0561 0562 0563 0564 0565 0566 0567 0568 0569 056A 057B 056C 056D 056E 057F 0570 0571 0572 0573 0574
Романизация классического или восточноармянского языка Ввод ASCII а б грамм d е z е ' y ' т ' ж я л Икс c ' k час дз gh tw м
Hübschmann-Meillet ê ə t̔, ṫ ž c j ł č
ISO 9985 ē ë т ' ç грамм č
BGN / PCGN глаз е у ж кх ts дз gh ch
ALA-LC е, у ē ě tʿ
Романизация западноармянского языка ALA-LC п k т дз грамм ts j
Ввод ASCII е е ' у т ' Икс tz
 
Армянская письменность столица Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք Օ Ֆ ՈՒ  
0545 0546 0547 0548 0549 054A 054B 054C 054D 054E 054F 0550 0551 0552 0553 0554 0555 0556 0548
0552
крохотный յ ն շ ո չ պ ջ ռ ս վ տ ր ց ւ փ ք օ ֆ ու և (եւ)
0575 0576 0577 0578 0579 057A 057B 057C 057D 057E 057F 0580 0581 0582 0583 0584 0585 0586 0578
0582
0587
Романизация классического или восточноармянского языка Ввод ASCII у п ш vo ch п j rr s v т р c ш п' k ', q о ж ты ev
Hübschmann-Meillet š о č̔, č̇ ǰ р c̔, ċ p̔, ṗ k̔, k ô
ISO 9985 č р c ' п' k ' ò ой фу
BGN / PCGN ш о, во ch ' j rr ts ' о ты ев, ев
ALA-LC г, ч о чʿ р цʿ п kʿ ō фу, ев
Романизация западноармянского языка ALA-LC б ch d
Ввод ASCII час' vo ch ch ' rr c п' k ', q о ev

Обратите внимание, что в приведенной выше таблице последние два столбца относятся к орграфам, а не к отдельным буквам (однако они считаются буквами в реформатской орфографии). Однако последний столбец отображает лигатуру, которая используется в классической орфографии только в качестве изолированного символа для короткого армянского слова ew (означающего и ) и его производных, подобно амперсанду (&) в латинском письме (в реформатском языке). орфография, также используется в середине и конце слов вместо եվ); та же самая транслитерация для ew (классический армянский) или ev (реформированная орфография) будет использоваться для букв, которые представляет эта лигатура, когда они используются в качестве диграфов: раньше она относилась к согласной w , теперь она относится к согласной v .

Армянский сценарий также использует некоторые другие диграфы, которые часто записываются как необязательные лигатуры, только в нижнем регистре (пять из них закодированы в Unicode только для полной двусторонней совместимости с некоторыми устаревшими кодировками); если они присутствуют, эти лигатуры (которые являются чисто типографскими и не имеют семантических различий в нормальных армянских текстах) должны быть латинизированы путем декомпозиции составляющих их букв.

Смотрите также

использованная литература

  • Антуан Мейе и Генрих Хюбшманн , Altarmenisches Elementarbuch , Гейдельберг, 1913 г. (2-е издание, 1980 г.).

внешние ссылки

  • Конвертер транслитерации армянского языка Поддерживает восточное и западное произношение армянского языка, включает проверку орфографии.
  • Транслитерация армянского языка Томасом Т. Педерсеном, в KNAB ( Kohanimeandmebaas , База данных географических названий) Eesti Keele Instituut (Институт эстонского языка).
  • Готовый макрос для Visual Basic в текстовом редакторе Microsoft Word, позволяющий автоматически заменять армянские буквы на латинские, используя опцию Versatile выше для восточноармянского языка.