Арабский алфавит -Arabic alphabet
арабский алфавит | |
---|---|
Тип скрипта | |
Временной период |
3-й или 4-й век н.э. по настоящее время |
Направление | сценарий справа налево |
Языки | арабский |
Связанные скрипты | |
Родительские системы |
Египетские иероглифы
|
ИСО 15924 | |
ИСО 15924 | араб ,, арабский |
Юникод | |
Юникод псевдоним |
арабский |
арабский алфавит |
---|
арабское письмо |
Арабский алфавит ( арабский : الْأَبْجَدِيَّة الْعَرَبِيَّة , аль-Абьядия л-арабия или الْحُرُوف الْعَرَبِيَّة , аль - ḥurūf l-ʿarabīyah , ipa : arici - jifijjifjifjifjifji - ji- jifijj Он написан курсивом справа налево и состоит из 28 букв. Большинство букв имеют контекстную форму.
Арабский алфавит считается абджадом , то есть в нем используются только согласные , но теперь он считается « нечистым абджадом ». Как и в случае с другими нечистыми абджадами , такими как еврейский алфавит , писцы позже разработали средства обозначения гласных с помощью отдельных диакритических знаков для гласных .
Согласные буквы
Базовый арабский алфавит состоит из 28 букв . В адаптации арабского письма для других языков добавлены и удалены некоторые буквы, например персидский , османско-турецкий , курдский , урду , синдхи , азербайджанский (в Иране), малайский , пушту , пенджаби , уйгурский , арви и арабский малаялам , все из которых иметь дополнительные буквы, как показано ниже. Нет четкой формы прописных и строчных букв.
Многие буквы выглядят одинаково, но отличаются друг от друга точками ( ʾiʿjām ) над или под их центральной частью ( rasm ). Эти точки являются неотъемлемой частью буквы, так как они различают буквы, обозначающие разные звуки. Например, арабские буквы ب (b), ت (t) и ث (th) имеют одинаковую основную форму, но имеют одну точку внизу, две точки вверху и три точки вверху соответственно. Буква ن (n) также имеет одинаковую форму в начальной и средней формах с одной точкой вверху, хотя она несколько отличается в изолированной и конечной форме.
Как печатный, так и письменный арабский язык написан курсивом , при этом большинство букв в слове напрямую связаны с соседними буквами.
Алфавитный порядок
Существуют две основные последовательности сопоставления арабского алфавита: абджад и хиджа.
Первоначальный порядок abjadīy ( أَبْجَدِيّ ), используемый для написания букв , происходит от порядка финикийского алфавита и, следовательно, подобен порядку других алфавитов финикийского происхождения, таких как еврейский алфавит . В этом порядке буквы также используются как числа, числа Абджада и обладают тем же буквенно-цифровым кодом/ шифром , что и еврейская гематрия и греческая изопсефия .
Порядок хиджа'и ( هِجَائِي ) или алифбаи ( أَلِفْبَائِي ), используемый там, где сортируются списки имен и слов, например, в телефонных книгах, школьных списках и словарях, группирует буквы по сходству формы.
Абджади
Орден абджади не является простым историческим продолжением более раннего северносемитского алфавитного порядка, поскольку он имеет положение, соответствующее арамейской букве самех / семкат ס , однако ни одна буква арабского алфавита исторически не происходит от этой буквы. Потеря самэḵ была компенсирована разделением шин ש на две независимые арабские буквы, ش ( шин ) и ﺱ ( син ), которые заняли место самэḵ . Шесть других букв, не соответствующих ни одной северно-семитской букве, помещены в конце.
غ | ø | Ê | ذ | خ | ث | ت | Á | ر | ق | ص | ف | ع | س | ن | م | ل | ك | ي | ط | ح | ز | و | ه | د | ج | ب | أ |
гх | ẓ | ḍ | дх | кх | й | т | ш | р | д | с | ф | ʿ | с | н | м | л | к | у | т | час | г | ж | час | г | Дж | б | ʾ |
1к | 900 | 800 | 700 | 600 | 500 | 400 | 300 | 200 | 100 | 90 | 80 | 70 | 60 | 50 | 40 | 30 | 20 | 10 | 09 | 08 | 07 | 06 | 05 | 04 | 03 | 02 | 01 |
Обычно это озвучивается следующим образом:
- abjad hawwaz ḥuṭti kalaman saʿfaṣ qarashat thakhadh ḍaẓagh .
Другая вокализация:
- абуджадин хавазин хутийя калман сафаш куришат таххудх чаугх
Á | غ | ø | ذ | خ | ث | ت | س | ر | ق | Ê | ف | ع | ص | ن | م | ل | ك | ي | ط | ح | ز | و | ه | د | ج | ب | أ |
ш | гх | ẓ | дх | кх | й | т | с | р | д | ḍ | ф | ʿ | с | н | м | л | к | у | т | час | г | ж | час | г | Дж | б | ʾ |
28 | 27 | 26 | 25 | 24 | 23 | 22 | 21 | 20 | 19 | 18 | 17 | 16 | 15 | 14 | 13 | 12 | 11 | 10 | 09 | 08 | 07 | 06 | 05 | 04 | 03 | 02 | 01 |
Цвета показывают, какие буквы занимают позиции, отличные от предыдущей таблицы. |
Это можно озвучить так:
- абуджадин хавазин хутия калман сафах курисат тахудх агуш или * абуджадин хавазин х'ут (о) ия калман с (в) åфад к (о) урисат т (с / ч) ахудх з (ч / ш) аг (гх) уш
хиджаи
Современные словари и другие справочники не используют порядок абджади для сортировки по алфавиту; вместо этого используется более новый порядок хиджаи , в котором буквы частично сгруппированы вместе по сходству формы. Порядок хиджаи никогда не используется в качестве числительных.
ي | و | ه | ن | م | ل | ك | ق | ف | غ | ع | ø | ط | Ê | ص | Á | س | ز | ر | ذ | د | خ | ح | ج | ث | ت | ب | ا |
у | ж | час | н | м | л | к | д | ф | гх | ʿ | ẓ | т | ḍ | с | ш | с | г | р | дх | г | кх | час | Дж | й | т | б | а |
Другой вид ордена хиджаи широко использовался в Магрибе до недавнего времени, когда он был заменен орденом Машрики .
ي | و | ه | Á | س | ق | ف | غ | ع | Ê | ص | ن | م | ل | ك | ø | ط | ز | ر | ذ | د | خ | ح | ج | ث | ت | ب | ا |
у | ж | час | ш | с | д | ф | гх | ʿ | ḍ | с | н | м | л | к | ẓ | т | г | р | дх | г | кх | час | Дж | й | т | б | а |
Цвета показывают, какие буквы занимают позиции, отличные от предыдущей таблицы. |
Буквенные формы
Каллиграфия |
---|
Арабский алфавит всегда пишется курсивом, а буквы различаются по форме в зависимости от их положения в слове. Буквы могут иметь до четырех различных форм, соответствующих начальному, медиальному (среднему), конечному или изолированному положению ( IMFI ). В то время как некоторые буквы демонстрируют значительные различия, другие остаются почти идентичными во всех четырех позициях. Как правило, буквы в одном и том же слове соединяются с обеих сторон короткими горизонтальными линиями, но шесть букв ( و, ز, ر, ذ, د, ا ) могут быть связаны только с предшествующей им буквой. Например, أرارات ( Арарат ) имеет только изолированные формы, потому что каждая буква не может быть соединена со следующей. Кроме того, некоторые комбинации букв записываются в виде лигатур (особых форм), в частности, лам-алиф لا , которая является единственной обязательной лигатурой (комбинация без лигатуры لا считается трудной для чтения).
Таблица основных букв
Общий | магрибский | Буквенное имя (Классическое произношение) |
Название буквы арабским шрифтом |
Транслитерация _ |
Значение в литературном арабском языке ( IPA ) | Ближайший английский эквивалент в произношении | Контекстные формы | Изолированная форма |
||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Абджади | Хиджаи | Абджади | Хиджаи | Финал | медиальный | Исходный | ||||||
1. | 1. | 1. | 1. | Халиф | أَلِف |
а / ʾ
(также а ) |
различные, в том числе /aː/ , /æ/ |
к а р , к а т | ـا | ا | ||
2. | 2. | 2. | 2. | бах | بَاء | б | / б / | б арн | ـب | ـبـ | بـ | ب |
22. | 3. | 22. | 3. | та' | تَاء | т | / т / | не могу или придерживаюсь _ _ | ـت | ـتـ | تـ | ت |
23. | 4. | 23. | 4. | thāʾ | ثَاء |
й
(также ṯ ) |
/ θ / | чернила _ | ـث | ـثـ | ثـ | ث |
3. | 5. | 3. | 5. | Джим | جِيم |
Дж
(также ǧ ) |
/ d͡ʒ / | г эм | ـج | ـجـ | جـ | ج |
8. | 6. | 8. | 6. | ḥāʾ | حَاء |
ḥħ
(также ḩ ) |
/ ħ / | нет эквивалента
(глоточный h , может быть аппроксимирован как шепчущий h at ) |
ـح | ـحـ | حـ | ح |
24. | 7. | 24. | 7. | ха' | خَاء |
кх
(также ḫ , ḵ , ẖ ) |
/ х / | шотландский ло ч | ـخ | ـخـ | خـ | خ |
4. | 8. | 4. | 8. | дал | دَال | г | / д / | г ухо | ـد | د | ||
25. | 9. | 25. | 9. | дхал | ذَال |
дх
(также ḏ ) |
/ р / | й в | ـذ | ذ | ||
20. | 10. | 20. | 10. | рах | رَاء | р | / р / | шотландский английский творог , испанский рулет r as in p r o | ـر | ر | ||
7. | 11. | 7. | 11. | зай / зайн | زَاي | г | / з / | з ебра | ـز | ز | ||
15. | 12. | 21. | 24. | грех | سِين | с | / с / | с в | ـس | ـسـ | سـ | س |
21. | 13. | 28. | 25. | шинь | شِين |
ш
(также Ш ) |
/ ʃ / | ш в | ـش | ـشـ | شـ | Á |
18. | 14. | 15. | 18. | грустный | صَاد |
с
(также ş ) |
/ сˤ / | нет эквивалента
(можно аппроксимировать соусом, но с пережатым горлом) |
ـص | ـصـ | صـ | ص |
26. | 15. | 18. | 19. | папа | ضَاد |
ḍ
(также ḑ ) |
/ дˤ / | нет эквивалента
(можно аппроксимировать с рассветом , но с пережатым горлом) |
ـض | ـضـ | ضـ | Ê |
9. | 16. | 9. | 12. | та' | طَاء |
т
(также ţ ) |
/ тˤ / | нет эквивалента
(можно аппроксимировать с помощью table , но с пережатым горлом) |
ـط | ـطـ | طـ | ط |
27. | 17. | 26. | 13. | ẓāʾ | ظَاء |
ẓ
(также z̧ ) |
/ ðˤ / | нет эквивалента
(можно приблизиться к любому из них , но с пережатым горлом) |
ـظ | ـظـ | ظـ | ø |
16. | 18. | 16. | 20. | айн | عَيْن | ʿ | / ʕ / | нет эквивалента
(похоже на ḥāʾ выше, но озвучено) |
ـع | ـعـ | عـ | ع |
28. | 19. | 27. | 21. | гайн | غَيْن |
гх
(также ġ , ḡ ) |
/ ɣ / | нет эквивалента
(испанский abo g ado ) |
ـغ | ـغـ | غـ | غ |
17. | 20. | 17. | 22. | фах | فَاء | ф | / ф / | ф ар | ـف | ـفـ | فـ | ف |
19. | 21. | 19. | 23. | каф | قَاف | д | / к / | нет эквивалента
(похоже на пойманный , но произносится дальше во рту.) |
ـق | ـقـ | قـ | ق |
11. | 22. | 11. | 14. | каф | كَاف | к | / к / | с ап | ـك | ـكـ | كـ | ك |
12. | 23. | 12. | 15. | лам | لاَم | л | / л / | л ампер | ـل | ـلـ | لـ | ل |
13. | 24. | 13. | 16. | мим | مِيم | м | / м / | я е | ـم | ـمـ | مـ | م |
14. | 25. | 14. | 17. | монахиня | نُون | н | / н / | п ип | ـن | ـنـ | نـ | ن |
5. | 26. | 5. | 26. | ха' | هَاء | час | / ч / | ч в | ـه | ـهـ | هـ | ه |
6. | 27. | 6. | 27. | вау | وَاو | ш / ш / ∅ | / ш / , / иː / , ∅ | мокро , бассейн _ _ _ | ـو | و | ||
10. | 28. | 10. | 28. | я | يَاء | у / я | / j / , / яː / | Ёси , мээ т _ _ | ـي | ـيـ | يـ | ي |
|
хамза | هَمْزة | ʾ | / ʔ / |
э - э
(она же « гортанная остановка ») |
ء
(используется в основном в средней и конечной позиции, которая представляет собой несвязанную букву) |
||||||
алиф хамза | أَلِف هَمْزة | ـأ | أ | |||||||||
ـإ | إ | |||||||||||
вав хамза | وَاو هَمْزة | ـؤ | ؤ | |||||||||
ях хамза | يَاء هَمْزة | ـئ | ـئـ | ئـ | ئ | |||||||
Халиф Мадда | أَلِف مَدَّة | ʾā | / ʔ ː / _ | ـآ | آ | |||||||
та' марбутах | تاء مربوطة | ـة | (только конец ) | ة | ||||||||
алиф максура | الف مقصورة | ـى | (только конец) |
ى |
Заметки
- Подробнее о различных схемах транслитерации см. В статье «Латинизация арабского языка ». Носители арабского языка обычно могут не следовать стандартной схеме при расшифровке слов или имен. Некоторые арабские буквы, не имеющие эквивалента в английском языке (например, ق), при романизации часто пишутся как цифры. Также имена регулярно расшифровываются как произносимые на местном языке, а не как произносимые на литературном арабском языке (если они имели арабское происхождение).
- Что касается произношения, то приводятся фонематические значения современного стандартного арабского языка, который преподается в школах и университетах. На практике произношение может значительно различаться от региона к региону. Дополнительные сведения о произношении арабского языка см. в статьях « Арабская фонология и разновидности арабского языка» .
- Названия арабских букв можно рассматривать как абстракции более старой версии, где они были значащими словами протосемитского языка. Названия арабских букв в народе могут иметь совершенно разные названия.
- Шесть букв ( و ز ر ذ د ا ) не имеют четкой средней формы и должны быть написаны в их окончательной форме, не соединяясь со следующей буквой. Их исходная форма соответствует изолированной форме. Следующая буква пишется в своей начальной форме или изолированной форме, если она является последней буквой в слове.
- Буква алиф возникла в финикийском алфавите как согласный знак, указывающий на гортанную смычку. Сегодня он утратил свою функцию согласного и вместе с ya' и wāw является mater lectionis , знаком согласного, заменяющим долгую гласную (см. ниже), или в качестве поддержки некоторых диакритических знаков ( мадда и хамза ).
- В арабском языке в настоящее время используется диакритический знак ء , называемый хамза , для обозначения гортанной смычки [ʔ] , написанной отдельно или с носителем:
- один: ء
- с носителем: إ أ (над или под алифом ), ؤ (над вау ), ئ (над безточечным йа ' или йа ' хамза ).
- В академической работе хамза ( ء ) транслитерируется буквой-модификатором правого полукольца (ʾ), а буква-модификатор левого полукольца (ʿ) транслитерирует букву «айн» ( ع ), которая представляет другой звук, не встречающийся в Английский.
- Хамза имеет единую форму, так как она никогда не связана с предшествующей или последующей буквой . Однако иногда он сочетается с wāw , yā' или alif , и в этом случае носитель ведет себя как обычный wāw , yā' или alif .
Вариации
ي و ه ن م ل ك ق ف غ ع ظ ط ض ص ش س ز ر ذ د خ ح ج ث ت ب ا | последовательность хиджаи | |
• | Ното Насталик урду | |
• | Шахерезада Новая | |
• | Латиф | |
• | Ното Насх арабский | |
• | Текст Маркази | |
• | Ното Санс арабский | |
• | Эль Мессири | |
• | лимонада | |
• | Чанга | |
• | Мада | |
• | ното куфи арабский | |
• | Рим Куфи | |
• | Лалезар | |
• | Джомхурия | |
• | Раккас | |
غ ظ ض ذ خ ث ت ش ر ق ص ف ع س ن م ل ك ي ط ح ز و ه د ج ب أ | последовательность абджади | |
• | Ното Насталик урду | |
• | Шахерезада Новая | |
• | Латиф | |
• | Ното Насх арабский | |
• | Текст Маркази | |
• | Ното Санс арабский | |
• | Эль Мессири | |
• | лимонада | |
• | Чанга | |
• | Мада | |
• | ното куфи арабский | |
• | Рим Куфи | |
• | Лалезар | |
• | Джомхурия | |
• | Раккас |
Алиф
Контекст | Форма | Ценность | Ближайший английский эквивалент |
---|---|---|---|
Без диакритических знаков | ا |
|
|
С хамзой _
( хамза алиф ) |
أ |
|
|
С хамзой под
( хамза алиф ) |
إ |
|
|
С маддой | آ |
|
|
С васла | ٱ |
|
|
Модифицированные буквы
Ниже приведены не отдельные буквы, а различные контекстуальные варианты некоторых арабских букв.
Условные формы | Имя | Транслит. | Фонематическая ценность (IPA) | |||
---|---|---|---|---|---|---|
Изолированный | Финал | медиальный | Исходный | |||
آ | ـآ | آ |
Халиф Мадда
( أَلِفْ مَدَّة ) |
ʾā | / ʔaː / (также известное как « удлинение / подчеркивание» алиф ) | |
ة | ـة |
та' марбутах
( تَاءْ مَرْبُوطَة ) |
ч или т / ẗ |
(он же « коррелированный та ' »)
используется только в конечной позиции и для обозначения существительного/слова женского рода или для придания существительному/слову женского рода; однако в редких неправильных падежах существительных / слов оно, по-видимому, обозначает «мужской род»; существительные в единственном числе: /a/ , существительные во множественном числе: āt (предыдущая буква, за которой следует фатха алиф + tāʾ = ـَات ) |
||
ى | ـى | алиф максура (أَلِفْ مَقْصُورَة) | а / а / ỳ | Два использования: 1. Буква под названием أَلِفْ مَقْصُورَة alif maqṣūrah или ْأَلِف لَيِّنَة alif layyinah , произносится /aː/ на современном стандартном арабском языке. Он используется только в конце слов в некоторых особых случаях для обозначения среднего / неженского рода аспекта слова (в основном глаголы), где tā' marbūṭah не может использоваться. |
Лигатуры
Использование лигатуры в арабском языке распространено. Существует одна обязательная лигатура для лам ل + алиф ا, которая существует в двух формах. Все остальные лигатуры, которых много, являются необязательными.
Контекстные формы | Имя | Транс. | Ценность | |||
---|---|---|---|---|---|---|
Финал | медиальный | Исходный | Изолированный | |||
ﻼ | ﻻ | лам + алиф | лаа | / лаː / | ||
ﲓ | ﳰ | ﳝ | ﱘ | я + мим | я | /я/ |
ﲅ | ﳭ | ﳌ | ﱂ | лам + мим | лм | /лм/ |
Более сложная лигатура, которая объединяет до семи различных компонентов, обычно используется для обозначения слова « Аллах» .
Единственная лигатура в основном диапазоне арабского письма в Unicode (U+06xx) — это lām + alif . Это единственный обязательный параметр для шрифтов и текстовых редакторов. Другие диапазоны предназначены для совместимости со старыми стандартами и содержат другие лигатуры, которые являются необязательными.
-
лам + алиф
- لا
Примечание. Unicode также имеет в своем диапазоне FExx формы представления B код для этой лигатуры. Если ваш браузер и шрифт правильно настроены для арабского языка, отображаемая выше лигатура должна быть идентична этой, U+FEFB
АРАБСКАЯ ЛИГАТУРА ЛАМ С ИЗОЛИРОВАННОЙ ФОРМОЙ АЛЕФ:
- ﻻ
-
U+0640
АРАБСКИЙ ТАТВИЛ + лам + алиф- ـلا
Примечание. Unicode также имеет в своей форме представления B диапазон U + FExx код для этой лигатуры. Если ваш браузер и шрифт правильно настроены для арабского языка, отображаемая выше лигатура должна быть идентична этой:
-
U+FEFC
АРАБСКАЯ ЛИГАТУРА ЛАМ С АЛЕФ ОКОНЧАТЕЛЬНАЯ ФОРМА- ﻼ
Другая лигатура в форме представления Unicode A в диапазоне от U + FB50 до U + FDxx - это специальный код глифа для лигатуры Allāh («Бог»), U+FDF2
АРАБСКАЯ ЛИГАТУРА ALLAH ИЗОЛИРОВАННАЯ ФОРМА:
- ﷲ
Это обходной путь для недостатков большинства текстовых процессоров, которые не способны отображать правильные знаки гласных для слова Аллах в Коране . Поскольку арабский шрифт используется для написания других текстов, а не только Корана, перевод лам + лам + ха ' как предыдущая лигатура считается ошибочным.
Этот упрощенный стиль часто предпочтительнее для ясности, особенно в неарабских языках, но может считаться неуместным в ситуациях, когда предпочтительнее более сложный стиль каллиграфии. – СИЛ Интернэшнл
Если на компьютере установлен один из нескольких шрифтов (Noto Naskh Arabic, mry_KacstQurn, KacstOne, Nadeem, DejaVu Sans, Harmattan, Scheherazade, Lateef, Iran Sans, Baghdad, DecoType Naskh) (Iranian Sans поддерживается веб-сайтом Викимедиа). шрифты), слово будет отображаться без диакритических знаков.
-
lām + lām + hā' = LILLĀH (что означает«Аллаху [только Богу]»)
- لله или لله
-
alif + lām + lām + hā' = ALLĀH (арабское слово, означающее «бог»)
- الله или الله
-
алиф + лам + лам + АРАБСКАЯ ШАДДА +АРАБСКОЙБУКВЫ АЛЕФ + ха'
U+0651
U+0670
- اللّٰه ( DejaVu Sans и KacstOne не показывают добавленный верхний индекс Алеф)
Попытка отобразить их на неисправных шрифтах без автоматического добавления знака удвоения и надстрочного индекса alif, хотя и может не отображаться должным образом во всех браузерах, заключается в добавлении U+200d
(соединитель нулевой ширины) после первого или второго лама.
- ( алиф +) лам + лам + СОЕДИНИТЕЛЬ НУЛЕВОЙ
U+200d
ШИРИНЫ + hā'- الله لله
Близнецы
Геминация – удвоение согласного. Вместо того, чтобы писать букву дважды, в арабском языке над ней ставится W - образный знак, называемый шадда . Обратите внимание, что если между двумя согласными стоит гласная, буква просто будет написана дважды. Диакритический знак появляется только там, где согласная в конце одного слога идентична начальной согласной следующего слога. (Общий термин для таких диакритических знаков — харакат ).
Общий Юникод | Имя | Имя арабской вязью | Транслитерация | |
---|---|---|---|---|
0651 |
ــّـ |
шадда | شَدَّة | (согласная удвоенная) |
Нунация
Нунация ( арабский : تنوين tanwīn ) -- это добавление конечной -n к существительному или прилагательному . Гласная перед ней указывает на грамматический падеж . В письменном арабском нунация обозначается удвоением гласного диакритического знака в конце слова.
Гласные
Пользователи арабского языка обычно пишут долгие гласные , но опускают короткие, поэтому читатели должны использовать свои знания языка, чтобы вставить пропущенные гласные. Однако в системе образования и особенно на занятиях по арабской грамматике эти гласные используются, поскольку они имеют решающее значение для грамматики. Арабское предложение может иметь совершенно другое значение из-за тонкой смены гласных. Вот почему в таком важном тексте, как Коран , обязательны три основных знака гласных (см. ниже), такие как харакат и все другие диакритические знаки или другие типы знаков, например знаки кантилляции .
Краткие гласные
В повседневном арабском почерке, в общих публикациях и на уличных знаках краткие гласные обычно не пишутся. С другой стороны, копии Корана не могут быть одобрены религиозными институтами, которые их рецензируют, если в них не включены диакритические знаки. Детские книги, учебники для начальной школы и грамматика арабского языка в целом в той или иной степени содержат диакритические знаки. Они известны как « вокализованные » тексты.
Краткие гласные могут быть написаны с диакритическими знаками , помещенными выше или ниже согласного, который предшествует им в слоге, названном harakāt . Все арабские гласные, длинные и короткие, следуют за согласной; в арабском языке такие слова, как «Али» или «алиф», например, начинаются с согласного: «Алий , алиф » .
Краткие гласные (полностью вокализованный текст) |
Код | Имя | Имя арабской вязью | Транс. | Ценность | Примечания |
---|---|---|---|---|---|---|
ــَـ | 064Е | жир · ах | فَتْحَة | а | /а/ | Диапазоны от [ æ ] , [ a ] , [ ä ] , [ ɑ ] , [ ɐ ] , до [ e ] , в зависимости от местного диалекта, положения и ударения. |
ــُـ | 064F | дамма | ضَمَّة | ты | / ты / | Диапазоны от [ ʊ ] , [ o ] до [ u ] , в зависимости от местного диалекта, положения и ударения. Приблизительно к английскому «OO» (как «b oo t», но короче) |
ــِـ |
06:50 | Касра | كَسْرَة | я | /я/ | Диапазоны от [ ɪ ] , [ e ] до [ i ] , в зависимости от местного диалекта, положения и ударения. Приблизительно к английскому «I» (как в « pick ») |
Долгие гласные
В полностью озвученном арабском тексте, который можно найти в таких текстах, как Коран , длинный ā , следующий за согласной, отличной от хамзы , пишется с коротким знаком ( fatḥah ) на согласной плюс халиф после нее; длинный ī пишется как знак короткого i ( kasrah ) плюс yāʾ ; и длинный ū как знак короткого u ( ḍammah ) плюс wāw . Вкратце, ᵃa = ā ; ⁱу = я ; и ᵘw = ū . Длинный ā , следующий за хамзой , может быть представлен алиф мадда или свободной хамзой , за которой следует алиф (два последовательных халифа никогда не допускаются в арабском языке).
В таблице ниже показаны гласные, расположенные выше или ниже пунктирного круга, заменяющие основную согласную букву или знак шадда . Для ясности в таблице основные буквы слева, используемые для обозначения этих долгих гласных, показаны только в их изолированной форме. Большинство согласных соединяются слева с alif , wāw и yāʾ , написанными затем в их средней или конечной форме. Кроме того, буква yāʾ в последнем ряду может соединиться с буквой слева от нее, и тогда будет использоваться средняя или начальная форма. Используйте таблицу основных букв, чтобы посмотреть на их фактические глифы и типы соединения.
Юникод | Письмо с диакритическим знаком | Имя | Транс. | Варианты | Ценность |
---|---|---|---|---|---|
064Е 0627 | ـَـا | фатх алиф | а | аа | / аː / |
064Е 0649 | ـَـىٰ | фатха алиф максура | а | аа | |
0650 0649 | ـِـىٖ | касра алиф максура | у | ий | /я/ |
064F 0648 | ـُـو | дамма вав | ū | у/у | / uː / |
0650 064А | ـِـي | касра йах | я | ий | /я/ |
В невокализованном тексте (в котором краткие гласные не отмечены) долгие гласные представлены рассматриваемой гласной: 'alif tawīlah/maqṣūrah , wāw или yāʾ . Долгие гласные, написанные в середине слова невокализованного текста, рассматриваются как согласные с сукун (см. Ниже) в тексте с полными диакритическими знаками. Здесь также для ясности в таблице длинные гласные буквы показаны только в изолированной форме.
Комбинации وا и يا всегда произносятся как wā и yāʾ соответственно. Исключением является суффикс ـوا۟ в окончаниях глаголов, где алиф молчит, что приводит к ū или aw .
Долгие гласные (неозвученный текст) |
Имя | Транс. | Ценность |
---|---|---|---|
0627 _
|
(подразумевается фатха ) алиф | а | / аː / |
0649 г.
|
(подразумевается фатха ) алиф максура | а / г | |
0648 г.
|
(подразумевается хамма ) вав | ū | / uː / |
064А _
|
(подразумевается касра ) yāʾ | я | /я/ |
Кроме того, при транслитерации имен и заимствованных слов носители арабского языка записывают большую часть или все гласные так долго ( ā с ا ʾalif , ē и ī с ي yaʾ , ō и ū с و wāw ), что означает, что он приближается к истинному алфавиту.
Дифтонги
Дифтонги / aj/ и /aw/ представлены в вокализованном тексте следующим образом:
Дифтонги (полностью вокализованный текст) |
Имя | Транс. | Ценность |
---|---|---|---|
064A 064E ـَـي
|
фатх йах | да | /ай/ |
0648 064E ـَـو
|
фатха вав | оу | /оу/ |
пропуск гласных
Арабский слог может быть открытым (оканчивающимся на гласную) или закрытым (оканчивающимся на согласную):
- открытый: CV [согласная-гласная] (долгая или краткая гласная)
- закрытый: CVC (только краткая гласная)
Обычный текст состоит только из ряда согласных и букв, удлиняющих гласные; таким образом, слово qalb , «сердце», пишется qlb , а слово qalaba, «он обернулся», также пишется qlb .
Чтобы написать qalaba без этой двусмысленности, мы могли бы указать, что за буквой l следует короткая буква a , написав над ней фатху .
Чтобы написать qalb , мы бы вместо этого указали, что за l не следует гласная, пометив его диакритическим знаком, называемым sukūn ( ْ ) , например: قلْب .
Это один шаг вниз от полной вокализации, где гласная после q также будет обозначаться фатхой : قَلْب .
Коран традиционно пишется полной вокализацией.
Долгий звук « и » в некоторых изданиях Корана пишется с касрой , за которой следует буква « у » без диакритических знаков , а долгий « у » — через « дамму », за которой следует голая буква «у» . В других эти y и w несут сукун . За пределами Корана последнее соглашение встречается крайне редко, до такой степени, что y с сукун будет однозначно читаться как дифтонг /aj/ , а w с сукун будет читаться как /aw/ .
Например, буквы myl можно читать как английские meel или mail , или (теоретически) также как mayyal или mayil . Но если сукун добавляется к у , то у м не может быть сукуна (поскольку две буквы подряд не могут быть сукун атед ), не может быть хамма (потому что в арабском языке никогда не бывает звука уй , если после него нет другой гласной). y ), и не может иметь касры (поскольку касра перед сукун атед y никогда не встречается вне Корана ), поэтому она должна иметь фатху , и единственное возможное произношение - /маджл/ (имеется в виду миля или даже электронная почта) . Точно так же myt с сукуном над y может быть mayt , но не mayyit и не встречаться , а mwt с сукуном над w может быть только mawt , а не moot ( iw невозможно, когда w закрывает слог).
Знаки гласных всегда пишутся так, как будто гласные и'раб произносятся на самом деле, даже если их необходимо пропустить в реальном произношении. Таким образом, при написании имени Ахмад необязательно помещать сукун на ḥ , но сукун запрещается на d , потому что он будет содержать ḍammah , если последует любое другое слово, как в Aḥmadu zawjī «Ахмад - мой муж» .
Другой пример: предложение, которое на правильном литературном арабском языке должно произноситься Aḥmadu zawjun shirrīr «Ахмад - злой муж», обычно неправильно произносится (из-за влияния местных арабских вариантов) как Aḥmad zawj shirrīr . Тем не менее, для целей арабской грамматики и орфографии оно рассматривается так, как если бы оно не было произнесено неправильно и как если бы за ним следовало еще одно слово, то есть, если добавляются какие-либо знаки гласных, они должны добавляться так, как если бы произношение было Aḥmadu zawjun sharrīrun с tanwīn 'un' в конце. Таким образом, добавление знака un tanwīn в конце r правильно , но на самом деле произнесение этого слова было бы гиперкоррекцией. Кроме того, никогда не будет правильно писать сукун на этом r , даже если в реальном произношении это (и в правильном арабском языке ДОЛЖНО быть) сукун ed.
Конечно, если правильный i'rāb — это сукун , его можно написать по желанию.
Общий Юникод | Имя | Имя арабской вязью | Транслит. | Фонематическая ценность (IPA) | |
---|---|---|---|---|---|
0652 | ــْـ | сукун | سُكُون | (нет гласной с этой согласной буквой или дифтонга с этой длинной гласной буквой) |
∅ |
0670 | ــٰـ | alif khanjariyyah [кинжал 'алиф - меньший 'алиф пишется над согласной] | أَلِف خَنْجَرِيَّة | а | / аː / |
ٰٰ Сукун также используется для транслитерации слов арабским письмом. Персидское слово ماسک ( mâsk , от английского слова «маска»), например, может быть написано с сукун над ﺱ , чтобы показать, что между этой буквой и ک нет гласного звука .
Дополнительные буквы
Региональные вариации
Некоторые буквы имеют традиционно другую форму в определенных регионах:
Письмо | Объяснение | |||
---|---|---|---|---|
Изолированный | Финал | медиальный | Исходный | |
ڛ | ـڛ | ـڛـ | ڛـ | Традиционная форма для обозначения буквы sīn س , используемая в областях, на которые повлияли персидская письменность и бывшая османская письменность , хотя и редко. Также используется в более старых сценариях пушту . |
ڢ | ـڢ | ـڢـ | ڢـ | Традиционный магрибский вариант (за исключением Ливии и Алжира) fā' ف . |
ڧ/ ٯ | ـڧ/ ـٯ | ـڧـ | ڧـ | Традиционный магрибский вариант (за исключением Ливии и Алжира) каф ق . Обычно без точек в изолированных и конечных позициях и с точками в начальной и средней формах. |
ک | ـک | ـکـ | کـ | Альтернативная версия kāf ك, используемая особенно в Магриби под влиянием османского письма или в письме Персидского залива под влиянием персидского письма . |
ی | ـی | ـیـ | یـ | Традиционный стиль написания или печати письма остается таковым в регионе долины Нила (Египет, Судан, Южный Судан и т. д.), а иногда и в Магрибе; yā' ي не имеет точки в изолированной и конечной позиции. Визуально идентичен алиф максура ى ; напоминающее персидско-арабское письмо یـ ـیـ ـی ی , которое также использовалось в османском турецком языке . |
Неродные буквы для стандартного арабского языка
Некоторые модифицированные буквы используются для обозначения неродных звуков современного стандартного арабского языка. Эти буквы используются в транслитерированных именах, заимствованиях и диалектных словах.
Письмо | Ценность | Примечание |
---|---|---|
Иностранные письма | ||
پ | / п / | Это персидское письмо. Иногда используется и в арабском языке при транслитерации иностранных имен и заимствованных слов. Может быть заменен на bā' ب и произносится как таковой. |
ڤ | / в / | Используется в заимствованных словах и диалектных словах вместо fā ' ف . Не путать с ڨ . |
ڥ | Используется в Тунисе, Алжире и Марокко. | |
چ | / т / 1 | Это персидское письмо. Иногда используется также в арабском языке при транслитерации иностранных имен и заимствованных слов, а также в диалектах Персидского залива и арабском языке . Последовательность تش tāʼ - shīn обычно предпочтительнее (например, تشاد для « Чад »). |
/ ʒ / 2 | Используется в Египте и может быть сокращением / d͡ʒ / , где ج произносится / ɡ / . | |
/ ɡ / 3 | Используется в Израиле, например, на дорожных знаках. | |
گ | Это персидское письмо. Иногда используется и в арабском языке. | |
ڨ | Используется в Тунисе и Алжире для заимствований и для диалектного произношения qāf ق в некоторых словах. Не путать с ڤ . | |
ڭ | Используется в Марокко. |
- / t͡ʃ / считается родной фонемой / аллофоном в некоторых диалектах, например, в кувейтском и иракском диалектах.
- / ʒ / считается родной фонемой в левантийских и североафриканских диалектах и как аллофон в других.
- / ɡ / считается родной фонемой / аллофоном в большинстве современных арабских диалектов.
Используется на других языках, кроме арабского
Цифры
Западный (Магриб, Европа) |
Центральный (Ближний Восток) |
Восточный | |
---|---|---|---|
персидский | урду | ||
0 | ٠ | ۰ | ۰ |
1 | ١ | ۱ | ۱ |
2 | ٢ | ۲ | ۲ |
3 | ٣ | ۳ | ۳ |
4 | ٤ | ۴ | ۴ |
5 | ٥ | ۵ | ۵ |
6 | ٦ | ۶ | ۶ |
7 | ٧ | ۷ | ۷ |
8 | ٨ | ۸ | ۸ |
9 | ٩ | ۹ | ۹ |
10 | ١٠ | ۱۰ | ۱۰ |
Вместе с арабским текстом используются два основных вида цифр; Западные арабские цифры и восточные арабские цифры . На большей части территории современной Северной Африки используются обычные западные арабские цифры. Как и в западных арабских цифрах, в восточно-арабских цифрах единицы измерения всегда крайние справа, а наибольшее значение — крайние левые. Восточно-арабские цифры пишутся слева направо.
Буквы как цифры
Кроме того, арабский алфавит можно использовать для представления чисел (числа Абджада ). Это использование основано на порядке алфавита абджади . أ ʾalif равно 1, ب bāʾ равно 2, ج jīm равно 3 и так далее, пока ي yāʾ = 10, ك kāf = 20, ل lām = 30, ..., ر rāʾ = 200, ..., غ ghayn = 1000. Иногда используется для создания хронограмм .
История
Арабский алфавит восходит к набатейскому алфавиту , который использовался для написания набатейского языка . Первым известным текстом на арабском алфавите является надпись конца 4-го века из Джебель-Рамма (50 км к востоку от Акабы ) в Иордании , но первым датированным текстом является трехъязычная надпись в Зебеде в Сирии 512 года. Однако эпиграфическая запись чрезвычайно редок, сохранились только пять определенно доисламских арабских надписей , хотя некоторые другие могут быть доисламскими. Позже над и под буквами были добавлены точки, чтобы различать их. (В арамейском языке было меньше фонем, чем в арабском, и некоторые изначально отдельные арамейские буквы стали неразличимы по форме, так что в ранних письменах 15 различных форм букв должны были соответствовать 28 звукам; ср. столь же неоднозначный алфавит пехлеви . ) Первым сохранившимся документом, в котором определенно используются эти точки, является также первый сохранившийся арабский папирус ( PERF 558 ), датированный апрелем 643 года, хотя они стали обязательными гораздо позже. Важные тексты были и остаются часто запоминаемыми, особенно при запоминании Корана .
Еще позже были введены знаки гласных и хамза , начиная где-то во второй половине 7 века, до первого изобретения сирийской и еврейской вокализации . Первоначально это было сделано с помощью системы красных точек, которая, как говорят, была введена в эксплуатацию в эпоху Омейядов Абу аль-Асвад ад-Дуали точка вверху = a , точка внизу = i , точка на линии = u , а двойные точки обозначают нунацию . Однако это было громоздко и легко спуталось с точками, различающими буквы, поэтому примерно 100 лет спустя была принята современная система. Система была завершена около 786 года аль-Фарахиди .
арабская печать
Средневековая арабская гравюра процветала с 10 по 14 века. Ему посвящались только очень маленькие тексты, обычно для использования в амулетах .
В 1514 году, после изобретения Гутенбергом печатного станка в 1450 году, Грегорио де Грегори, венецианец, опубликовал целый молитвенник арабским шрифтом; он назывался Китаб Салат ас-Саваи и предназначался для восточных христианских общин.
Между 1580 и 1586 годами дизайнер шрифтов Роберт Гранжон разработал арабские шрифты для кардинала Фердинандо де Медичи , а в прессе Медичи в конце 16 века было опубликовано множество христианских молитв и научных арабских текстов.
Монахи- марониты монастыря Маар Кужай в Горном Ливане опубликовали первые на Ближнем Востоке арабские книги, в которых использовался подвижный шрифт. Монахи транслитерировали арабский язык сирийским письмом.
Хотя Наполеону Бонапарту обычно приписывают введение печатного станка в Египет во время его вторжения в эту страну в 1798 году, и хотя он действительно принес печатные станки и машины с арабским шрифтом для печати официальной французской оккупационной газеты Аль-Танбийя («Курьер») , печать на арабском языке началась на несколько столетий раньше.
Ювелир (например, Гутенберг) спроектировал и внедрил на Ближнем Востоке печатный станок с подвижным шрифтом для арабской вязи. Греческий православный монах Абдаллах Захир установил арабский печатный станок с использованием подвижного шрифта в монастыре Святого Иоанна в городе Дхур- эль-Шувайр в Горном Ливане, первый самодельный печатный станок в Ливане с использованием арабского письма. Он лично вырезал формы для шрифтов и отливал шрифт. Первая книга вышла из его типографии в 1734 году; этот пресс продолжал использоваться до 1899 года.
Компьютеры
Арабский алфавит может быть закодирован с использованием нескольких наборов символов , включая ISO-8859-6 , Windows-1256 и Unicode (см. ссылки в информационном окне выше), последнее благодаря «арабскому сегменту», записям от U+0600 до U+06FF. Однако ни один из наборов не указывает форму, которую должен принимать каждый символ в контексте. Механизму рендеринга остается выбрать правильный глиф для отображения для каждого символа.
Каждая буква имеет независимую от позиции кодировку в Unicode , и программное обеспечение для рендеринга может вывести правильную форму глифа (начальную, срединную, конечную или изолированную) из контекста соединения. Это текущая рекомендация. Однако для совместимости с предыдущими стандартами начальная, средняя, конечная и изолированная формы также могут быть закодированы отдельно.
Юникод
Начиная с Unicode 14.0, арабское письмо содержится в следующих блоках :
- Арабский (0600–06FF, 256 символов)
- Приложение на арабском языке (0750–077F, 48 символов)
- Арабский расширенный-A (08A0–08FF, 96 символов)
- Арабский расширенный-B (0870–089F, 41 символ)
- Формы презентации на арабском языке-A (FB50–FDFF, 631 символ)
- Формы презентации на арабском языке-B (FE70–FEFF, 141 символ)
- Цифровые символы Руми (10E60–10E7F, 31 символ)
- Индийские номера Siyaq (1EC70–1ECBF, 68 символов)
- Османские числа сияков (1ED00–1ED4F, 61 символ)
- Арабские математические алфавитные символы (1EE00—1EEFF, 143 символа)
Базовый арабский диапазон кодирует стандартные буквы и диакритические знаки, но не кодирует контекстные формы (U+0621-U+0652 напрямую основан на ISO 8859-6 ). Он также включает наиболее распространенные диакритические знаки и арабо-индийские цифры . От U + 06D6 до U + 06ED кодируют знаки аннотации Корана, такие как «конец аята » ۖ и «начало руб эль хизб » ۞. Диапазон арабских дополнений кодирует варианты букв, которые в основном используются для написания африканских (неарабских) языков. Расширенный арабский диапазон-A кодирует дополнительные аннотации Корана и варианты букв, используемые для различных неарабских языков.
Диапазон арабских презентационных форм-A кодирует контекстуальные формы и лигатуры буквенных вариантов, необходимых для персидского, урду, синдхи и среднеазиатских языков. Диапазон арабских презентационных форм-B кодирует пробельные формы арабских диакритических знаков и более контекстуальные формы букв. Блок арабских математических алфавитных символов кодирует символы, используемые в арабских математических выражениях.
См. также примечания к разделу об измененных буквах .
Клавиатуры
Клавиатуры, разработанные для разных стран, имеют разные раскладки, поэтому владение одним стилем клавиатуры, например, иракским, не переходит в владение другим, например, в Саудовской Аравии. Различия могут включать расположение неалфавитных символов.
Все арабские клавиатуры позволяют вводить латинские символы, например, для URL-адреса в веб-браузере . Таким образом, на каждой арабской клавиатуре отмечены как арабские, так и латинские символы. Обычно латинские символы на арабской клавиатуре соответствуют раскладке QWERTY , но в Северной Африке , где французский язык является наиболее распространенным языком с использованием латинских символов, арабская клавиатура имеет тип AZERTY .
Для кодирования конкретной письменной формы символа в Unicode предусмотрены дополнительные кодовые точки, которые можно использовать для точного выражения желаемой письменной формы. Диапазон арабских форм представления A (от U+FB50 до U+FDFF) содержит лигатуры, а диапазон арабских форм представления B (от U+FE70 до U+FEFF) содержит позиционные варианты. Эти эффекты лучше достигаются в Unicode с помощью объединения нулевой ширины и не-соединителя нулевой ширины , поскольку эти формы представления устарели в Unicode и обычно должны использоваться только внутри программного обеспечения для рендеринга текста; при использовании Unicode в качестве промежуточной формы для преобразования между кодировками символов; или для обратной совместимости с реализациями, которые полагаются на жесткое кодирование форм глифов.
Наконец, кодировка Unicode для арабского языка находится в логическом порядке , то есть символы вводятся и сохраняются в памяти компьютера в том порядке, в котором они пишутся и произносятся, не заботясь о том, в каком направлении они будут отображаться на бумаге или на экран. Опять же, механизм рендеринга должен представить символы в правильном направлении, используя двунаправленные текстовые функции Unicode. В связи с этим, если арабские слова на этой странице написаны слева направо, это указывает на то, что механизм рендеринга Unicode, используемый для их отображения, устарел.
Существуют конкурирующие онлайн-инструменты, например, редактор Yamli, которые позволяют вводить арабские буквы без установки поддержки арабского языка на ПК и без знания раскладки арабской клавиатуры.
Распознавание рукописного ввода
Первая в мире программа такого рода, которая идентифицирует арабский почерк в режиме реального времени, была разработана исследователями из Университета Бен-Гуриона (BGU).
Прототип позволяет пользователю писать арабские слова вручную на электронном экране, который затем анализирует текст и переводит его в печатные арабские буквы за тысячные доли секунды. Уровень ошибок составляет менее трех процентов, по словам доктора Джихада Эль-Саны из отдела компьютерных наук БГУ, который разработал систему вместе со студентом магистратуры Фади Биадси.
Смотрите также
- Абджад цифры
- Древняя южноаравийская письменность
- Алжирский шрифт Брайля
- арабский шрифт Брайля
- арабская каллиграфия
- арабский чат алфавит
- арабские диакритические знаки
- Частота арабских букв
- Арабские математические алфавитные символы
- арабские цифры
- арабская фонология
- Арабский шрифт - о других языках, написанных арабским шрифтом.
- ArabTeX - обеспечивает поддержку арабского языка для TeX и LaTeX .
- куфический
- Современная арабская математическая запись
- Персидско-арабское письмо
- Расм
- Романизация арабского языка
использованная литература
внешние ссылки
- Шаалан, Халед; Раза, Хафса (август 2009 г.). «NERA: Распознавание именованных сущностей для арабского языка» . Журнал Американского общества информационных наук и технологий . 60 (8): 1652–1663. дои : 10.1002/asi.21090 .
- Ресурсы для изучения арабского алфавита
Эта статья содержит основные разделы текста из очень подробной статьи « Арабский алфавит » из французской Википедии, которая была частично переведена на английский язык. Дальнейший перевод этой страницы и его включение в текст приветствуются.