Выполнить ТО 80 тыс км - купить 295 80 22.5.

На заглавную страницу


 FAQ ПО ТРАНСЛИТЕРАЦИИ РАЗЛИЧНЫХ АЛФАВИТОВ

Составил Алексей Макаренко

Редакция от 05.08.05


Q: Как в простом ASCII-тексте (plain text) записать буквы с
   диакритическими знаками?
A: Для точной записи можно воспользоваться нотациями TeX
   (http://www.essex.ac.uk/linguistics/clmt/latex4ling/ [A Guide to
   LaTeX for Linguists]) или HIP (http://pechatnyj-dvor.su/docs.html).
   См. также Приложение 1.
   Или можно просто ставить подходящий значок после буквы (часто этого
   вполне достаточно), например:
   ' -- обычное (acute) ударение, седиль;
   ` -- тупое (grave) ударение;
   ^ -- циркумфлекс, гачек (птичка), бреве;
   ~ -- тильда, седиль, огонок, бреве, перечёркивание;
   = -- черта сверху;
   , -- седилла, огонок;
   " -- две точки сверху (умляут), венгерский долгий умляут;
   : -- две точки сверху (умляут);
   * -- кружок или точка сверху;
   . -- точка сверху;
   / -- перечёркивание (наискосок, горизонтально), обычное ударение;
   \ -- тупое ударение.
   Для германских языков приняты такие замены: aa -- å; ae -- ä и æ;
   oe -- ö и ø; ue -- ü; ss -- ß (eszett).
   Испанские перевёрнутые восклицательный и вопросительный знаки можно
   записывать как в TeX'е: !` и ?`. Испанскую ñ можно заменять на nn.

Q: Как записать кириллические буквы, не входящие в русский алфавит,
   глаголицу, греческий алфавит?
A: HIP-9 поддерживает церковнославянскую и современную кириллицу,
   латинский и греческий алфавиты и глаголицу. Например:
   jь, я, u, f, v -- ять, юс малый, юс большой, фита, ижица.
   jа, jе, jjь, jя, ju -- йотированные гласные;
   ~, \в, \г, \д... \ъ -- простое и буквенные титла, паерок.
   Сербский алфавит в HIP:
   а б в г д <g> е ж з и <j> к л <ль> м н <нь> о п р с т g у ф х ц ч <дж> ш
   Греческий алфавит в HIP:
   а в г д е з и f i к л м н <кс> о п р с т v ф х <пс> w
   <i> -- подписная йота; <с> -- финальная сигма;
   = $ -- тонкое и густое придыхание;
   ' ^ ` -- острое, облечённое и тяжёлое ударение.
   См. также Приложение 2.
   Для тюркской кириллицы также существует казновица Андрея Сергеева
   (http://kz.inet.kz), в которой дополнительные буквы казахского
   алфавита обозначаются с помощью Ь (гласные переднего ряда) и Ъ:
   аь (перевёрнутое е) i нъ (с хвостиком) гъ (перечёркнутое) уь (прямое)
   уъ (прямое перечёркнутое) къ (с хвостиком) оь (перечёркнутое) хъ (как h)

Q: Как записать текст на иврите?
A. В http://speakrus.ru/articles/hebrtran.htm приведены три варианта
   транслитерации (ниже фита заменена на F, как в HIP'е):
   ` b g d h v z x  +  y k l m n $ j p &  q r s  t
   A B G D H W Z Kh Th Y K L M N S E P Tz Q R Sh T
   А Б Г Д Е У З Х  F  И К Л М Н С Э П Ц  Q Р Ш  Т

Q: Как записать знаки фонетической транскрипции?
A: Для международной транскрипции существуют ASCII IPA Эвана Киршенбаума
   (http://www.kirshenbaum.net/IPA/index.html) и частично совпадающая с
   ней X-SAMPA (http://www.phon.ucl.ac.uk/home/sampa/x-sampa.htm).
   Некоторые символы ASCII IPA (подробнее см. Приложение 3.):
   D -- eth; N -- eng; S -- esh; T -- theta; Z -- ezh; A -- рукописное a;
   E -- epsilon; O -- открытое o; V -- перевёрнутое v (закрытое a);
   Y -- перечёркнутое o; W -- oe; @ -- schwa (редуцированное e); & -- ae.
   Для записи кириллической транскрипции дополнительные знаки можно
   взять оттуда же. Смягчение согласной в ASCII IPA обозначается точкой
   с запятой (апострофом обозначается главное ударение).


ПРИЛОЖЕНИЕ 1.
ДИАКРИТИЧЕСКИЕ ЗНАКИ В НОТАЦИИ TEX

(На основе письма от 14.01.2000 в эхоконференции ru.linguist, автор --
Marinais.)

Уже очень давно существует общепринятая  международная система
обозначений, как раз предназначенная для передачи только средствами
ASCII многих символов, которых в ней нет. Это кодовый язык TeX, хорошо
знакомый обычно представителям естественных наук, но как показывают
наблюдения, неизвестный представителям лингвистических. :-)

Хотя этот язык очень богат и сложен, и имеет много не совсем
согласованных расширений, для передачи символов европейских языков,
основанных на латинице, достаточно знать лишь небольшое его вполне
устоявшееся подмножество, которое и перечислено ниже.

Диакритические знаки. Символ ? обозначает букву, которую модифицирует
диакритический знак.

\"? -- диэрезис (умляут, две точки над буквой)
\^? -- циркумфлекс ("крышечка" над буквой)
\'? -- сильное (acute) ударение ("ударение вправо")
\`? -- слабое (grave) ударение ("ударение влево")
\~? -- тильда ("волна" над буквой)
\=? -- макрон ("надчёркивание")
\.? -- точка над
\u? -- бреве (дужка над буквой)
\v? -- гачек ("птичка" над буквой)
\H? -- двойное сильное ударение (венгерский долгий умляут)
\r? -- болле (кружок над буквой)
\c? -- седиль (запятая под буквой)
\d? -- точка под
\b? -- подчёркивание
\k? -- огонок (крючок под буквой снизу справа)

Прочие знаки.

\AE -- лигатура Æ ("склеенные" AE)
\ae -- лигатура æ ("склеенные" ae)
\OE -- лигатура Œ ("склеенные" OE)
\oe -- лигатура œ ("склеенные" oe)
\ss -- лигатура ß (немецкая eszett)
\O  -- Ø (перечеркнутая O)
\o  -- ø (перечеркнутая o)
\i  -- ı (i без точки)
\TH -- заглавная Þ (thorn -- правая половинка Ф)
\th -- строчная þ (thorn)
\DJ -- заглавная Ð (eth -- D с перечёркнутой "палочкой")
\dj -- строчная ð (eth)
\L  -- польская Ł
\l  -- польская ł

Преобразования. (Hа всякий случай. Эти преобразования не являются очень
уж унифицированными, а подобраны в основном как обобщение отдельных
обозначений.) Символ ? обозначает преобразовываемую букву.

?`        -- поворот на 180 градусов
\var?     -- альтернативное написание (применяется в случае,
             когда у символа есть помимо основного еще и менее
             распространенное начертание)
\reflect? -- отображение по горизонтали
\flip?    -- отображение по вертикали
^?        -- верхний индекс
_?        -- нижний индекс


ПРИЛОЖЕНИЕ 2.
ТРАНСЛИТЕРАЦИЯ ГРЕЧЕСКОГО ЛАТИНСКИМИ БУКВАМИ

(На основе письма от 18.04.2005 в эхоконференции ru.linguist, автор --
Mike G. Jurkevich.)

Греческие буквы переводятся в латинские так: a, b, g, d, e (краткое),
z, e (долгое), th, i, k, l, m, n, x, o (краткое), p, r, s, t, y, ph,
ch, ps, o (долгое).

Подписная йота не воспроизводится (отбрасывается), дифтонги и
сочетания согласных перекодируются побуквенно. Тонкое придыхание не
воспроизводится, густое пишется как "h" перед соответствующими гласными,
но после буквы "ро". Краткие и долгие "e" и "o" иногда различаются
надстрочными знаками ("чашка" и прямая черта), но чаще не различаются.
Финальная сигма не различается от обычной. Ударения могут
воспроизводиться, а могут и нет. То же относится к двум точкам над
гласными.


ПРИЛОЖЕНИЕ 3.
МЕЖДУНАРОДНАЯ ФОНЕТИЧЕСКАЯ ТРАНСКРИПЦИЯ

Официальный сайт International Phonetic Association:
http://www2.arts.gla.ac.uk/IPA/

Подробная статья о международной транаскрипции есть также в "Википедии".

Ниже приведены таблицы с официального сайта в нотации ASCII IPA.
Под обозначениями звуков напечатаны стандартные символы IPA и их
Unicode-коды. Таблицы несколько переделаны.

В документации на ASCII IPA аналогичные таблицы приведены в "Appendix D.
Segment Table" (http://www.kirshenbaum.net/IPA/ascii-ipa.pdf и faq.html).

В ASCII IPA силовое ударение обозначается знаками ' (апостроф) и ,
(запятая) перед ударным слогом, тоническое -- цифрами после слога.
Апостроф -- главное ударение, запятая -- второстепенное. Для языков с
регистровыми (ровными) тонами (навахо, йоруба) 1 -- самый низкий тон
и далее номера идут по возрастанию высоты. Для языков с контурными
(скользящими) тонами используется принятая для них нумерация, например,
для мандаринского китайского: 1 -- ровный высокий тон, 2 -- восходящий,
3 -- нисходяще-восходящий, 4 -- нисходящий.


CONSONANTS (PULMONIC)

              Bilabial   Labiodent. Dental  Alveolar      Postalv. Retroflex
Plosive       p   b                 t[  d[  t      d               t.  d.
              p   b                         t      d               ʈ   ɖ
              070 062                       074    064             288 256
Nasal             m          M          n[         n                   n.
                  m          ɱ                     n                   ɳ
                  06D        271                   06E                 273
Trill             b<trl>                           r<trl>
                  ʙ                                r
                  299                              072
Tap or Flap                                        *                   *.
                                                   ɾ                   ɽ
                                                   27E                 27D
Fricative     P   B      f   v      T   D   s      z      S   Z    s.  z.
              ɸ   β      f   v      θ   ð   s      z      ʃ   ʒ    ʂ   ʐ
              278 3B2    066 076    3B8 0F0 073    07A    283 292  282 290
Lateral fric. ////////// //////////         s<lat> z<lat>
              ////////// //////////         ɬ      ɮ
              ////////// //////////         26C    26E
Approximant                  r<lbd>     r[         r                   r.
                             ʋ                     ɹ                   ɻ
                             28B                   279                 27B
Lateral appr. ////////// //////////     l[         l                   l.
              ////////// //////////                l                   ɭ
              ////////// //////////                06C                 26D

              Palatal    Velar      Uvular  Pharyngeal Glottal
Plosive       c   J      k   g      q   G       ////// ?   ////
              c   ɟ      k   ɡ      q   ɢ       ////// ʔ   ////
              063 25F    06B 261    071 262     ////// 294 ////
Nasal             n^         N          n"  ////////// ////////
                  ɲ          ŋ          ɴ   ////////// ////////
                  272        14B        274 ////////// ////////
Trill                    //////////     r"             ////////
                         //////////     ʀ              ////////
                         //////////     280            ////////
Tap or Flap              //////////                    ////////
                         //////////                    ////////
                         //////////                    ////////
Fricative     C   C<vcd> x   Q      X   g"  H   H<vcd> h   h<?>
              ç   ʝ      x   ɣ      χ   ʁ   ħ   ʕ      h   ɦ
              0E7 29D    078 263    3C7 281 127 295    068 266
Lateral fric.                               ////////// ////////
                                            ////////// ////////
                                            ////////// ////////
Approximant       j          j<vel>                    ////////
                  j          ɰ                         ////////
                  06A        270                       ////////
Lateral appr.     l^         L              ////////// ////////
                  ʎ          ʟ              ////////// ////////
                  28E        29F            ////////// ////////

Когда символы приведены попарно, правый обозначает звонкий согласный.
Заштрихованные области (///) обозначают места, где артикуляция считается
невозможной.

Dental, Alveolar, Postalveolar -- в исходной таблице единая колонка,
разбитая только для T/D, s/z и S/Z; также в исходной таблице отсутствуют
t[, d[, n[, r[ и l[, которые в IPA обозначаются соответствующей буквой с
combining bridge below (32A).


OTHER SYMBOLS

w<vls>      Voiceless labial-velar fricative
ʍ
28D
w           Voiced labial-velar approximant
w
077
j<rnd>      Voiced labial-palatal approximant
ɥ
265
*<lat>      Alveolar lateral flap
ɺ
27A
S^   Z^     Alveolo-palatal fricatives
ɕ    ʑ
255  291
S<vel>      Simultaneous S and x
ɧ
267
?<phr>      Epiglottal plosive
ʡ
2A1
h<phr>      Voiceless epiglottal fricative
ʜ
29C
h<phr><vcd> Voiced epiglottal fricative
ʢ
2A2

Affricates and double articulations can be represented by two symbols
joined by a tie bar (361) if necessary.

t<lbv>      "kp" with tie above
d<lbv>      "gb" with tie above
n<lbv>      "ng" with tie above
ts          "ts" with tie above

В исходной таблице отсутствуют d<lbv> и n<lbv>. Порядок строк изменён.


CONSONANTS (NON-PULMONIC)

Clicks                Voiced implosives    Ejectives
                                           `   as in:
                                           ʼ
                                           2BC
p!  Bilabial          b`  Bilabial         p`  Bilabial
ʘ                     ɓ                    pʼ
298                   253
t!  Dental            d`  Dental/alveolar  t[` Dental
ǀ                     ɗ                    tʼ
1C0                   257
S!  (Post)alveolar                         t`  Alveolar
ǃ                                          tʼ
1C3
c!  Palatoalveolar    J`  Palatal          c`  Palatal
ǂ                     ʄ
1C2                   284
                      g`  Velar            k`  Velar
                      ɠ                    kʼ
                      260
l!  Alveolar lateral  G`  Uvular           s`  Alveolar fricative
ǁ                     ʛ                    sʼ
1C1                   29B

В исходной таблице отсутствует c`.

В ASCII IPA есть также k! (velar click) и q` (voiceless uvular
implosive), соответствующие устаревшим turned k (29E), и q with hook
(2A0). q` в IPA обозначается small capital g with hook (29B) с combining
ring below (325).


VOWELS

            Front   Near-front Central    Rhoticized Near-back Back
Close       i   y              i"     u"                       u-  u
            i   y              ɨ      ʉ                        ɯ   u
            069 079            268    289                      26F 075
Near-close          I   I.                               U
                    ɪ   ʏ                                ʊ
                    26A 28F                              28A
Close-mid   e   Y              @<umd> @.  R<umd>               o-  o
            e   ø              ɘ      ɵ                        ɤ   o
            065 0F8            258    275                      264 06F
Mid                            @          R
                               ə          ɚ
                               259        25A
Open-mid    E   W              V"     O"  R<lmd>               V   O
            ɛ   œ              ɜ      ɞ   ɝ                    ʌ   ɔ
            25B 153            25C    25E 25D                  28C 254
Near-open           &          &"
                    æ          ɐ
                    0E6        250
Open        a   &.                    a.                       A   A.
            a   ɶ                                              ɑ   ɒ
            061 276                                            251 252

Когда символы приведены попарно, правый обозначает округленный гласный.
U -- округленный гласный.

Добавлена колонка Rhoticized для неокругленных ротацированных гласных
среднего ряда, поскольку в ASCII IPA они имеют отдельное обозначение
(R = @<r>),


Некоторые различия (IPA / ASCII IPA):

Labiodent. approximant: v with hook                  / r<lbd>
Alveolar   trill:       обычная r                    / r<trl> (возможно, R)
           approximant: turned r                     / просто r
           lat. fric.:  l with belt                  / s<lat>
Palatal    fricative:   j with crossed-tail          / C<vcd> (возможно, j)
Velar      fricative:   gamma                        / Q
Uvular     fricative:   small capital inverted r     / g"
(Post)alv. click:       retroflex click              / возможно, S! или c!
Dental     ejective:    t + modif. letter apostrophe / t[`
Front      near-close:  small capital y              / I.
           close-mid:   o with stroke                / Y
           open-mid:    ligature oe                  / W
           near-open:   ae                           / &
           open:        small capital oe             / &.
Central    near-open:   turned a                     / возможно, &"
           open:        --                           / a.
Rhoticized close-mid:   --                           / R<umd>
           open-mid:    reversed open e with hook    / возможно, R<lmd>
Back       open-mid:    turned v                     / V

В ASCII IPA:
g" отнесён и к фрикативным, и к аппроксимантам;
h отнесён не к фрикативным, а к аппроксимантам;
a отнесён не к переднему ряду, а к среднему;
@. отнесён не к верхне-среднему подъёму, а к среднему;
reversed open e with hook (R<umd>/R<lmd>) в ASCII IPA отнесён не к
нижне-среднему подъёму, а к верхне-среднему.

S!, s`, &" и R<lmd> в ASCII IPA не упомянуты.

S^, Z^, S<vel> и эпиглоттальные звуки (?<phr>, h<phr> и h<phr><vcd>)
в ASCII IPA отсутствуют, это -- попытка их обозначить. Их также можно
записать с помощью зарезервированных символов (% и $) и диакритических
знаков (+ и =).

t!, c! и l! -- для них в ASCII IPA даны устаревшие соответствия:
turned t (287), stretched c (297) и inverted glottal stop (296).

Прочие таблицы (например, диакритических знаком) будут включены сюда
позднее.


TopList
Оформление (C) Арнольд