FAQ ПО ТРАНСЛИТЕРАЦИИ РАЗЛИЧНЫХ АЛФАВИТОВ
Составил Алексей Макаренко
Редакция от 05.08.05
Q: Как в простом ASCII-тексте (plain text) записать буквы с
диакритическими знаками?
A: Для точной записи можно воспользоваться нотациями TeX
(http://www.essex.ac.uk/linguistics/clmt/latex4ling/ [A Guide to
LaTeX for Linguists]) или HIP (http://pechatnyj-dvor.su/docs.html).
См. также Приложение 1.
Или можно просто ставить подходящий значок после буквы (часто этого
вполне достаточно), например:
' -- обычное (acute) ударение, седиль;
` -- тупое (grave) ударение;
^ -- циркумфлекс, гачек (птичка), бреве;
~ -- тильда, седиль, огонок, бреве, перечёркивание;
= -- черта сверху;
, -- седилла, огонок;
" -- две точки сверху (умляут), венгерский долгий умляут;
: -- две точки сверху (умляут);
* -- кружок или точка сверху;
. -- точка сверху;
/ -- перечёркивание (наискосок, горизонтально), обычное ударение;
\ -- тупое ударение.
Для германских языков приняты такие замены: aa -- å; ae -- ä и æ;
oe -- ö и ø; ue -- ü; ss -- ß (eszett).
Испанские перевёрнутые восклицательный и вопросительный знаки можно
записывать как в TeX'е: !` и ?`. Испанскую ñ можно заменять на nn.
Q: Как записать кириллические буквы, не входящие в русский алфавит,
глаголицу, греческий алфавит?
A: HIP-9 поддерживает церковнославянскую и современную кириллицу,
латинский и греческий алфавиты и глаголицу. Например:
jь, я, u, f, v -- ять, юс малый, юс большой, фита, ижица.
jа, jе, jjь, jя, ju -- йотированные гласные;
~, \в, \г, \д... \ъ -- простое и буквенные титла, паерок.
Сербский алфавит в HIP:
а б в г д <g> е ж з и <j> к л <ль> м н <нь> о п р с т g у ф х ц ч <дж> ш
Греческий алфавит в HIP:
а в г д е з и f i к л м н <кс> о п р с т v ф х <пс> w
<i> -- подписная йота; <с> -- финальная сигма;
= $ -- тонкое и густое придыхание;
' ^ ` -- острое, облечённое и тяжёлое ударение.
См. также Приложение 2.
Для тюркской кириллицы также существует казновица Андрея Сергеева
(http://kz.inet.kz), в которой дополнительные буквы казахского
алфавита обозначаются с помощью Ь (гласные переднего ряда) и Ъ:
аь (перевёрнутое е) i нъ (с хвостиком) гъ (перечёркнутое) уь (прямое)
уъ (прямое перечёркнутое) къ (с хвостиком) оь (перечёркнутое) хъ (как h)
Q: Как записать текст на иврите?
A. В http://speakrus.ru/articles/hebrtran.htm приведены три варианта
транслитерации (ниже фита заменена на F, как в HIP'е):
` b g d h v z x + y k l m n $ j p & q r s t
A B G D H W Z Kh Th Y K L M N S E P Tz Q R Sh T
А Б Г Д Е У З Х F И К Л М Н С Э П Ц Q Р Ш Т
Q: Как записать знаки фонетической транскрипции?
A: Для международной транскрипции существуют ASCII IPA Эвана Киршенбаума
(http://www.kirshenbaum.net/IPA/index.html) и частично совпадающая с
ней X-SAMPA (http://www.phon.ucl.ac.uk/home/sampa/x-sampa.htm).
Некоторые символы ASCII IPA (подробнее см. Приложение 3.):
D -- eth; N -- eng; S -- esh; T -- theta; Z -- ezh; A -- рукописное a;
E -- epsilon; O -- открытое o; V -- перевёрнутое v (закрытое a);
Y -- перечёркнутое o; W -- oe; @ -- schwa (редуцированное e); & -- ae.
Для записи кириллической транскрипции дополнительные знаки можно
взять оттуда же. Смягчение согласной в ASCII IPA обозначается точкой
с запятой (апострофом обозначается главное ударение).
ПРИЛОЖЕНИЕ 1.
ДИАКРИТИЧЕСКИЕ ЗНАКИ В НОТАЦИИ TEX
(На основе письма от 14.01.2000 в эхоконференции ru.linguist, автор --
Marinais.)
Уже очень давно существует общепринятая международная система
обозначений, как раз предназначенная для передачи только средствами
ASCII многих символов, которых в ней нет. Это кодовый язык TeX, хорошо
знакомый обычно представителям естественных наук, но как показывают
наблюдения, неизвестный представителям лингвистических. :-)
Хотя этот язык очень богат и сложен, и имеет много не совсем
согласованных расширений, для передачи символов европейских языков,
основанных на латинице, достаточно знать лишь небольшое его вполне
устоявшееся подмножество, которое и перечислено ниже.
Диакритические знаки. Символ ? обозначает букву, которую модифицирует
диакритический знак.
\"? -- диэрезис (умляут, две точки над буквой)
\^? -- циркумфлекс ("крышечка" над буквой)
\'? -- сильное (acute) ударение ("ударение вправо")
\`? -- слабое (grave) ударение ("ударение влево")
\~? -- тильда ("волна" над буквой)
\=? -- макрон ("надчёркивание")
\.? -- точка над
\u? -- бреве (дужка над буквой)
\v? -- гачек ("птичка" над буквой)
\H? -- двойное сильное ударение (венгерский долгий умляут)
\r? -- болле (кружок над буквой)
\c? -- седиль (запятая под буквой)
\d? -- точка под
\b? -- подчёркивание
\k? -- огонок (крючок под буквой снизу справа)
Прочие знаки.
\AE -- лигатура Æ ("склеенные" AE)
\ae -- лигатура æ ("склеенные" ae)
\OE -- лигатура Œ ("склеенные" OE)
\oe -- лигатура œ ("склеенные" oe)
\ss -- лигатура ß (немецкая eszett)
\O -- Ø (перечеркнутая O)
\o -- ø (перечеркнутая o)
\i -- ı (i без точки)
\TH -- заглавная Þ (thorn -- правая половинка Ф)
\th -- строчная þ (thorn)
\DJ -- заглавная Ð (eth -- D с перечёркнутой "палочкой")
\dj -- строчная ð (eth)
\L -- польская Ł
\l -- польская ł
Преобразования. (Hа всякий случай. Эти преобразования не являются очень
уж унифицированными, а подобраны в основном как обобщение отдельных
обозначений.) Символ ? обозначает преобразовываемую букву.
?` -- поворот на 180 градусов
\var? -- альтернативное написание (применяется в случае,
когда у символа есть помимо основного еще и менее
распространенное начертание)
\reflect? -- отображение по горизонтали
\flip? -- отображение по вертикали
^? -- верхний индекс
_? -- нижний индекс
ПРИЛОЖЕНИЕ 2.
ТРАНСЛИТЕРАЦИЯ ГРЕЧЕСКОГО ЛАТИНСКИМИ БУКВАМИ
(На основе письма от 18.04.2005 в эхоконференции ru.linguist, автор --
Mike G. Jurkevich.)
Греческие буквы переводятся в латинские так: a, b, g, d, e (краткое),
z, e (долгое), th, i, k, l, m, n, x, o (краткое), p, r, s, t, y, ph,
ch, ps, o (долгое).
Подписная йота не воспроизводится (отбрасывается), дифтонги и
сочетания согласных перекодируются побуквенно. Тонкое придыхание не
воспроизводится, густое пишется как "h" перед соответствующими гласными,
но после буквы "ро". Краткие и долгие "e" и "o" иногда различаются
надстрочными знаками ("чашка" и прямая черта), но чаще не различаются.
Финальная сигма не различается от обычной. Ударения могут
воспроизводиться, а могут и нет. То же относится к двум точкам над
гласными.
ПРИЛОЖЕНИЕ 3.
МЕЖДУНАРОДНАЯ ФОНЕТИЧЕСКАЯ ТРАНСКРИПЦИЯ
Официальный сайт International Phonetic Association:
http://www2.arts.gla.ac.uk/IPA/
Подробная статья о международной транаскрипции есть также в "Википедии".
Ниже приведены таблицы с официального сайта в нотации ASCII IPA.
Под обозначениями звуков напечатаны стандартные символы IPA и их
Unicode-коды. Таблицы несколько переделаны.
В документации на ASCII IPA аналогичные таблицы приведены в "Appendix D.
Segment Table" (http://www.kirshenbaum.net/IPA/ascii-ipa.pdf и faq.html).
В ASCII IPA силовое ударение обозначается знаками ' (апостроф) и ,
(запятая) перед ударным слогом, тоническое -- цифрами после слога.
Апостроф -- главное ударение, запятая -- второстепенное. Для языков с
регистровыми (ровными) тонами (навахо, йоруба) 1 -- самый низкий тон
и далее номера идут по возрастанию высоты. Для языков с контурными
(скользящими) тонами используется принятая для них нумерация, например,
для мандаринского китайского: 1 -- ровный высокий тон, 2 -- восходящий,
3 -- нисходяще-восходящий, 4 -- нисходящий.
CONSONANTS (PULMONIC)
Bilabial Labiodent. Dental Alveolar Postalv. Retroflex
Plosive p b t[ d[ t d t. d.
p b t d ʈ ɖ
070 062 074 064 288 256
Nasal m M n[ n n.
m ɱ n ɳ
06D 271 06E 273
Trill b<trl> r<trl>
ʙ r
299 072
Tap or Flap * *.
ɾ ɽ
27E 27D
Fricative P B f v T D s z S Z s. z.
ɸ β f v θ ð s z ʃ ʒ ʂ ʐ
278 3B2 066 076 3B8 0F0 073 07A 283 292 282 290
Lateral fric. ////////// ////////// s<lat> z<lat>
////////// ////////// ɬ ɮ
////////// ////////// 26C 26E
Approximant r<lbd> r[ r r.
ʋ ɹ ɻ
28B 279 27B
Lateral appr. ////////// ////////// l[ l l.
////////// ////////// l ɭ
////////// ////////// 06C 26D
Palatal Velar Uvular Pharyngeal Glottal
Plosive c J k g q G ////// ? ////
c ɟ k ɡ q ɢ ////// ʔ ////
063 25F 06B 261 071 262 ////// 294 ////
Nasal n^ N n" ////////// ////////
ɲ ŋ ɴ ////////// ////////
272 14B 274 ////////// ////////
Trill ////////// r" ////////
////////// ʀ ////////
////////// 280 ////////
Tap or Flap ////////// ////////
////////// ////////
////////// ////////
Fricative C C<vcd> x Q X g" H H<vcd> h h<?>
ç ʝ x ɣ χ ʁ ħ ʕ h ɦ
0E7 29D 078 263 3C7 281 127 295 068 266
Lateral fric. ////////// ////////
////////// ////////
////////// ////////
Approximant j j<vel> ////////
j ɰ ////////
06A 270 ////////
Lateral appr. l^ L ////////// ////////
ʎ ʟ ////////// ////////
28E 29F ////////// ////////
Когда символы приведены попарно, правый обозначает звонкий согласный.
Заштрихованные области (///) обозначают места, где артикуляция считается
невозможной.
Dental, Alveolar, Postalveolar -- в исходной таблице единая колонка,
разбитая только для T/D, s/z и S/Z; также в исходной таблице отсутствуют
t[, d[, n[, r[ и l[, которые в IPA обозначаются соответствующей буквой с
combining bridge below (32A).
OTHER SYMBOLS
w<vls> Voiceless labial-velar fricative
ʍ
28D
w Voiced labial-velar approximant
w
077
j<rnd> Voiced labial-palatal approximant
ɥ
265
*<lat> Alveolar lateral flap
ɺ
27A
S^ Z^ Alveolo-palatal fricatives
ɕ ʑ
255 291
S<vel> Simultaneous S and x
ɧ
267
?<phr> Epiglottal plosive
ʡ
2A1
h<phr> Voiceless epiglottal fricative
ʜ
29C
h<phr><vcd> Voiced epiglottal fricative
ʢ
2A2
Affricates and double articulations can be represented by two symbols
joined by a tie bar (361) if necessary.
t<lbv> "kp" with tie above
d<lbv> "gb" with tie above
n<lbv> "ng" with tie above
ts "ts" with tie above
В исходной таблице отсутствуют d<lbv> и n<lbv>. Порядок строк изменён.
CONSONANTS (NON-PULMONIC)
Clicks Voiced implosives Ejectives
` as in:
ʼ
2BC
p! Bilabial b` Bilabial p` Bilabial
ʘ ɓ pʼ
298 253
t! Dental d` Dental/alveolar t[` Dental
ǀ ɗ tʼ
1C0 257
S! (Post)alveolar t` Alveolar
ǃ tʼ
1C3
c! Palatoalveolar J` Palatal c` Palatal
ǂ ʄ
1C2 284
g` Velar k` Velar
ɠ kʼ
260
l! Alveolar lateral G` Uvular s` Alveolar fricative
ǁ ʛ sʼ
1C1 29B
В исходной таблице отсутствует c`.
В ASCII IPA есть также k! (velar click) и q` (voiceless uvular
implosive), соответствующие устаревшим turned k (29E), и q with hook
(2A0). q` в IPA обозначается small capital g with hook (29B) с combining
ring below (325).
VOWELS
Front Near-front Central Rhoticized Near-back Back
Close i y i" u" u- u
i y ɨ ʉ ɯ u
069 079 268 289 26F 075
Near-close I I. U
ɪ ʏ ʊ
26A 28F 28A
Close-mid e Y @<umd> @. R<umd> o- o
e ø ɘ ɵ ɤ o
065 0F8 258 275 264 06F
Mid @ R
ə ɚ
259 25A
Open-mid E W V" O" R<lmd> V O
ɛ œ ɜ ɞ ɝ ʌ ɔ
25B 153 25C 25E 25D 28C 254
Near-open & &"
æ ɐ
0E6 250
Open a &. a. A A.
a ɶ ɑ ɒ
061 276 251 252
Когда символы приведены попарно, правый обозначает округленный гласный.
U -- округленный гласный.
Добавлена колонка Rhoticized для неокругленных ротацированных гласных
среднего ряда, поскольку в ASCII IPA они имеют отдельное обозначение
(R = @<r>),
Некоторые различия (IPA / ASCII IPA):
Labiodent. approximant: v with hook / r<lbd>
Alveolar trill: обычная r / r<trl> (возможно, R)
approximant: turned r / просто r
lat. fric.: l with belt / s<lat>
Palatal fricative: j with crossed-tail / C<vcd> (возможно, j)
Velar fricative: gamma / Q
Uvular fricative: small capital inverted r / g"
(Post)alv. click: retroflex click / возможно, S! или c!
Dental ejective: t + modif. letter apostrophe / t[`
Front near-close: small capital y / I.
close-mid: o with stroke / Y
open-mid: ligature oe / W
near-open: ae / &
open: small capital oe / &.
Central near-open: turned a / возможно, &"
open: -- / a.
Rhoticized close-mid: -- / R<umd>
open-mid: reversed open e with hook / возможно, R<lmd>
Back open-mid: turned v / V
В ASCII IPA:
g" отнесён и к фрикативным, и к аппроксимантам;
h отнесён не к фрикативным, а к аппроксимантам;
a отнесён не к переднему ряду, а к среднему;
@. отнесён не к верхне-среднему подъёму, а к среднему;
reversed open e with hook (R<umd>/R<lmd>) в ASCII IPA отнесён не к
нижне-среднему подъёму, а к верхне-среднему.
S!, s`, &" и R<lmd> в ASCII IPA не упомянуты.
S^, Z^, S<vel> и эпиглоттальные звуки (?<phr>, h<phr> и h<phr><vcd>)
в ASCII IPA отсутствуют, это -- попытка их обозначить. Их также можно
записать с помощью зарезервированных символов (% и $) и диакритических
знаков (+ и =).
t!, c! и l! -- для них в ASCII IPA даны устаревшие соответствия:
turned t (287), stretched c (297) и inverted glottal stop (296).
Прочие таблицы (например, диакритических знаком) будут включены сюда
позднее.