Диакритические знаки

Статья на основе материалов из Википедии

Диакрити́ческие зна́ки ( — «служащий для различения» от — «способный к различению»):

  • в лингвистике — различные надстрочные, подстрочные, реже внутристрочные знаки, применяемые в буквенных (в том числе консонантных) и слоговых системах письма не как самостоятельные обозначения звуков, а для изменения или уточнения значения других знаков;
  • в типографике — элементы письменности, модифицирующие начертание знаков и обычно набираемые отдельно.

Иногда дополнительно требуют, чтобы диакритические знаки были меньшего размера, чем буквы.

Синонимические названия: акценты (более узкое по значению), диакри́тики (профессионально-жаргонное; в ед. ч. диакри́тик, м. р., реже диакри́тика, ж. р.). Система диакритических знаков какой-либо письменности или текста также называется диакри́тикой.

В некоторых случаях с одной буквой могут употребляться одновременно два, три или даже четыре диакритических знака: , , .

Огласовки в консонантных системах письма (например, в иврите, арабском и сирийском языках), по внешнему виду близкие к диакритическим знакам, по смыслу являются скорее особой разновидностью букв.

К диакритикам прибегают в случае, если букв алфавита не хватает для передачи звуков речи или же для смыслоразличения. Основной альтернативой диакритикам при звукоразличении служат сочетания двух (диграфы), трёх (триграфы) и более букв для обозначения одного звука. Например, звук [] передаётся буквой š в ряде языков, или диграфом ch во французском, португальском, или sh в английском, или триграфом sch в немецком. Диакритики употребляются как с гласными, так и с согласными буквами. Основной недостаток диакритиков — загромождение письма мелкими, но важными деталями, опущение которых может привести к серьёзным ошибкам. Существуют языки, в которых диакритические знаки не столь распространены (русский) или практически не используются (английский). В некоторых случаях имеется тенденция к вытеснению диакритизованных букв диграфами (немецкий: öое в печатном тексте и компьютеризации, однако с развитием поддержки умляутов это явление практически сошло на нет).

История

Древнейшими диакритическими знаками были, вероятно, древнегреческие знаки ударения и придыхания, изобретение которых приписывается Аристофану Византийскому.

Диакритики широко используются в языках, использующих латинский алфавит. Это связано с тем, что в классическом латинском языке не было шипящих звуков, носовых гласных, палатализованных (смягчённых) согласных, которые имелись или развились в других языках, особенно неродственных. Так, если в итальянском возможна передача шипящих чисто позиционно (например, в слове città «читта» — «город», где c+i автоматически означают шипящий звук), то в других языках, не связанных с латынью, это невозможно. Наиболее загружены звукоразличительными диакритиками чешский, словацкий, турецкий, румынский, польский, латышский, литовский, вьетнамский алфавиты. В португальском и французском языках сильной диакритизации подвергаются гласные буквы (ê, è, ë, ï, ã) — как звуко- и смыслоразличительной, так и чисто этимологической: îlе < лат. insula «остров». В романских языках имеется и особый диакритизованный согласный ç, в испанском — буква ñ, возникшая в результате надстрочного «двухэтажного» написания двух букв nn в латинских словах типа annum > anno > аñо «год».

Классификация

Диакритические знаки можно классифицировать различными способами.

  1. По месту начертания: надстрочные, подстрочные, внутристрочные.
  2. По способу начертания: свободно приставляемые к основному знаку или требующие изменить и его форму.
  3. По фонетико-орфографическому значению (классификация неполная и категории не взаимоисключающие):
  4. знаки, имеющие фонетическое значение (влияющие на произношение):
  5. знаки, придающие букве новое звуковое значение, отличное от обычного алфавитного (например, чешские č, ř, ž);
  6. знаки, уточняющие варианты произношения какого-либо звука (например, французские é, è, ê);
  7. знаки, указывающие на то, что буква сохраняет своё стандартное значение в таком окружении, когда её звучание должно меняться (например, французские же ï);
  8. просодические знаки (уточняющие количественные параметры звука: длительность, силу, высоту и т. п.):
  9. знаки долготы и краткости гласных (например, древнегреческие , );
  10. знаки музыкальных тонов (например, китайские ā, á, ǎ, à, a);
  11. знаки ударения (например, греческие «острое», «тяжёлое» и «облечённое» ударения: ά, , );
  12. знаки, имеющие только орфографическое значение, но не влияющие на произношение:
  13. знаки, позволяющие избегать омографию (например, в церковнославянском различаются твор. пад. ед. числа «ма́лымъ» и дат. пад. множ. числа «мâлымъ»; в испанском si «если» и Sí «да»);
  14. знаки, ничего не обозначающие и использующиеся по традиции (например, придыхание в церковнославянском, которое всегда пишется над первой буквой слова, если та — гласная);
  15. знаки иероглифического значения (считаются диакритическими только с позиций типографики):
  16. знаки, указывающие на сокращённое или условное написание (например, титла в церковнославянском);
  17. знаки, указывающие на применение букв для других целей (те же титла в кириллической записи чисел).
  18. По формальному статусу:
  19. знаки, с помощью которых образуются новые буквы алфавита (в западной терминологии их иногда называют модификаторами, а не собственно диакритическими знаками);
  20. знаки, сочетания букв с которыми не считается отдельной буквой (такие диакритические знаки обычно не влияют на порядок алфавитной сортировки).
  21. По обязательности использования:
  22. знаки, отсутствие которых делает текст орфографически неверным, а иногда и нечитаемым,
  23. знаки, используемые только в особых обстоятельствах: в книгах для начального обучения чтению, в священных текстах, в редких словах с неоднозначным чтением и т. п.

При необходимости (например, в случае технических ограничений) диакритический знак может опускаться, иногда со вставкой или заменой букв слова.

Одинаково выглядящие диакритические знаки могут иметь разное значение, название и статус в различных языках и системах письма.

Отнесение того или иного элемента графической системы к диакритическим знакам в большой мере условно. Так, в современной русской письменности можно найти «диакритические знаки» разной бесспорности (от абсолютной до почти нулевой):

  • ударения — ставятся только в редких случаях и не образуют новых букв;
  • две точки над «ё» — образует новую букву, но часто опускается;
  • кратка над «й» — образует новую букву и никогда не опускается;
  • надчёркивание и подчёркивание похоже выглядящих при письме от руки букв т (m) и ш (ш);
  • буква «ь» как таковая (может рассматриваться как диакритический знак при предыдущей согласной);
  • хвостик у «щ» — является неотъемлемой частью буквы, но может быть воспринят как диакритический знак при формальном анализе и сравнении букв алфавита.

Основные диакритические знаки

Замечание. Сколько-нибудь устоявшихся русских названий для большинства диакритических знаков нет. В настоящее время конкурируют:

  • традиционная система филологического толка, в которой у одного (по форме) знака может быть много названий, употребляемых в зависимости от того, о каком языке идёт речь: так, одно и то же надстрочное двоеточие применительно к немецкому языку будет названо «умляут» (в последнее время также «умлаут»), ко французскому — «трема», а к русскому — чаще всего просто «две точки»;
  • приблизительные описания формы («птичка», «крышечка», «крючок» и т. п.);
  • калька с английской компьютерной терминологии (прежде всего из Юникода), которая даже в оригинале достаточно условна, спорна и внутренне противоречива.

Дополнительно усложняет ситуацию и тот факт, что два разных в одном языке знака в другом могут оказаться взаимозаменяемыми шрифтовыми вариантами.

Описание, код!!Пример!!Возможное использование
/-образный штрих над буквой
U+0301
á1. Острое ударение — диакритический значок над буквой, используемый в греческом, романских, славянских и мн. др. языках. Для обозначения именно «острого ударения» как явления в других языках в русском можно встретить сразу несколько терминов, например,
ń, ѓчерта (польск. kreska («крэ́ска» — черта, линия)) в польском обозначает специфическое смягчение согласных, а над ó — произношение как u ; то же смягчающее значение используется в лужицких, хорватском, македонском и некоторых других языках
áв чешском, словацком и венгерском — показатель долготы гласных
áв транскрипции пиньинь китайского языка над гласным обозначает восходящий тон
\-образный штрих над буквой
U+0300
àтяжёлое ударение[1]: др.-греч. βᾰρεῖα, ц.-сл. вария, лат. gravis (гравис), фр. accent grave, англ. grave; используется в греческом (политоническая орфография), романских (прежде всего во французском), южнославянских и мн. др. языках
àв транскрипции пиньинь китайского языка над гласным обозначает нисходящий тон
надстрочное двоеточие
U+0308
ë, ï, üзнак раздельного чтения буквосочетаний: греч. diaeresis или dialytika, греч. и фр. trema (трема); используется в греческом, романских и некоторых других языках (иногда даже в английском)
ä, ö, üумляут — знак немецкой и некоторых других германских письменностей, указывающий на изменившееся («смягчившееся») произношение некоторых гласных; заимствован также некоторыми другими языками (например, финским, эстонским, венгерским, турецким и словацким)
ёдвоеточие входит в состав русской (и белорусской) буквы «ё»
їдвоеточие входит в состав украинской буквы «ї» йи
ї, ѵ̈в церковнославянском кендема, то есть две точки (либо два штриха // или \\, что было равнозначно), ставится над буквой i и ижицей (ѵ) в том случае, когда они читаются как и и не имеют на себе других надстрочных знаков (ударения или придыхания)
ӥв фонетической транскрипции русского текста: изменение гласного, вызванное положением между мягкими согласными
шапочка над буквой
(^-образная: U+0302,
круглая: U+0311,
ст.-сл. знак мягкости: U+0484,
над парой букв: U+0361)
â, ê, û…облечённое ударение[2]: др.-греч. περισπασμός, ц.-сл. камора, лат. circumflexus (циркумфлекс), фр. accent circonflexe, англ. circumflex; используется в греческом (политоническая орфография), романских (прежде всего во французском), сербском, ц.-сл. и мн. др. языках; в классических языках шапочка обычно круглая или даже (в греческом) в форме тильды (см. ниже), во французском, иногда в сербском — заострённая.
âв латинской транслитерации персидского языка обозначает долгий гортанный ɑ
ĉ, ĝ, ĥ, ĵ, ŝв языке эсперанто надстрочный символ ^ официально называется «циркумфлекс» (эсп. «cirkumflekso»), неофициально — «шапочка» (эсп. «ĉapelo»); модифицирует чтение соответствующих согласных без «шапочки» так, что они читаются соответственно как русские ч, дьжь, х, ж и ш (приблизительно)
îв румынском языке острая шапочка над â и î означает их чтение как ы
ê, ŝв некоторых системах латинской транслитерации кириллицы через ê может передаваться буква «э», а через ŝ — буква «щ»
ж͡джв некоторых системах транскрипции круглая шапочка над группой букв обозначает их слитное произношение (аффрикату)
л̑в старославянском круглая шапочка над согласной (иногда несколько смещённая вправо) означает её мягкость
âв турецком шапочка над гласной означала мягкость предыдущего согласного, также могла обозначать и долготу гласного (использовалась в заимствованиях из арабского); после реформы письменности в 1990-х «шапочка» была отменена , хотя иногда продолжает использоваться.
«птичка» над буквой
U+030C
ž, ěкрючок (гачек, чеш. háček) — знак чешской письменности, отмечающий шипящие и мягкие согласные, а также сильно смягчающее произношение буквы ě (обычно соответствующее старому славянскому ятю); над некоторыми буквами может для красоты выглядеть как почти прилипший апостроф: Ľ, ď и т. п.; заимствован в некоторые другие письменности (в хорватской использовался в обоих значениях); используется в некоторых системах латинской транслитерации русской и других кириллиц. В английском компьютерном сленге с 1980-х годов для этого знака появилось название caron неясного происхождения (caret + macron?, carom + on?, лат. corona?), которое впоследствии расползлось в другие языки и официальные документы (вроде стандарта Юникода).
žобозначает звук ж в некоторых финно-угорских, балтийских и славянских языках
šобозначает звук ш в некоторых финно-угорских, балтийских и славянских языках
čобозначает звук ч в некоторых финно-угорских, балтийских и славянских языках
ǎв транскрипции пиньинь китайского языка над гласным обозначает нисходяще-восходящий тон
ѯкрючок входит в состав старославянской буквы «Ѯ» (Кси).
// над буквой
U+030B
ő, ű«венгерский умляут»: ő и ű означают долгие варианты звуков, выражаемых буквами ö и ü
ѵ̋в церковнославянском: шрифтовой вариант начертания ѵ̈
\\ над буквой
U+030F
и̏в сербском: краткое нисходящее ударение
ѷв церковнославянском: шрифтовой вариант начертания ѵ̈ (для ижицы самый распространённый, а вот ї чаще рисовали с точками или вертикальными штрихами)
надстрочный кружок
U+030A
åв некоторых скандинавских языках через å обозначается долгое a , перешедшее в o ; прописное Å — обозначение ангстремов
ůв чешском языке с помощью кружка (чеш. kroužek) через ů обозначается долгое u: , произошедшее от дифтонга uo
надстрочная точка
U+0307
i, j(англ. tittle) входит в состав строчных букв i и j большинства языков с латинской и некоторых с кириллической письменностью (при добавлении любого другого надстрочного знака точка обычно удаляется); в некоторых тюркских языках (например, в турецком) различаются буква i с точкой (по-турецки читается как и ) и без точки (читается как ы ), причём это различие сохраняется и для прописных букв
żшипящие согласные в старой чешской письменности, буква ż в нынешнем польском языке
ėв литовском языке
латинская транслитерация санскрита (через ṁ в разных системах могут изображаться как анунасика, так и анусвара, но последняя может быть и ṅ)
ḃ, ḋ, ḟ, ṁ, ṗ, ṫранее использовались в ирландском и других гойдельских языках, точка над согласной обозначала леницию. В современной орфографии лениция обозначается добавлением буквы Hh.
точка слева над буквойв фонетической транскрипции русского текста: изменение гласного, вызванное положением после мягкого согласного
точка справа над буквой
U+0358
в фонетической транскрипции русского текста: изменение гласного, вызванное положением перед мягким согласным
тильда над буквой
U+0303
(в греческом
U+0342)
ãв некоторых система транскрипции тильда (происходящая от надстрочных n и m) над гласными означает их носовое произношение; в этом значении она используется также и в португальском языке
ñв испанском ñ — мягкое нь
õобозначает звук ы в эстонском языке
в политонической греческой орфографии тильда — шрифтовой вариант круглой шапочки (см. выше про «облечённое ударение»)
черта над буквой
U+0304
āосновное значение (идущее от древнегреческого и латыни) — указание на долготу гласных (и слогообразующих согласных); иногда используется греческое название макрон
āв транскрипции пиньинь китайского языка над гласной обозначает ровный тон
U-образный надстрочный знак
U+0306
ăосновное значение (идущее от древнегреческого и латинского языков) — указание на краткость гласных; лат. brevis (бревис), англ. breve
йв славянских кириллицах означает неслоговой характер гласных и их переход в согласные; ц.-сл. и рус. название — краткая (c конца XIX века в словарях также кратка). Входит в состав букв й, ў (используется в белорусском языке) и нек. др. В современных кириллических шрифтах обычно изображается не так, как в греческих и латинских.
ӂв молдавской кириллице советских времен буква «ӂ» означала аффрикату дж
ğв турецком через ğ обозначается звук, близкий к белорусскому г, а в некоторых диалектах доходящий до полного исчезновения
ŭв языке эсперанто U-образный надстрочный знак, неофициально называемый «ванночка» (эсп. «kuveto»), трансформирует гласный u в неслоговый звук, близкий к английскому w, используемый практически исключительно в дифтонгах и , например: «aŭroro» («заря»), «Eŭropo» («Европа»)
ģ
(-образный знак
греч.: U+0314,
кир.: U+0485
густое придыхание (часто соответствует начальному h- в интернационализмах): др.-греч. δᾰσεῖα, ц.-сл. дасия, лат. spiritus asper; использовалось в политонической греческой орфографии и в некоторых старых вариантах церковнославянского
)-образный знак
греч.: U+0313,
кир.: U+0486
тонкое придыхание: др.-греч. πνεῦμα ψιλόν, также ψιλή, ц.-сл. духъ, также псили или звательце, лат. spiritus lenis; используется в политонической греческой орфографии и в церковнославянском (ничего не обозначает, ставится над начальной гласной слов)
хвостик сверху
U+0309
вьетнамский знак одного из музыкальных тонов (вьетн. dấu hỏi)
титло
U+0483
а҃старо- и церковнославянский знак для указания сокращённых написаний слов и для буквенной записи чисел
апостроф[3]н' в некоторых системах фонетической транскрипции: знак мягкости согласных: любить = л’уб’ит' или l’ub’it' , а в некоторых наоборот (например, в украинском языке) — твердости (но иногда и мягкости тоже).
подстрочная точка
U+0323
различные системы транскрипции и транслитерации (семитских языков, языков Индии и др.); подстрочная точка может обозначать слогообразующие согласные (ṛ, ḷ), церебральные согласные (ḍ, ṭ, ṇ), анунасику с анусварой и др.
запятая
U+0326
țсвистящие и шипящие в румынском языке (ș, ț)
подстрочный кружок
U+0325
в некоторых системах транскрипции (например, в реконструкции индоевропейского или праславянского языка) кружок под согласной обозначает её слоговой характер
«чашка» под несколькими буквами
U+035C
t͜sв некоторых системах фонетической транскрипции знак ͜ под буквосочетанием означает его слитное произношение — аффрикативность
«шапочка» под буквой
U+032F
в некоторых системах фонетической транскрипции: неслоговой звук
подчёркивание
U+0331
в словарях может обозначать ударение
«птичка» под буквой
U+032C
в МФА — знак звонкости
подстрочная тильда
йота подписная
U+0345
в древнегреческом
рожок направо и вверх
U+031B
ơиспользуется во вьетнамском языке
апостроф слитно
U+0491
ґиспользуется в украинском языке для выделения взрывного г (в отличие от обычного щелевого г, принятого в украинском). При отсутствии на визуальной раскладке заменяется на г' или просто г. (В украинской раскладке клавиатуры - правый Alt+г=ґ, правый Alt+Shift+г=Ґ). Также используется как факультативная буква в белорусской тарашкевице.
седиль
U+0327
çпроисходит из испанского языка (исп. zedilla седи́лья  — «маленькое „z“»), но ныне там не используется; наиболее известно по употреблению во французском (фр. cédille седи́й ), ставится под c в том случае, когда у этой буквы надо обозначить произношение s вместо k : façade фасад ; используется также в некоторых других языках под разными буквами и с разным значением (так, в турецком буквы c, ç, s, ş обозначают соответственно звуки дж , ч , с и ш ). В латышской письменности при строчной букве g седиль переворачивается и становится надстрочным знаком: ģ
c-образный хвостик
U+0328
ęпроисходит из средневековой латинской письменности, где знак ę был компактной заменой для лигатуры æ; оттуда заимствован польской письменностью и получил название ogonek ого́нэк = «хвостик»; в польском используется в буквах носовых гласных ą и ę. Из польского заимствован другими языками (в частности, литовским), применяется при различных буквах
хвостик как у ц или щҷ, ӌиспользовался в 1930-е годы и позже при создании кириллических письменностей для различных языков СССР; обычно шёл вправо и вниз, но иногда влево и вниз
горизонтальный штрих
короткий: U+0335,
длинный: U+0336
đво вьетнамском языке — буква «д»
диагональный штрих
короткий: U+0337,
длинный: U+0338
øв датском, норвежском, фарерском ø означает то же, что в немецком, шведском, исландском ö
łł — польское несмягчённое л , переходящее в неслоговое у ; перечёркивание обычно наклонное, но в декоративных шрифтах может быть горизонтальным, в виде тильды и т. п.; при письме от руки вместо перечёркивания ставят тильду сверху
вертикальный штрих>Ҝ
тильда посерединеɫ

Хвостики:

  • Седиль: A̧, Ķ, Г̧
  • Огонэк: M̨, Ǫ
  • Крюк: Ƙ, Ⱳ, Ƈ
    • Крюк сверху: ,
    • Крюк посередине: Ԣ, Ҧ
    • Крюк снизу: Ƒ, , Ԓ
      • Крюк влево снизу: Ɲ, Ԩ
    • Палатальный крюк: ,
    • Ретрофлексный крюк: Ʈ, ƺ
    • Рыболовный крюк: ʮ, ɾ
    • Ротический крюк: ɚ, ɝ
    • Внутренний крюк:

link=M с внутренним крюком

Некоторые другие специфические диакритические знаки используются в МФА и в церковнославянской письменности.

Написание некоторых диакритических знаков с помощью HTML-разметки приведено в «Комбинируемых диакритических символах».

Примеры

Литовский язык

В литовском языке имеется 12 гласных букв. В дополнение к стандартным латинским буквам используются диакритические знаки для обозначения долгих (ilgoji: y, ū) и носовых (nosinė: ą, ę, į, ų — обозначаются огонэком) гласных, оставшихся со времени, когда эти буквы произносились в нос, как некоторые гласные в современном польском. Эти изменённые гласные (кроме ė), в современной разговорной речи никак не выделяются по звучанию относительно основных гласных и несут, в основном, историческую нагрузку в письменности.

ПрописныеAĄEĘĖIĮYOUŲŪ
Строчныеaąeęėiįyouųū
МФАaɛɛːiou

Примечания

  1. Название «тупое ударение» — неверное.
  2. Название «облегчённое ударение» — неверное.
  3. В церковнославянской письменности апострофом называется не «знак препинания», а сочетание придыхания с тяжёлым ударением.

Литература

Наборное производство
{{Navbox subgroups
Набор сплошного
текста
Особые виды набора
Микротипографика
Способы набора