Метаязык DSL

Согласно лексикографическому определению, метаязык словаря — это «система понятий и называющих их терминов, различных условных знаков, шрифтовых выделений и т.п., с помощью которых описывается словарь, его структура и содержание»[1]. Иными словами, метаязык словаря — это средства структурирования и подачи словарного материала. Поскольку DSL — это язык описания электронных словарей, говоря о метаязыке DSL, мы говорим преимущественно о второй части определения — о средствах подачи или оформлении. Термин «метаязык» в нашем случае не будет избыточным в силу своеобразия средств DSL.

Согласно предназначению словаря, одним из основных требований к его оформлению является ясность подачи и удобство в использовании. Очевидно, что эти факторы непосредственно зависят от конечной формы публикации. Возможности и ограничения публикации на бумаге существенно отличаются от таковых на электронных носителях. Поэтому цель настоящего раздела: аккумулировать опыт по оформлению словарей, предназначенных для отображения на компьютерных экранах, в рамках возможностей формата DSL. Также в разделе будут уместны материалы по терминологии лексикографии.

Примеры оформления

Краткий лексикографический глоссарий

Примеры оформления

Непривязанность к бумаге снимает с электронных словарей многие ограничения в оформлении. С другой стороны ограничения может накладывать инструментарий программного обеспечения. Наконец, как в любом деле, использование возможностей регулируется чувством меры и здравым смыслом.

В сравнении с книгопечатными словарями электронные избавлены от:

Стандартные средства DSL очерчивают круг наших возможностей по оформлению. Рассмотрим каких эффектов на практике мы можем добиться с их помощью и какими нестандартными средствами можем расширить этот круг.

Структура

Для выделения структурных блоков можно использовать красные строки и отбивки.

Красные строки наиболее уместны в словарях энциклопедических, где правая (семантическая) часть словаря содержит расширенные описания. Для создания красной строки используются неразрывные пробелы (No-break space), которые ставятся в начало строки подряд друг за другом, обычно от 4 до 7. Непосредственно за ними перед словом рекомендуется ставить обычный пробел. Вместо неразрывных можно использовать любые другие нестандартные пробелы. Подробнее см. в главе Об использовании нестандартных пробелов.

Отбивки могут использоваться для обособления от основного текста других структурных блоков: иллюстраций с их подписями, библиографических списков, подписей авторов статей в энциклопедических словарях. Для создания отбивки также используется пробел неразрывный или любой другой нестандартный. Пробел ставится на отдельной строке и по желанию может быть обрамлён в тэг отступа [mN]. При помощи тэгов [sub] и [sup] можно регулировать высоту отбивки. Единственный недостаток такого приёма — неодинаковая обработка словарными программами. В Lingvo максимальную высоту даёт [sub], а минимальную — [sup], в GoldenDict — наоборот. Подробнее см. в главе Об использовании нестандартных пробелов.

В качестве отбивок могут также использоваться короткие линии. Создаются они несколькими длинными тире (m-dash, 0x2014, Alt+0151), которые можно дополнительно обрамить тегами отступа [mN] и цвета. Например: [m1][c slategray]—————————[/c][/m]. Вместо линии можно создать известную в типографике отбивку из трёх звёздочек или точек, используя для этого символы asterisk *, low asterisk или bullet в паре с длинным пробелом m-space. Фантазия может подсказать и другие варианты.

Начертание

Для управления шрифтовыми выделениями DSL располагает тэгами форматирования начертанием и цветом. Из начертаний стандартно доступны: жирное, наклонное, их комбинация, подстрочный и надстрочный индексы, подчёркивание.

Эффекта разреженного текста можно добиться использованием нестандартных пробелов. Подробнее см. в главе Об использовании нестандартных пробелов.

Эффект зачёркнутого текста достигается использованием диакритических символов combining long stroke overlay (0x0336, Alt+0822), расставленных после каждой буквы. В интернет можно найти сервисы, которые делают это автоматически, например: spectrox.ru/strikethrough.

Для передачи надстрочных и подстрочных цифр вместо использования соответствующих тэгов иногда лучше набирать их символами из таблицы Юникод. Коды надстрочных цифр:

Цифра ◌¹ ◌² ◌³ ◌⁴ ◌⁵ ◌⁶ ◌⁷ ◌⁸ ◌⁹ ◌⁰
Юникод 0x00B9 0x00B2 0x00B3 0x2074 0x2075 0x2076 0x2077 0x2078 0x2079 0x2070
Alt+код A+0185 A+0178 A+0179 A+8308 A+8309 A+8310 A+8311 A+8312 A+8313 A+8304

Коды подстрочных цифр:

Цифра ◌₁ ◌₂ ◌₃ ◌₄ ◌₅ ◌₆ ◌₇ ◌₈ ◌₉ ◌₀
Юникод 0x2081 0x2082 0x2083 0x2084 0x2085 0x2086 0x2087 0x2088 0x2089 0x2080
Alt+код A+8321 A+8322 A+8323 A+8324 A+8325 A+8326 A+8327 A+8328 A+8329 A+8320

Тэги надстрочного [sup] и подстрочного [sub] индекса можно использовать для передачи эффекта уменьшенного кегля шрифта. Это может быть уместно в энциклопедических словарях для выделения абзацев библиографического содержания. Однако, у этого приёма есть, к сожалению, существенный недостаток: Lingvo и GoldenDict неодинаково обрабатывают названные тэги.

Lingvo при обработке [sup] сокращает исходный интерлиньяж, а при обработке [sub] наоборот увеличивает. В результате [sub] становится непригодным для описываемой цели:

GoldenDict сокращает интерлиньяж в обоих случаях, но при обработке [sub] чуть более. В результате оба тэга остаются приемлемыми для описываемой цели, но [sub] предпочтительней:

Цвет

Цветом в DSL стандартно выделяются пометы, вспомогательный текст, ударения в словах и ссылки.

Иногда может быть уместным выделение цветом морфологических форм заголовочного слова. Например:

Если словарная статья объёмна, заголовки или маркировка её отдельных разделов — этимологии, синонимов, антонимов и др. — воспринимаются чётче, когда выделены цветом. Подобное выделение также облегчает восприятие в случае, если словарей много, и цвета разделов в них унифицированы.

Чтобы разные цвета лучше сочетались друг с другом, можно подбирать их, используя цветовой круг Иттена. Верные сочетания получаются, если выбирать соседние цвета, или расположенные на вершинах равнобедренного треугольника, или квадрата, или прямоугольника. Подробные советы по использованию можно найти самостоятельно в интернете:

В некоторых случаях для выделения уместно использовать не разные цвета, а оттенки одного цвета. Например, в лексикографических иллюстрациях оттенками можно выделять языковые части (входную/исходную или выходную/переводную):

Для реализации приведённого примера в Lingvo придётся отказаться от употребления тэга вспомогательного текста [*], поскольку он подавляет применение [c]. В GoldenDict задача решается при помощи пользовательских стилей CSS.

Навигация

Тэг помет [p] помимо его прямого назначения можно также использовать для передачи более объёмных расшифровок, например, библиографических источников:

На иллюстрации показана обработка этого применения в GoldenDict: всплывающая подсказка отображается в нём аккуратным прямоугольным блоком. В Lingvo, к сожалению, подсказки не ограничиваются по ширине и при объёмном содержимом растягиваются во всю ширину экрана. Впрочем, за пределы экрана они не выходят, так что текст читается без потерь.

Краткий лексикографический глоссарий

Составлен по материалам:

  1. Дубичинский B.B. Теоретическая и практическая лексикография. — Вена – Харьков, 1998.
  2. Официальные справочные руководства к программе ABBYY Lingvo.
ВОКАБУЛА
Заголовочная единица и/или морфологически производная лексическая единица, которая подлежит лексикографированию, (не) будучи выделенной в отдельную словарную статью.
Ср. заголовочная единица.
ВОКАБУЛЯРИЙ
Краткий словарь к хрестоматии или к разделу учебника.
Ср. глоссарий.
ВХОДНОЙ ЯЗЫК
Язык, единицы которого составляют левую часть (словник) переводного словаря.
Ср. выходной язык.
ВЫХОДНОЙ ЯЗЫК
Язык, единицы которого составляют правую часть переводного словаря.
ГЛОССА
1. Перевод или толкование непонятного, устаревшего, диалектного слова, а также само это слово.
2. (в двуязычных словарях) Переводной эквивалент.
ГЛОССАРИЙ
1. Словарь глосс (1).
2. Относительно короткий перечень лексических единиц с минимальной информацией о них.
3. Краткий словарь специальной лексики.
Ср. вокабулярий, словник.
ДЕФИНИЦИЯ
Логическое определение понятия, установление содержания понятия, его отличительных признаков.
Ср. толкование.
ЗАГЛАВНОЕ СЛОВО
См. заголовочная единица.
ЗАГОЛОВОЧНАЯ ЕДИНИЦА
(заглавное слово, заголовочное слово, лемма)
Языковая единица обычно в канонической форме, вводящая словарную статью в соответствии с принятой в словаре схемой расположения.
Ср. вокабула.
ЗАГОЛОВОЧНОЕ СЛОВО
См. заголовочная единица.
ИЛЛЮСТРАТИВНОЕ ПРЕДЛОЖЕНИЕ
ИЛЛЮСТРАТИВНОЕ СЛОВОСОЧЕТАНИЕ
См. иллюстрация лексикографическая.
ИЛЛЮСТРАЦИЯ ЛЕКСИКОГРАФИЧЕСКАЯ
(иллюстративное предложение, иллюстративное словосочетание, пример)
Предложение или словосочетание, содержащие заголовочную единицу или её форму, и демонстрирующие её семантическое поведение в характерном контексте.
ИНДЕКС
1. (Алфавитный) указатель содержащихся в словаре языковых единиц.
2. В DSL: а) аналитически скомпонованный перечень всех входящих в словарь слов с учётом их морфологических форм, составленный для осуществления быстрого полнотекстового поиска по словарю; б) бинарные файлы *.trs, содержащие этот перечень.
ИНДЕКСАЦИЯ
(индексирование)
1. Снабжение заголовочных единиц и/или вокабул словаря индексами.
2. В DSL: процесс создания индекса.
КАРТОЧКА
1. В DSL: окно или вкладка окна словарной программы, в которой отображается словарная статья с заголовком. В настоящем справочнике слово карточка употребляется исключительно в этом значении.
2. В DSL: часть словарной статьи, идущая после заголовка.
КОРПУС словаря
Основная часть словаря — совокупность всех словарных статей.
КУРСИВ
Рисунок типографского шрифта, близкий рукописному, используемый обычно для выделения в тексте словаря лексикографических помет.
ЛЕВАЯ ЧАСТЬ словаря
См. словник.
Ср. правая часть словаря.
ЛЕКСИКОГРАФИЧЕСКИЙ ТИП
Группа языковых единиц, имеющих общие свойства и требующих поэтому единообразной словарной интерпретации.
ЛЕКСИКОГРАФИЯ
1. Искусство, наука и практика создания словарей.
2. Раздел языкознания, занимающийся вопросами создания словарей и их изучения.
3. Совокупность словарей общего или специального типа.
ЛЕКСИКОН
1. Запас слов.
2. Словарный запас языка, лексика.
Ср. словник, словарь.
ЛЕКСИКО-СЕМАНТИЧЕСКИЙ ВАРИАНТ (ЛСВ)
Отдельное словарное значение многозначной заголовочной единицы.
ЛЕКСИЧЕСКАЯ ЕДИНИЦА
Слово как предмет описания в словаре.
ЛЕММА
См. заголовочная единица.
МЕТАЯЗЫК словаря
Система понятий и называющих их терминов, различных условных знаков, шрифтовых выделений и т.п., с помощью которых описывается словарь, его структура и содержание.
МНОГОЗНАЧНОСТЬ
(полисемия)
Наличие у одной и той же заголовочной единицы словаря нескольких связанных между собой значений.
МОНОСЕМИЯ
См. однозначность.
ОДНОЗНАЧНОСТЬ
(моносемия)
Наличие у языковой единицы только одного значения.
ОТСЫЛКА
Слово или словосочетание в полной или сокращённой форме, с помощью которых устанавливается определённая связь между элементами словаря (обычно между заголовочными единицами).
ПЕРЕВОДНОЙ ЭКВИВАЛЕНТ
Языковая единица, используемая в качестве толкования или дефиниции заголовочной единицы или вокабулы в дву- и многоязычных словарях.
ПОЛИСЕМИЯ
См. многозначность.
ПОМЕТА словарная
1. Словарное уточнение стилистического уровня употребительности, функционально-профессиональной сферы употребления, семантической характеристики языковых единиц и т.п., приводимое в сокращённой или условной (символической) записи.
2. В DSL: условное сокращение в тексте словарной статьи, обладающее интерактивными свойствами. Пометы принято выделять курсивным начертанием и цветом (как правило зелёным). При наведении на помету курсора мыши отображается всплывающая подсказка, содержащая расшифровку сокращения. Расшифровки размещаются в специальном вспомогательном словаре аббревиатур.
ПРАВАЯ ЧАСТЬ словаря
Часть словаря, где различным образом семантизируются единицы словника (толкуются, переводятся и т.п.).
Ср. левая часть словаря.
ПРИМЕР
См. иллюстрация лексикографическая.
СЛОВАРНАЯ СТАТЬЯ
Текст, разъясняющий заголовочную единицу в словаре и описывающий её основные (произносительные, сочетаемостные, стилистические, словообразовательные и т.п.) характеристики; основная структурная единица словаря, состоящая из заголовочной единицы и всего соответствующего ей описания.
СЛОВАРНОЕ ГНЕЗДО
Группа однокоренных лексических единиц, представленных в виде одной словарной статьи.
Ср. словообразовательное гнездо.
СЛОВАРЬ
1. Словарный состав языка.
2. Запас слов.
3. Справочник, содержащий обычно определённым образом систематизированные языковые единицы и информацию о них.
СЛОВНИК
(левая часть словаря)
Совокупность (перечень) всех вокабул словаря.
Ср. вокабулярий, глоссарий, лексикон, словарь.
Ср. правая часть словаря.
СЛОВООБРАЗОВАТЕЛЬНОЕ ГНЕЗДО
Группа однокоренных лексических единиц, находящихся в непосредственной словообразовательной связи с заголовочной единицей и образующих, как правило, отдельную часть словарной статьи.
Ср. словарное гнездо.
ТЕЛО СЛОВАРНОЙ СТАТЬИ
В DSL: часть словарной статьи, идущая после заголовка.
См. словарная статья.
Ср. карточка.
ТИЛЬДА
Знак в виде волнистой чёрточки ~, употребляемый в словарях для обозначения заголовочной единицы или её части при их повторении в словарной статье.
ТОЛКОВАНИЕ
Лексико-стилистическая и грамматико-функциональная характеристика языковой единицы в словарной статье; определение значения с точки зрения наивной картины мира.
Ср. дефиниция.
ТРАНСКРИПЦИЯ
(фонетическая транскрипция)
Передача (запись) звуков при помощи специальных графических знаков, способ однозначной фиксации в словаре звуковых характеристик отрезков речи.
ТРАНСЛИТЕРАЦИЯ
Побуквенная передача (запись) иноязычной языковой единицы при помощи букв родного языка.

[1] Дубичинский B.B. Теоретическая и практическая лексикография. — Вена – Харьков, 1998. — С. 122.