Виды файлов словарей в Lingvo

За время существования программы Lingvo (с 1990 года) менялись виды и форматы её словарей. Изменения происходили на разных уровнях: или один вид заменял другой, или менялись версии в рамках одного вида. Это отразилось на особенностях работы компилятора — одного из основных инструментов словаределателя. Поэтому, для лучшего понимания механизмов словаределания и полноты общей картины, принято решение посвятить этой теме отдельный раздел.

Словари в Lingvo делятся на системные и пользовательские. Словарь определённого вида может состоять из одного или нескольких файлов.

Системные словари

Пользовательские словари

Системные словари

Системными называются словари, которые входят в комплект поставки Lingvo или приобретаются / скачиваются отдельно на сайте / сервере ABBYY.

Системные словари делятся на локальные и сетевые. Файлы локальных словарей располагаются на компьютере пользователя, а доступ к сетевым осуществляется посредством интернет.

Системные словари не подлежат редактированию. Некоторые из них можно декомпилировать, т.е. преобразовать в начальный, редактируемый формат. Однако, при этом необходимо иметь в виду, что официально программных средств для декомпилирования ABBYY не предоставляет, следовательно ответственность за подобные действия ложится непосредственно на пользователя.


*.lsd Lingvo System Dictionary Основной формат системных локальных словарей. Словари с этим расширением обычно входят в комплект поставки Lingvo, но могут также приобретаться отдельно.
Формат является результатом компилирования исходного формата DSL. Используется в Lingvo, начиная с версии 6.0.
Версия LSD словаря всегда соответствует версии Lingvo, в комплект которой он входит. На практике это приводит к тому, что для использования LSD одной версии в Lingvo другой версии, его необходимо переконвертировать. Узнать о версии LSD можно по 11-му байту в hex-представлении файла словаря.
Существуют способы декомпилирования LSD в исходный DSL, однако все они являются неофициальными.
Существует также пользовательская версия этого формата. Об этом см. ниже, в главе Пользовательские словари.

*.lod Lingvo Online Dictionary Файл доступа к online-версии словаря на сайте ABBYY (файл описания онлайн-словаря). Используется в Lingvo, начиная с версии x3 (14.0).
Словари с этим расширением являются сетевыми, обычно входят в комплект поставки Lingvo, но могут также скачиваться отдельно с сервера ABBYY.
Для работы словаря необходимо наличие соединения с интернет. Сам словарь содержит только список заголовков. Доступ к каждой конкретной статье осуществляется посредством интернет при обращении к каждому конкретному заголовку.
Файл словаря представляет собой простой xml-документ, содержащий служебную информацию — его можно открыть любым текстовым редактором.

*.ldp Lingvo Dictionary Package Упакованный архив, содержащий комплект локальных словарей LSD. Используется в Lingvo, начиная с версии x3 (14.0).
LDP может содержать от одного до нескольких словарей. При этом один словарь может состоять из двух файлов: основного *.lsd и файла аббревиатур *_abrv.lsd.
Файлы с этим расширением приобретаются отдельно на сайте ABBYY. В комплект поставки Lingvo такие файлы не входят.
По двойному клику на *.ldp, скачаному с сайта ABBYY, автоматически запускается распаковка, установка и подключение содержащихся в нём словарей LSD к программе Lingvo.

*.lsa Lingvo Sound Archive
(предположительная расшифровка)
Специальный словарь-контейнер, состоящий из набора звуковых файлов — примеров произношения заголовочных слов. Используется в Lingvo, начиная с версии x3 (14.0).
Словари с этим расширением являются локальными, обычно входят в комплект поставки Lingvo, но могут также приобретаться отдельно.
Информация о словарях данного формата в официальной справке от ABBYY отсутствует.
Установлено, что звук внутри контейнеров LSA сжимается при помощи кодека Ogg Vorbis.
Встречались LSA, содержащие ошибки. Попытки отредактировать такие экземпляры приводили к их неработоспособности в Lingvo.
LSA можно декомпилировать при помощи программы Lingvo Sound Data Extractor. Для совместимости с программой нужно изменить расширение файла с *.lsa на *.dat. Результатом декомпилирования является набор звуковых файлов с расширением *.wav.

*.dat Data Словарь-контейнер звуковых файлов — «озвученных» слов. Устаревший формат, предшественник LSA. Использовался в старых версиях Lingvo до 12 включительно.
DAT можно декомпилировать при помощи программы Lingvo Sound Data Extractor. Результатом декомпилирования является набор звуковых файлов с расширением *.wav.

Пользовательские словари

Пользовательские словари предназначены для редактирования. Эти словари делятся на два вида, в зависимости от способа их редактирования:

  1. Свободно редактируемые, т.е. при помощи любых сторонних текстовых редакторов.
  2. Редактируемые с ограничением, т.е. только при помощи программных средств, встроенных в Lingvo. Такие словари всегда состоят из пары файлов: в одном содержатся заголовки, а в другом — тела статей. По внутренней структуре они принадлежат к т.н. «простым» словарям: заголовок → перевод / толкование (как правило без дополнительных объяснений). Подробнее о них см. в главе Простой словарь DSL.

*.dsl Dictionary Specification Language Основной свободно редактируемый пользовательский формат. Предназначен для компилирования в формат LSD. Подробному описанию DSL посвящён весь настоящий справочник.

*.ann Annotation Файл ANN представляет собой аннотацию к словарю. Аннотация является факультативной (необязательной) частью любого вида пользовательского словаря, т.е. её можно подключать как к DSL, так и к LUD или ADC.
Подробнее об ANN см. в главе Файл аннотации.

*.lsd Lingvo System Dictionary Пользовательская версия формата LSD. Обладает свойствами аналогичными системным словарям, но при этом Lingvo распознаёт их и отличает от системных. Специальную пометку о «несистемности» в подобный LSD добавляет DSL Compiler при компилировании пользовательских DSL.

*.lud Lingvo User Dictionary Формат с ограниченным редактированием. Используется в Lingvo, начиная с версии 6.0. Наследник ADC и BDC (см. далее). Является одной из двух обязательных частей (файлов) единого словаря.
Часть с данным расширением содержит заголовки. Парной к ней частью с телами статей является файл с расширением *.adx.
При подключении к Lingvo LUD словари полностью индексируются.
Начиная с Lingvo 9 есть возможность конвертации LUD в формат DSL.

*.adx вероятно AD — наследие от предшественника, а X указывает на расширение формата Формат с ограниченным редактированием. Используется в Lingvo, начиная с версии 6.0. Наследник ADT и BDT (см. далее). Является одной из двух обязательных частей (файлов) единого словаря.
Часть с данным расширением содержит тела статей. Парной к ней частью с заголовками является файл с расширением *.lud.

*.adc вероятно A Dictionary Cards Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник LUD. Является одной из двух обязательных частей (файлов) единого словаря.
Часть с данным расширением содержит заголовки. Парной к ней частью с телами статей является файл с расширением *.adt.
Словари с расширением *.ad* принадлежали к англо-русскому направлению, а с расширением *.bd* — к русско-английскому, при этом другие направления в ранних версиях Lingvo не поддерживались. Этим, вероятно, и объясняются первые буквы в расширениях: словари категории A, т.е. англо-русские, и категории B, т.е. русско-английские.

*.adt вероятно A Dictionary Translations Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник ADX. Является одной из двух обязательных частей (файлов) единого словаря.
Часть с данным расширением содержит тела статей. Парной к ней частью с заголовками является файл с расширением *.adc.

*.bdc вероятно B Dictionary Cards Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник LUD. Является одной из двух обязательных частей (файлов) единого словаря.
Часть с данным расширением содержит заголовки. Парной к ней частью с телами статей является файл с расширением *.bdt.
Словари с расширением *.ad* принадлежали к англо-русскому направлению, а с расширением *.bd* — к русско-английскому, при этом другие направления в ранних версиях Lingvo не поддерживались. Этим, вероятно, и объясняются первые буквы в расширениях: словари категории A, т.е. англо-русские, и категории B, т.е. русско-английские.

*.bdt вероятно B Dictionary Translations Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник ADX. Является одной из двух обязательных частей (файлов) единого словаря.
Часть с данным расширением содержит тела статей. Парной к ней частью с заголовками является файл с расширением *.bdc.