Виды файлов словарей в Lingvo
За время существования программы Lingvo (с 1990 года) менялись виды и форматы её словарей. Изменения происходили на разных уровнях: или один вид заменял другой, или менялись версии в рамках одного вида. Это отразилось на особенностях работы компилятора — одного из основных инструментов словаределателя. Поэтому, для лучшего понимания механизмов словаределания и полноты общей картины, принято решение посвятить этой теме отдельный раздел.
Словари в Lingvo делятся на системные и пользовательские. Словарь определённого вида может состоять из одного или нескольких файлов.
Системные словари
Системными называются словари, которые входят в комплект поставки Lingvo или приобретаются / скачиваются отдельно на сайте / сервере ABBYY.
Системные словари делятся на локальные и сетевые. Файлы локальных словарей располагаются на компьютере пользователя, а доступ к сетевым осуществляется посредством интернет.
Системные словари не подлежат редактированию. Некоторые из них можно декомпилировать, т.е. преобразовать в начальный, редактируемый формат. Однако, при этом необходимо иметь в виду, что официально программных средств для декомпилирования ABBYY не предоставляет, следовательно ответственность за подобные действия ложится непосредственно на пользователя.
*.lsd | Lingvo System Dictionary | Основной формат системных локальных словарей. Словари с этим расширением обычно входят в комплект поставки Lingvo, но могут также приобретаться отдельно.
Формат является результатом компилирования исходного формата DSL. Используется в Lingvo, начиная с версии 6.0.
Версия LSD словаря всегда соответствует версии Lingvo, в комплект которой он входит. На практике это приводит к тому, что для использования LSD одной версии в Lingvo другой версии, его необходимо переконвертировать. Узнать о версии LSD можно по 11-му байту в hex-представлении файла словаря.
Существуют способы декомпилирования LSD в исходный DSL, однако все они являются неофициальными.
Существует также пользовательская версия этого формата. Об этом см. ниже, в главе Пользовательские словари. |
*.lod | Lingvo Online Dictionary | Файл доступа к online-версии словаря на сайте ABBYY (файл описания онлайн-словаря). Используется в Lingvo, начиная с версии x3 (14.0).
Словари с этим расширением являются сетевыми, обычно входят в комплект поставки Lingvo, но могут также скачиваться отдельно с сервера ABBYY.
Для работы словаря необходимо наличие соединения с интернет. Сам словарь содержит только список заголовков. Доступ к каждой конкретной статье осуществляется посредством интернет при обращении к каждому конкретному заголовку.
Файл словаря представляет собой простой xml-документ, содержащий служебную информацию — его можно открыть любым текстовым редактором. |
*.ldp | Lingvo Dictionary Package | Упакованный архив, содержащий комплект локальных словарей LSD. Используется в Lingvo, начиная с версии x3 (14.0).
LDP может содержать от одного до нескольких словарей. При этом один словарь может состоять из двух файлов: основного *.lsd и файла аббревиатур *_abrv.lsd.
Файлы с этим расширением приобретаются отдельно на сайте ABBYY. В комплект поставки Lingvo такие файлы не входят.
По двойному клику на *.ldp, скачаному с сайта ABBYY, автоматически запускается распаковка, установка и подключение содержащихся в нём словарей LSD к программе Lingvo. |
*.lsa | Lingvo Sound Archive (предположительная расшифровка) |
Специальный словарь-контейнер, состоящий из набора звуковых файлов — примеров произношения заголовочных слов. Используется в Lingvo, начиная с версии x3 (14.0). Словари с этим расширением являются локальными, обычно входят в комплект поставки Lingvo, но могут также приобретаться отдельно. Информация о словарях данного формата в официальной справке от ABBYY отсутствует. Установлено, что звук внутри контейнеров LSA сжимается при помощи кодека Ogg Vorbis. Встречались LSA, содержащие ошибки. Попытки отредактировать такие экземпляры приводили к их неработоспособности в Lingvo. LSA можно декомпилировать при помощи программы Lingvo Sound Data Extractor. Для совместимости с программой нужно изменить расширение файла с *.lsa на *.dat. Результатом декомпилирования является набор звуковых файлов с расширением *.wav. |
*.dat | Data | Словарь-контейнер звуковых файлов — «озвученных» слов. Устаревший формат, предшественник LSA. Использовался в старых версиях Lingvo до 12 включительно. DAT можно декомпилировать при помощи программы Lingvo Sound Data Extractor. Результатом декомпилирования является набор звуковых файлов с расширением *.wav. |
Пользовательские словари
Пользовательские словари предназначены для редактирования. Эти словари делятся на два вида, в зависимости от способа их редактирования:
- Свободно редактируемые, т.е. при помощи любых сторонних текстовых редакторов.
- Редактируемые с ограничением, т.е. только при помощи программных средств, встроенных в Lingvo. Такие словари всегда состоят из пары файлов: в одном содержатся заголовки, а в другом — тела статей. По внутренней структуре они принадлежат к т.н. «простым» словарям: заголовок → перевод / толкование (как правило без дополнительных объяснений). Подробнее о них см. в главе Простой словарь DSL.
*.dsl | Dictionary Specification Language | Основной свободно редактируемый пользовательский формат. Предназначен для компилирования в формат LSD. Подробному описанию DSL посвящён весь настоящий справочник. |
*.ann | Annotation | Файл ANN представляет собой аннотацию к словарю. Аннотация является факультативной (необязательной) частью любого вида пользовательского словаря, т.е. её можно подключать как к DSL, так и к LUD или ADC. Подробнее об ANN см. в главе Файл аннотации. |
*.lsd | Lingvo System Dictionary | Пользовательская версия формата LSD. Обладает свойствами аналогичными системным словарям, но при этом Lingvo распознаёт их и отличает от системных. Специальную пометку о «несистемности» в подобный LSD добавляет DSL Compiler при компилировании пользовательских DSL. |
*.lud | Lingvo User Dictionary | Формат с ограниченным редактированием. Используется в Lingvo, начиная с версии 6.0. Наследник ADC и BDC (см. далее). Является одной из двух обязательных частей (файлов) единого словаря. Часть с данным расширением содержит заголовки. Парной к ней частью с телами статей является файл с расширением *.adx. При подключении к Lingvo LUD словари полностью индексируются. Начиная с Lingvo 9 есть возможность конвертации LUD в формат DSL.
|
*.adx | вероятно AD — наследие от предшественника, а X указывает на расширение формата | Формат с ограниченным редактированием. Используется в Lingvo, начиная с версии 6.0. Наследник ADT и BDT (см. далее). Является одной из двух обязательных частей (файлов) единого словаря. Часть с данным расширением содержит тела статей. Парной к ней частью с заголовками является файл с расширением *.lud. |
*.adc | вероятно A Dictionary Cards | Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник LUD. Является одной из двух обязательных частей (файлов) единого словаря. Часть с данным расширением содержит заголовки. Парной к ней частью с телами статей является файл с расширением *.adt. Словари с расширением *.ad* принадлежали к англо-русскому направлению, а с расширением *.bd* — к русско-английскому, при этом другие направления в ранних версиях Lingvo не поддерживались. Этим, вероятно, и объясняются первые буквы в расширениях: словари категории A, т.е. англо-русские, и категории B, т.е. русско-английские. |
*.adt | вероятно A Dictionary Translations | Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник ADX. Является одной из двух обязательных частей (файлов) единого словаря. Часть с данным расширением содержит тела статей. Парной к ней частью с заголовками является файл с расширением *.adc. |
*.bdc | вероятно B Dictionary Cards | Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник LUD. Является одной из двух обязательных частей (файлов) единого словаря. Часть с данным расширением содержит заголовки. Парной к ней частью с телами статей является файл с расширением *.bdt. Словари с расширением *.ad* принадлежали к англо-русскому направлению, а с расширением *.bd* — к русско-английскому, при этом другие направления в ранних версиях Lingvo не поддерживались. Этим, вероятно, и объясняются первые буквы в расширениях: словари категории A, т.е. англо-русские, и категории B, т.е. русско-английские. |
*.bdt | вероятно B Dictionary Translations | Устаревший формат. Использовался в Lingvo до версии 5 включительно. Предшественник ADX. Является одной из двух обязательных частей (файлов) единого словаря. Часть с данным расширением содержит тела статей. Парной к ней частью с заголовками является файл с расширением *.bdc. |