Тэги поисковой обработки

Общие характеристики

Тэг [ex]…[/ex]

Тэг [com]…[/com]

Тэг [trn]…[/trn]

Тэг [trn1]…[/trn1]

Тэг [!trs]…[/!trs]

Тэг [lang]…[/lang]

Общие характеристики

К настоящей группе причисляются тэги, оказывающие влияние на организацию и осуществление поиска слов по тексту словарей в программе Lingvo. Поиск реализуется в Lingvo при помощи механизма индексирования, подробное описание которого содержится в главе Поиск и индексирование в Lingvo.

По умолчанию тэги данной группы не сопровождаются визуальным форматированием, т.е. не выделяются ни цветом, ни начертанием.

GoldenDict игнорирует поисковые функции тэгов данной группы, поскольку поиск и индексация осуществляются в нём другим, отличным от Lingvo, способом. Однако GoldenDict обрабатывает их разметку, что можно использовать для применения визуального оформления при помощи стилей CSS (подробнее об этом см. в справке к GoldenDict).

Тэг [ex]…[/ex]

Назначение: Разметка текста, как зоны индексирования примеров.

Этимология: ex — сокращение от англ. example (пример).

Использование: Только в теле словарных статей. Использование [ex] в заголовках не запрещено правилами, однако смысла не имеет, поскольку заголовки изначально являются самостоятельной зоной индексации и в дополнительной разметке не нуждаются.

Общая информация: Согласно документации Lingvo, термин «пример» означает — показательный случай употребления заголовочного слова в письменной и устной речи.

Тэг участвует в создании поискового индекса, который Lingvo формирует для осуществления поиска слов по всему тексту словарей, а не только в заголовках. В процессе индексирования текст, находящийся в зоне действия [ex]…[/ex], причисляется к категории Examples. Подробнее об этом см. в главе Поиск и индексирование в Lingvo.

Отображение в карточках: На сегодняшний день содержимое [ex]…[/ex] отображается в Lingvo стандартным, чёрным цветом и дополнительно никак не выделяется.

Особенности: Следует учитывать, что в состав поискового индекса Lingvo включается только текст, находящийся в зонах действия тэгов [ex], [com] и [trn]. Текст, оставшийся за пределами зон действия перечисленной группы, в индекс не попадёт и, соответственно, при поиске найден не будет.

Для того, чтобы исключить из индекса часть содержимого [ex], необходимо заключить её в тэг [!trs].

В зоне действия [ex]…[/ex] разрешается размещать любые другие тэги.

Тэги форматирования (начертания и цвета) оказывают влияние на отображение [ex], находясь как внутри, так и снаружи его области.

Употребление примеров :: Запись в DSL

загрузить
	[m1]1) [i]что (чем).[/i] Наполнить грузом, запасами, товарами.[/m]
	[m2][ex][c gray]Загрузить машину кирпичом.[/c][/ex][/m]
	[m2][ex][c gray]Загрузить судно по самый борт.[/c][/ex][/m]
	[m2][ex][c gray]Загрузить подвал картошкой.[/c][/ex][/m]
	[m2][ex][c gray]Загрузить желудок ([i]заполнить, набить, обычно не слишком полезным и калорийным[/i]).[/c][/ex][/m]
	[m1]2) [i]кого (что).[/i] Обеспечить работой, занять работой, делами в нужном количестве.[/m]
	[m2][ex][c gray]Загрузить завод.[/c][/ex][/m]
	[m2][ex][c gray]Продавцы загружены лишь на пятьдесят процентов.[/c][/ex][/m]

Употребление примеров :: Вид в словарной карточке

Пример (Ru-Ru)
загрузить
1) что (чем). Наполнить грузом, запасами, товарами.
Загрузить машину кирпичом.
Загрузить судно по самый борт.
Загрузить подвал картошкой.
Загрузить желудок (заполнить, набить, обычно не слишком полезным и калорийным).
2) кого (что). Обеспечить работой, занять работой, делами в нужном количестве.
Загрузить завод.
Продавцы загружены лишь на пятьдесят процентов.

Замечания: GoldenDict игнорирует поисковые функции [ex], поскольку поиск и индексация осуществляются в нём другим, отличным от Lingvo, способом. Однако GoldenDict обрабатывает разметку этого тэга, что можно использовать для визуального оформления его содержимого при помощи стилей CSS (подробнее об этом см. в справке к GoldenDict).

В диалоге настроек Lingvo именем Examples подписана настройка с серым [gray] по умолчанию цветом:

Однако по факту влияет она не на текст примеров, а на вспомогательный текст в тэгах [*]. В ранних версиях Lingvo (от 5 до 11) эта настройка именовалась Optional Text, что более соответствует её фактическому действию. Кроме того, [ex] принадлежит к группе тэгов поисковой обработки, которые цветом не выделяются. Вероятно, в названии Examples отразился принятый в системных словарях Lingvo обычай употреблять [ex] в паре с [*]. Не исключается также, что в Lingvo 12 при переименовании настройки была допущена ошибка.

История: Тэг введён в употребление в Lingvo 6.

Тэг [com]…[/com]

Назначение: Разметка текста, как зоны индексирования комментариев.

Этимология: com — сокращение от англ. comment (комментарий).

Использование: Только в теле словарных статей. Использование [com] в заголовках не запрещено правилами, однако смысла не имеет, поскольку заголовки изначально являются самостоятельной зоной индексации и в дополнительной разметке не нуждаются.

Общая информация: Согласно документации Lingvo, термин «комментарий» означает — дополнительная информация к переводу или толкованию.

Тэг участвует в создании поискового индекса, который Lingvo формирует для осуществления поиска слов по всему тексту словарей, а не только в заголовках. В процессе индексирования текст, находящийся в зоне действия [com]…[/com] причисляется к категории Comments. Подробнее об этом см. в главе Поиск и индексирование в Lingvo.

Отображение в карточках: На сегодняшний день содержимое [com] отображается в Lingvo стандартным, чёрным цветом и дополнительно никак не выделяется.

Особенности: Следует учитывать, что в состав поискового индекса Lingvo включается только текст, находящийся в зонах действия тэгов [ex], [com] и [trn]. Текст, оставшийся за пределами зон действия перечисленной группы, в индекс не попадёт и, соответственно, при поиске найден не будет.

Для того, чтобы исключить из индекса часть содержимого [com], необходимо заключить её в тэг [!trs].

В зоне действия [com]…[/com] разрешается размещать любые другие тэги.

Тэги форматирования (начертания и цвета) оказывают влияние на отображение [com], находясь как внутри, так и снаружи его области.

Употребление комментариев :: Запись в DSL

загрузить
	[m1]1) [com][i]что (чем).[/i][/com] Наполнить грузом, запасами, товарами.[/m]
	[m1]2) [com][i]кого (что).[/i][/com] Обеспечить работой, занять работой, делами в нужном количестве.[/m]

Замечания: GoldenDict игнорирует поисковые функции [com], поскольку поиск и индексация осуществляются в нём другим, отличным от Lingvo, способом. Однако GoldenDict обрабатывает разметку этого тэга, что можно использовать для визуального оформления его содержимого при помощи стилей CSS (подробнее об этом см. в справке к GoldenDict).

При компилировании словаря Lingvo автоматически добавляет пробел после закрывающего дескриптора [/com]. Это рекомендуется учитывать при составлении словарей, чтобы избежать появления нечаянных лишних пробелов. Например, выносить дескрипторы за скобки, т.е. вариант [com](пример)[/com] предпочесть варианту ([com]пример[/com]).

Текст, находящийся в зоне действия [com]…[/com] не учитывается Lingvo при осуществлении Автоматического поиска[1].

История: Тэг введён в употребление в Lingvo 6.

Тэг [trn]…[/trn]

Назначение: Разметка текста, как зоны индексирования переводов.

Этимология: trn — сокращение от англ. translation (перевод).

Использование: Только в теле словарных статей. Использование [trn] в заголовках не запрещено правилами, однако смысла не имеет, поскольку заголовки изначально являются самостоятельной зоной индексации и в дополнительной разметке не нуждаются.

Общая информация: Трактовка термина «перевод» в документации Lingvo отсутствует. По-видимому, подразумевает он не только, собственно, перевод заголовочного слова, но и толкование, особенно когда словарь одноязычен. По факту область применения термина ещё шире и распространяется на любой текст, отличный от примеров, комментариев и заголовков.

Тэг участвует в создании поискового индекса, который Lingvo формирует для осуществления поиска слов по всему тексту словарей, а не только в заголовках. В процессе индексирования текст, находящийся в зоне действия [trn]…[/trn] причисляется к категории Translations. Подробнее об этом см. в главе Поиск и индексирование в Lingvo.

Категория Translations — единственная в Lingvo, которая может быть создана автоматически. Для этого при компилировании DSL требуется включить опцию Create dictionary ready for indexing. Остальные категории поисковой обработки создаются только самостоятельно, путём расстановки соответствующих тэгов вручную.

Отображение в карточках: На сегодняшний день содержимое [trn]…[/trn] отображается в Lingvo стандартным, чёрным цветом и дополнительно никак не выделяется.

Особенности: Следует учитывать, что в состав поискового индекса Lingvo включается только текст, находящийся в зонах действия тэгов [ex], [com] и [trn]. Текст, оставшийся за пределами зон действия перечисленной группы, в индекс не попадёт и, соответственно, при поиске найден не будет.

Для того, чтобы исключить из индекса часть содержимого [trn], необходимо заключить её в тэг [!trs].

В зоне действия [trn]…[/trn] разрешается размещать любые другие тэги.

Тэги форматирования (начертания и цвета) оказывают влияние на отображение [trn], находясь как внутри, так и снаружи его области.

Употребление переводов и комментариев :: Запись в DSL

загрузить
	[m1]1) [com][i]что (чем).[/i][/com] [trn]Наполнить грузом, запасами, товарами.[/trn][/m]
	[m1]2) [com][i]кого (что).[/i][/com] [trn]Обеспечить работой, занять работой, делами в нужном количестве.[/trn][/m]

Замечания: Если словарь имеет большой размер и развитую структуру, то самостоятельная расстановка [trn] имеет смысл. В остальных случаях достаточно воспользоваться опцией автоматической разметки при компилировании DSL.

Иногда вместо расстановки [trn] проще и эргономичней расставить [!trs], т.е. разметить текст не для включения, а для исключения из индекса. Эту тактику нужно обязательно совмещать с применением автоматической разметки при компилировании DSL: Create dictionary ready for indexing.

GoldenDict игнорирует поисковые функции [trn], поскольку поиск и индексация осуществляются в нём другим, отличным от Lingvo, способом. Однако GoldenDict обрабатывает разметку этого тэга, что можно использовать для визуального оформления его содержимого при помощи стилей CSS (подробнее об этом см. в справке к GoldenDict).

История: Тэг введён в употребление в Lingvo 6.

Тэг [trn1]…[/trn1]

Недокументированный тэг

Назначение: Автоматическая разметка текста для индексирования.

Общая информация: Этот тэг появился в DSL сравнительно недавно — начиная с последних обновлений Lingvo x5 (в версии 15.0.847 он уже употребляется). Как свидетельствует его имя, он родственен тэгу [trn], но не идентичен ему. Сходство и различие наблюдается как в именах 2ух этих тэгов, так и в их работе.

Подобно своему родственнику, тэг [trn1] принадлежит к группе тэгов поисковой обработки и участвует в создании поискового индекса.

Подобно своему родственнику, тэг [trn1] причисляет текст к поисковой категории Translations.

В отличие от своего родственника, тэг [trn1] используется только в автоматическом режиме: с его помощью выполняется создание автоматической разметки текста для индексирования. Автоматическую разметку можно включить только при компилировании DSL опцией Create dictionary ready for indexing в диалоговом окне DSL Compiler.

При выполнении автоматической разметки в начало и конец каждой словарной статьи помещаются открывающий и, соответственно, закрывающий дескрипторы [trn1]…[/trn1]. Т.о. весь текст словаря направляется в индекс, после чего становится доступен для полнотекстового поиска. Подробнее об этом см. в главе Поиск и индексирование в Lingvo.

Отображение в карточках: На сегодняшний день содержимое [trn1]…[/trn1] отображается в Lingvo стандартным, чёрным цветом и дополнительно никак не выделяется.

Особенности: Самостоятельное использование [trn1] в DSL запрещено. Если компилятор обнаружит эти тэги в тексте словаря, то сообщит о нарушении синтаксиса и исключит из результирующего LSD все статьи, где они используются.

Замечания: Использование автоматической разметки неэкономично, поскольку помещает в индекс текст всего словаря без учёта полезности и разбора по категориям. Однако оно удобно и практично, поскольку не отнимает времени и не требует от составителя дополнительных технических знаний и навыков.

Использование автоматической разметки хорошо сочетается с тактикой самостоятельного исключения из индекса, т.е. с предварительной «ручной» расстановкой в DSL тэгов [!trs]. Иногда это сделать проще и эргономичней, чем заниматься кропотливой расстановкой вручную [trn].

Тэг [trn1] можно встретить в тексте DSL, полученных путём декомпиляции из LSD. Если таковые оказались у вас в руках, и вы намерены заново компилировать их в LSD для использования в Lingvo, просто удалите все [trn1] или замените их на родственные [trn]. Для использования подобных DSL в GoldenDict это делать необязательно, т.к. данная программа в целом игнорирует присутствие в словарях тэгов поисковой обработки.

История: Тэг введён в употребление в одном из последних обновлений Lingvo x5: в каком именно — вопрос, но известно, что компилятор 15.0.847.0 его уже применяет, а 15.0.826.26 — ещё нет. Появление [trn1] обусловлено характерной для предшествующих версий проблемой конфликта однотипных тэгов. Как известно, в DSL запрещено размещать тэги одного типа в зоне действия друг друга. В предшествующих версиях при выполнении автоматической разметки использовался тэг [trn]. Это и являлось корнем проблемы: если [trn] расставлялись в DSL вручную, а затем во время компилирования дополнительно включалась автоматическая разметка, «ручные» [trn] попадали в зону действия расставленных автоматически и вызывали конфликт, который препятствовал созданию полноценного LSD. Во избежание подобных ситуаций тэгу автоматической разметки было присвоено новое имя — [trn1].

Тэг [!trs]…[/!trs]

Назначение: Разметка текста, как зоны исключения из индексации.

Этимология: trs — аббревиатура от англ. Text Retrieval System, наименование службы индексирования в Lingvo. Это же сокращение Lingvo использует для расширений индекс-файлов — *.trs. Символ восклицания ! означает исключение, т.о. !trs — это исключение из *.trs.

Использование: Только внутри одной из зон индексации, т.е.:

  1. в заголовках;
  2. в теле статьи только в зонах действия тэгов [trn], [ex] и [com];
  3. в любом месте тела статьи при условии включения автоматической разметки, т.е. автоматической расстановки тэга [trn1] при компиляции (опция компилятора Create dictionary ready for indexing).

Отображение в карточках: На сегодняшний день содержимое [!trs]…[/!trs] отображается в Lingvo стандартным, чёрным цветом и дополнительно никак не выделяется.

Общая информация: Тэг участвует в создании поискового индекса, который Lingvo формирует для осуществления поиска слов по тексту словарей. При построении индекса учитывается только текст, расположенный в одной из зон индексации, каковыми на сегодняшний день являются: заголовки, переводы [trn], примеры [ex] и комментарии [com]. При помощи [!trs] можно исключить из индекса фрагменты упомянутых зон. Текст, исключённый из индекса, становится недоступным для полнотекстового поиска по словарям в Lingvo.

Исключение из зоны индексации :: Запись в DSL

довершить
	[m1][trn][!trs](несов. довершать)[/!trs] довести до конца, окончить[/trn][/m]
	[m2][*][ex]\[Бибиков \]не успел довершить начатого им: измученный трудами, беспокойством и досадами...[/ex][/*][/m]
	[m2][*][com]Пушкин, История Пугачева, [!trs]стр. 45[/!trs][/com][/m]

Особенности: Использование [!trs] за пределами одной из зон индексации запрещено. Иначе компилятор выразит протест и исключит из результирующего LSD статьи с нарушениями. Исключение из этого правила составляет компилирование с включением автоматической разметки, т.е. с активной опцией Create dictionary ready for indexing в диалоговом окне DSL Compiler.

Замечания: Иногда проще и эргономичней расставить [!trs] вместо [trn], т.е. разметить текст не для включения, а для исключения из индекса. Эту тактику нужно обязательно совмещать с применением автоматической разметки при компилировании DSL: Create dictionary ready for indexing.

GoldenDict игнорирует поисковые функции [!trs], поскольку поиск и индексация осуществляются в нём другим, отличным от Lingvo, способом. Однако GoldenDict обрабатывает разметку этого тэга, что можно использовать для визуального оформления его содержимого при помощи стилей CSS (подробнее об этом см. в справке к GoldenDict).

История: Тэг введён в употребление в Lingvo 6.

Тэг [lang]…[/lang]

Назначение: Разметка текста, как принадлежащего к языку, отличному от заявленного в директиве #CONTENTS_LANGUAGE.

Использование: Только в теле словарных статей. Использование [lang] в заголовках не запрещено, но не имеет смысла.

Общая информация: Согласно правилам DSL, в директиве #CONTENTS_LANGUAGE каждого словаря необходимо указывать язык словарных статей, т.е. язык на который осуществляется перевод или толкование заголовочного слова. Это указание влияет в дальнейшем на поведение программы при выполнении задач, связанных с языковыми особенностями (такими, например, как показ грамматических форм). Иногда же в теле статьи встречаются слова, язык которых отличается от заявленного в #CONTENTS_LANGUAGE — их корректную обработку и призван обеспечить тэг [lang]. Наиболее частый контекст использования [lang] — примеры употребления заголовочного слова в устной и письменной речи, где показательная фраза всегда приводится на двух языках: заголовков и перевода.

Отображение в карточках: Содержимое [lang]…[/lang] отображается в Lingvo стандартным, чёрным цветом и дополнительно никак не выделяется.

Синтаксис: Тэг употребляется только в форме с атрибутами, коих существует 2: name и id.

Употребление языковой разметки :: Запись в DSL

	[m2][*][ex][lang name="Russian"]поиск полезных ископаемых[/lang] — prospecting[/ex][/*][/m]
	[m2][*][ex][lang id=1049]поиск информации[/lang] — information retrieval[/ex][/*][/m]

Особенности: Если в статье использован текст, язык которого отличается от языка перевода (т.е. заявленного в директиве #CONTENTS_LANGUAGE), и который не отмаркирован при помощи тэга [lang], то последствия станут следующими:

Отсутствие языковой разметки не влияет на глобальный «Поиск в словарях».

При компилировании словаря Lingvo автоматически добавляет пробел перед закрывающим дескриптором [/lang]. Это рекомендуется учитывать при составлении словарей, чтобы избежать нечаянного появления лишних пробелов.

Замечания: Об особенностях реализации поддержки некоторых языков в Lingvo смотри главы Lingvo x3 (14.0) и Lingvo x5 (15.0) в разделе Из истории Lingvo.

GoldenDict игнорирует языковые функции [lang], поскольку работа с языками осуществляются в нём другим, отличным от Lingvo, способом. Однако GoldenDict обрабатывает разметку этого тэга, что можно использовать для визуального оформления его содержимого при помощи стилей CSS (подробнее об этом см. в справке к GoldenDict).

Список языков, поддерживаемых GoldenDict, также отличается от такового в Lingvo. Ознакомиться с ним можно в исходном коде программы: по атрибуту name в language.cc, и по атрибуту id в dsl_details.cc.

История: Тэг введён в употребление в Lingvo 8.


[1] «Автоматическим» в Lingvo называется поиск по тексту статей, который запускается в случае, если при переводе слова или словосочетания для него не нашлось отдельной статьи. Вкратце, «Автоматический поиск» отличается от «Поиска в словарях» тем, что он более упрощённый и его настройки нельзя изменить. Побробнее см. в статье Поиск в Lingvo словаря-справочника Mostitsky DSL Help.

[2] Имеется в виду контекстное меню, доступное в словарной карточке по щелчку ПКМ.