Помощь

Как работает поиск по словарю?

Вы набираете японское или русское слово в строке поиска, и далее оно отправляется на сервер особой программе, которая ищет в базе данных словаря статьи, содержащие это слово. Результатом работы этой программы является список найденных статей, отсортированный по так называемому признаку релевантности. Упрощенно этот признак можно описать как степень соответствия найденной статьи тому, что вы ожидали найти.

Предположим, вы переводите с японского языка статью, в которой вам встретилось слово 実行. Набирая это слово в строке поиска, вы рассчитываете получить статью, в которой это слово будет заглавным. Такая статья в словаре есть, ее заголовок — じっこう【実行】(дзикко:)〔007-82-36〕. Именно она будет наиболее релевантна вашему запросу — в ней слово 実行 стоит в сильной позиции. Помимо нее в словаре имеется еще 12 статей, в которых слово 実行 встречается в различных более слабых позициях: в примерах (например, в статье じゅくする【熟する】(дзюкўсуру)〔007-70-31〕) и в составе более сложных слов (например, в статье じっこうりょく【実行力】(дзикко:рёку)〔008-97-98〕). Эти статьи менее релевантны по отношению к вашему запросу. Сортируя найденные статьи, программа помещает выше других те статьи, в которых слово стоит в сильной позиции. 

Итак, сильной позицией считается позиция отдельно стоящего слова в заголовке. Однако, как не трудно догадаться, это справедливо только для японских слов. Русские слова не встречаются в заголовках, поэтому для них должна быть найдена своя сильная позиция. 

Русское слово считается стоящим в сильной позиции, если оно встречается в статье как отдельно стоящий перевод. Для примера рассмотрим следующую статью: 

あそび【遊び】(асоби)〔001-51-21〕
1) игра (детская, спортивная, карточная);
2) развлечение, гулянье, приятное времяпрепровождение;
遊びがてら отчасти, чтобы рассеяться (развлечься);
遊びの文学 развлекательная (лёгкая) литература;
遊びに行く пойти (поехать) погулять (развлечься); пойти в гости;
遊びにいらっしゃい заходите!;
3) прогулка, пикник, экскурсия [на лоно природы];
そこは一日の遊びにはちょうどいい туда хорошо поехать на целый день;
4) кутёж, попойка; азартные игры;
遊びをする人 человек, прожигающий (ведущий беспутную) жизнь;
5) неиспользование; холостой ход; тех. игра, люфт;
商売はまるで遊びです работа идёт вхолостую;
遊びのある顔 отсутствующий взгляд. 

В этой статье желтым маркером отмечены сильные позиции русских слов. Следует обратить внимание на следующие особенности определения сильной позиции:

  1. Толкования, объединенные в одном значении и разделенные запятой или точкой с запятой, считаются отдельно стоящими. Это значит, что в приведенной выше статье в значении 3) имеется три слова («прогулка», «пикник» и «экскурсия»), стоящих в сильной позиции.

  2. Все пометы и пояснения в толкованиях игнорируются.

  3. В сильной позиции может стоять не слово, а словосочетание. В этом случае, статья будет считаться более релевантной по отношению именно к этому словосочетанию, а не к отдельным его словам. Например, в значении 5) имеется толкование «холостой ход». Это толкование не является сильной позицией для слов «холостой» и «ход» по отдельности. То есть эта статья при поиске по запросу «холостой» окажется в результатах поиска ниже, скажем, статьи どくしん【独身】(докўсин)〔008-82-12〕.

  4. Из-за чисто технических сложностей, которые в скором времени, как мы надеемся, будут устранены, элементы толкований, заключенные в квадратные (факультативная часть толкования) и круглые скобки (альтернативная часть толкования), игнорируются.

Задача вычисления релевантности является достаточно сложной. Поэтому иногда результаты поиска могут быть отсортированы не совсем так, как ожидает пользователь. Если вы регулярно сталкиваетесь с нерелевантностью в результатах поиска, добавьте тикет в репозиторий WARODAI — возможно, ваши наблюдения помогут улучшить алгоритм сортировки.

Как искать японские слова?

На сегодняшний день система принимает две традиционные формы ввода японских слов: смешенное написание иероглифами и каной (например, 紙漉き ) и написание чистой каной (かみすき). Также поддерживается поиск по кириллической транскрипции по системе Поливанова. Следует обратить внимание, что кириллическая транскрипция по Поливанову должна быть введена точно:  программа не сможет провести поиск, если вы, например, использовали сочетания «ши» и «ша» для транскрибирования слогов し и しゃ или «е» вместо «э», «джи» вместо «дзи» и т.п. 

Как искать слова и иероглифические сочетания, начинающиеся или заканчивающиеся определенной строкой?

Часто возникает необходимость найти не определенное слово, а несколько слов, начинающихся или заканчивающихся с определенной строки. Для этих целей вы можете использовать в поисковом запросе специальный символ * (астериск, «звездочка»), значение которого можно толковать как «0 или более любых символов». Например, вы хотите найти все японские слова, заканчивающиеся иероглифом 化. Для этого просто наберите в поисковой строке запрос «*化». Поисковая система будет трактовать ваш запрос так: «найди все статьи, в которых есть 化, а перед ним 0 или более любых символов». Соответственно, запрос «化*» будет трактоваться как «...化, а после него 0 или более любых символов». И, наконец, запрос «*化*» - как «...化, а после него или перед ним 0 или более любых символов». 

Символ * можно использовать и более изощрено, чередую им символы. Например, запрос «概*化» сообщает системе, что вам нужны статьи, в которых есть слово, начинающееся на 概 и заканчивающееся на 化. Еще более сложный запрос - «人*孵*法». Он сообщает, что вам нужны статьи, в которых есть слово, в которое последовательно входит три иероглифа: 人, 孵 и 法, а между ними могут быть (но не обязательно) другие иероглифы в любом количестве. 

Обратите внимание, что при использовании * в результатах поиска попадут и те статьи, где указанное слово встречается необязательно до или после *. Однако эти статьи в любом случае будут находится ниже всех статей, жестко соответствующих запросу. Это сделано для того, чтобы пользователь имел возможность найти и те сочетания, которые встретились примерах и различных пояснениях.

Почему некоторые слова и словосочетания не находятся в словаре?

Причин может быть несколько.

  1. Такого слова и словосочетания может просто не быть в словаре. Не стоит забывать, что основной словник WARODAI был заимствован из бумажной версии Большого японско-русского словаря (БЯРС), который был создан в 60-е годы прошлого века. Редакторы электронной версии стараются добавлять новые значения и написания, но этот процесс не поспевает за скоростью развития японского языка.

  2. В словаре это слово написано с ошибкой. Редакторы стараются выявлять и исправлять такие ошибки.

  3. Вы неверно пишите слово в запросе. Особенно часто это случается при поиске японских слов транскрибированных по системе Поливанова. Подробнее об этом смотри раздел «Как искать японские слова?».

  4. Словосочетание есть в словаре, но оно содержит вставные элементы, которые мешают найти его по подстроке. Например, вы ищите словосочетание «программа института». Система не найдет ни одной статьи, в которой бы содержалось такое словосочетание. Однако оно зафиксировано в словаре в статье コア・カリキュラム(коа-карикюраму)〔005-97-50〕 в следующем виде: «программа (института, университета)». Проблема состоит в том, что между словами «программа» и «института» стоит скобка, а кроме того слово «институт» стоит в пояснении (выделено курсивом). Для того, чтобы программа нашла данную статью достаточно использовать в вашем запросе символ * - «программа*института». Таким образом вы указываете системе, что между словом «программа» и «институт» может стоять 0 или более призвольных символов. 

  5. Неизвестная ошибка в алгоритме поиска. Все компьютерные системы несовершенны. Наша система не является исключением. Вы можете скачать полную текстовую версию словаря и провести поиск в ней. Если выяснилось, что слово или словосочетание находится в текстовом файле, но не находится системой поиска, вы можете добавить тикет в репозиторий этого сайта.

  6. Какая-нибудь другая причина, о которой мы еще не знаем.

Как устроена словарная статья?

Результатом поиска по введенному вами ключевому слову является список словарных статей. Ниже представлено несколько схем типичных словарных статей:

Схема 1

1 - транскрипция заглавного японского слова слоговой азбукой;
2 - варианты иероглифического написания японского слова, разделенные символом ・;
3 - транскрипция японского слова по системе Поливанова
4 - идентификатор словарной карточки;
5 - русское значение
6 - устойчивые выражения или примеры с заглавным словом
7 - помета.

Схема 2

1,2 - транскрипция слоговой азбукой. В данной статье объединены сразу две японских лексемы: かじき и かじきまぐろ. Объединение в одной статье нескольких лексем (гнездование) производится в том случае, если их значения абсолютно синонимичны. Транcкрипции лексем разделяются запятой.
3, 4 - иероглифические написания лексем. Написания, относящиеся к разным лексемам, разделяются запятой. Однако в данном случае наличиствует по несколько вариантов написания каждой из лексем: для かじき это 旗魚 или 羽魚 или 舵木 или 梶木, для かじきまぐろ - 旗魚鮪 или 羽魚鮪 или 舵木まぐろ или 梶木まぐろ. Варианты иероглифических написаний одной и той же лексемы разделяются символом ・.
5 - желтым цветом в тексте статьи выделена подстрока, введенная вами при поиске

Схема 3

1 - номер значения. Если у слова более одного значения, они располагаются под номерам 1), 2), 3) и т.д.
2 - ссылка на другую статью
3 - фразеологизм. Фразеологизмы обозначаются в тексте статьи символом ◇.

Как установить и настроить словарь в формате EPWING под Windows?

На нашем сайте вы можете скачать японско-русский словарь WARODAI в формате EPWING. Ниже приведена последовательность действий для установки и настройки программы EbWin 4 для пользования словарем.

  1. Скачайте и установите програму EbWin 4. Скачать ее можно по адресу: http://ebstudio.info
  2. Распакуйте скачанный архив словаря в любую удобную для вас директорию.
  3. Запустите EbWin 4, в меню File нажмите пункт Add Dict и в открывшемся окне найдите файл CATALOGS, лежащий внутри одной из подиректорий, получившихся при распаковке скачанного архива.
  4. Теперь вы можете пользоваться словарем.