[devel] Различные словари и stardict

Вячеслав Вячеслав
Пн Июн 14 15:46:54 MSD 2004


On Сбт, 2004-06-12 at 21:43 +0400, Vitaly Lipatov wrote:
> Здравствуйте!
> Я тут в очередной раз подошёл к проблеме словарей
> Проблем как минимум две:
> 1. Существует достаточно большое количество форматов баз.
> 2. в src.rpm-пакетах в основном отсутствуют исходники словарей.

> Для решения проблем нужно иметь в наличии некий исходный формат 
> словаря (не принципиально какой), главное в нём не было потери 
> исходной информации, и существовали скрипты преобразования в 
> остальные форматы, которые применяются (в частности, для которых 
> есть оболочки в Сизифе).
Существуют подобные разработки. Однако, все словари надо сначала будет
перевести в этот формат, что довольно трудоемко.

> Идеальным (по экономии места) был бы вариант развития плагинов к 
> словарям, позволяющих использовать "чуждые" форматы как свои, я 
> уж не говорю о том, что форматы некоторых словарей могли бы и 
> вовсе не различаться...
Эта идея лежит на поверхности и давно выдвигалась. 
Например: см. http://slovnik.lrn.ru/ Проект должен был использовать оба
подхода, но был заморожен на стадии планирования. Есть разрозненные
куски кода и страница. В ограниченном виде должно быть реализовано в
новых версиях dict. Проблема - набор поддерживаемых модулями форматов. 

> Очень бы хотелось услышать от кого-нибудь знающего, верно ли я 
> понимаю ситуацию, и может проблема уже разрешена (будет 
> разрешена в ближайшей перспективе).
Мой вывод: Проблема не решена, но может быть решена быстро.


Самая главная проблема - доступ к более ширококому спектру баз данных,
чем минимальный набор в Сизифе. Что делать тем, кому нужну другие
иностранные языки, помимо английского и словари по специальным отраслям?

Самые представительные по количеству баз, широте тематики и качеству
наборы словарей, хоть как-то доступные в среде Linux и поддерживающие
русский язык - multitran и polyglossum 1.x (.pgb). Для первого
существует примитивная тесктовая оболочка, второй поддерживается древним
проектом kdict и новым движком на TCL. Оболочек, пригодных для
повседневной работы с ними нет. Качество данных входящих в Сизиф
"свободных" словарей недостаточно для работы переводчика.

-- 
Вячеслав Диконов <sdiconov на mail.ru>




Подробная информация о списке рассылки Devel