[devel] Различные словари и stardict
Вячеслав
Вячеслав
Пн Июн 14 15:46:54 MSD 2004
On Сбт, 2004-06-12 at 21:43 +0400, Vitaly Lipatov wrote:
> Здравствуйте!
> Я тут в очередной раз подошёл к проблеме словарей
> Проблем как минимум две:
> 1. Существует достаточно большое количество форматов баз.
> 2. в src.rpm-пакетах в основном отсутствуют исходники словарей.
> Для решения проблем нужно иметь в наличии некий исходный формат
> словаря (не принципиально какой), главное в нём не было потери
> исходной информации, и существовали скрипты преобразования в
> остальные форматы, которые применяются (в частности, для которых
> есть оболочки в Сизифе).
Существуют подобные разработки. Однако, все словари надо сначала будет
перевести в этот формат, что довольно трудоемко.
> Идеальным (по экономии места) был бы вариант развития плагинов к
> словарям, позволяющих использовать "чуждые" форматы как свои, я
> уж не говорю о том, что форматы некоторых словарей могли бы и
> вовсе не различаться...
Эта идея лежит на поверхности и давно выдвигалась.
Например: см. http://slovnik.lrn.ru/ Проект должен был использовать оба
подхода, но был заморожен на стадии планирования. Есть разрозненные
куски кода и страница. В ограниченном виде должно быть реализовано в
новых версиях dict. Проблема - набор поддерживаемых модулями форматов.
> Очень бы хотелось услышать от кого-нибудь знающего, верно ли я
> понимаю ситуацию, и может проблема уже разрешена (будет
> разрешена в ближайшей перспективе).
Мой вывод: Проблема не решена, но может быть решена быстро.
Самая главная проблема - доступ к более ширококому спектру баз данных,
чем минимальный набор в Сизифе. Что делать тем, кому нужну другие
иностранные языки, помимо английского и словари по специальным отраслям?
Самые представительные по количеству баз, широте тематики и качеству
наборы словарей, хоть как-то доступные в среде Linux и поддерживающие
русский язык - multitran и polyglossum 1.x (.pgb). Для первого
существует примитивная тесктовая оболочка, второй поддерживается древним
проектом kdict и новым движком на TCL. Оболочек, пригодных для
повседневной работы с ними нет. Качество данных входящих в Сизиф
"свободных" словарей недостаточно для работы переводчика.
--
Вячеслав Диконов <sdiconov на mail.ru>
Подробная информация о списке рассылки Devel