[devel] Различные словари и stardict
Vitaly Lipatov
=?iso-8859-1?q?lav_=CE=C1_altlinux=2Eru?=
Сб Июн 12 21:43:01 MSD 2004
Здравствуйте!
Я тут в очередной раз подошёл к проблеме словарей
Проблем как минимум две:
1. Существует достаточно большое количество форматов баз.
2. в src.rpm-пакетах в основном отсутствуют исходники словарей.
Ну к примеру тот же webster для dict. В src.rpm лежат сразу
dict-файлы для словаря, хотя исходно он в другом формате.
Я собрал для Сизифа WordNet, foldoc и ещё веду engcom в трёх
форматах (mova, dict, stardict); базы первых двух достаточно
объёмны, и дублировать их совсем не хочется, а особенно не
хочется дублировать src.rpm под разные форматы.
Для решения проблем нужно иметь в наличии некий исходный формат
словаря (не принципиально какой), главное в нём не было потери
исходной информации, и существовали скрипты преобразования в
остальные форматы, которые применяются (в частности, для которых
есть оболочки в Сизифе).
Идеальным (по экономии места) был бы вариант развития плагинов к
словарям, позволяющих использовать "чуждые" форматы как свои, я
уж не говорю о том, что форматы некоторых словарей могли бы и
вовсе не различаться...
Кстати, напомню (вдруг, как и я, кто-нибудь не знает), в Сизифе
есть (и заливается) словарные базы следующих форматов:
startdict
(к нему Мюллер, словники, engcom, foldoc)
dict
(Мюллер, словники, Webster, Даль, engcom, eng-deu)
multitran (консольная оболочка к нему в libmt-utils)
со словарями проекта www.multitran.ru
mova
(Мюллер, engcom)
wordnet (графическая оболочка к нему в wordnet-tk)
Очень бы хотелось услышать от кого-нибудь знающего, верно ли я
понимаю ситуацию, и может проблема уже разрешена (будет
разрешена в ближайшей перспективе).
--
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! LaTeX! LyX!
Подробная информация о списке рассылки Devel