[devel] Различные словари и stardict

Vitaly Lipatov =?iso-8859-1?q?lav_=CE=C1_altlinux=2Eru?=
Сб Июн 12 21:43:01 MSD 2004


Здравствуйте!
Я тут в очередной раз подошёл к проблеме словарей
Проблем как минимум две:
1. Существует достаточно большое количество форматов баз.
2. в src.rpm-пакетах в основном отсутствуют исходники словарей.
Ну к примеру тот же webster для dict. В src.rpm лежат сразу 
dict-файлы для словаря, хотя исходно он в другом формате.

Я собрал для Сизифа WordNet, foldoc и ещё веду engcom в трёх 
форматах (mova, dict, stardict); базы первых двух достаточно 
объёмны, и дублировать их совсем не хочется, а особенно не 
хочется дублировать src.rpm под разные форматы.

Для решения проблем нужно иметь в наличии некий исходный формат 
словаря (не принципиально какой), главное в нём не было потери 
исходной информации, и существовали скрипты преобразования в 
остальные форматы, которые применяются (в частности, для которых 
есть оболочки в Сизифе).

Идеальным (по экономии места) был бы вариант развития плагинов к 
словарям, позволяющих использовать "чуждые" форматы как свои, я 
уж не говорю о том, что форматы некоторых словарей могли бы и 
вовсе не различаться...

Кстати, напомню (вдруг, как и я, кто-нибудь не знает), в Сизифе 
есть (и заливается) словарные базы следующих форматов:
	startdict
		(к нему Мюллер, словники, engcom, foldoc)
	dict
		(Мюллер, словники, Webster, Даль, engcom, eng-deu)
	multitran (консольная оболочка к нему в libmt-utils)
		со словарями проекта www.multitran.ru
	mova
		(Мюллер, engcom)
	wordnet (графическая оболочка к нему в wordnet-tk)

Очень бы хотелось услышать от кого-нибудь знающего, верно ли я 
понимаю ситуацию, и может проблема уже разрешена (будет 
разрешена в ближайшей перспективе).

-- 
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! LaTeX! LyX!



Подробная информация о списке рассылки Devel