[room] xdxf
Michael Bykov
=?iso-8859-1?q?m=2Ebykov_=CE=C1_gmail=2Ecom?=
Вс Май 25 22:54:27 MSD 2008
Виталий, спасибо.
Да, спасибо, я уже увидал. Вот это особенно здорово и интересно -
> Планируется объединение формата (совместная разработка) с
> проектом XDXF (создание универсального формата для всех словарей).
я думаю, что это невозможно, в силу текучего состояния всякого языка.
И в силу больших и принципиальных отличий языков друг от друга. Но в
первом приближении, наверное, можно много сделать. Универсального
формата нет даже на wiktionary.org, а для каждого языка свой и все и
по случаю.
Я поговорил с Сергеем Снеговым(?), автором флуентайзера. Он не
сторонник открытых форматов вообще, насколько я понял, это меня как-то
насторожило.
Я сейчас в Питере, и хотел к вам зайти, без цели, просто
засвидетельствовать свое почтение. На днях (может завтра) уеду в
москву, но потом вернусь. Так что зайду , обсудим.
А мои соображения такие -
универсальный формат должен быть процесс - процесс подготовки
словарных статей, сначала в простейшем формате с текстовой разметкой
полей, чтобы все было очевидно, потом сложнее и сложнее вплоть до
самого полного на сегодняшний день формата в xml, или семейсва таких
форматов. Как оно и происходит на практике. Нужно только его
(процесс) отслеживать, находясь в сознании.
Я хочу сделать словарь древнегреческого языка, словарь -
необработанный - у меня есть, русский и английсикй . Но туда нужно
поместить все словоформы каждого слова. Оказалось, это можно сделать
прямо в стардикте, так есть "синонимы". Если принять словофрмы за
синонимы, правда, нельзя будет вывести на экран информацию о
конкретной форме (падеж, число и пр.), это жалко. Но зато, кажется,
можно сделать работающую (в первом приближении) вещь прямо счас.
А преобразовать в xml-ную форму со всеми аттрибутами, да потом еще
сделать что-то свое вместо стардикта, кажется, очень сложно.
М.
Подробная информация о списке рассылки smoke-room