[room] xdxf

Michael Bykov =?iso-8859-1?q?m=2Ebykov_=CE=C1_gmail=2Ecom?=
Вс Май 25 22:54:27 MSD 2008


Виталий, спасибо.

Да, спасибо, я уже увидал. Вот это особенно здорово и интересно -

> Планируется объединение формата (совместная разработка) с
> проектом XDXF (создание универсального формата для всех словарей).

я думаю, что это невозможно, в силу текучего состояния всякого языка.
И в силу больших и принципиальных отличий языков друг от друга.  Но в
первом приближении, наверное, можно много сделать. Универсального
формата нет даже на wiktionary.org, а для каждого языка свой и все и
по случаю.

Я поговорил с Сергеем Снеговым(?), автором флуентайзера. Он не
сторонник открытых форматов вообще, насколько я понял, это меня как-то
насторожило.

Я сейчас в Питере, и хотел к вам зайти, без цели, просто
засвидетельствовать свое почтение. На днях (может завтра) уеду в
москву, но потом вернусь. Так что зайду , обсудим.

А мои соображения такие -

универсальный формат должен быть процесс - процесс подготовки
словарных статей, сначала в простейшем формате с текстовой разметкой
полей, чтобы все было очевидно, потом сложнее и сложнее вплоть до
самого полного на сегодняшний день формата в xml, или семейсва таких
форматов. Как оно и происходит на практике.  Нужно только его
(процесс) отслеживать, находясь в сознании.

Я хочу сделать словарь древнегреческого языка, словарь -
необработанный - у меня есть, русский и английсикй . Но туда нужно
поместить все словоформы каждого слова. Оказалось, это можно сделать
прямо в стардикте, так есть "синонимы". Если принять словофрмы за
синонимы,  правда, нельзя будет вывести на экран информацию о
конкретной форме (падеж, число и пр.),  это жалко. Но зато, кажется,
можно сделать работающую (в первом приближении) вещь прямо счас.

А преобразовать в xml-ную форму со всеми аттрибутами, да потом еще
сделать что-то свое вместо стардикта, кажется, очень сложно.

М.


Подробная информация о списке рассылки smoke-room