[devel] нужна помощь (похоже, --as-needed)

Alexey Tourbin =?iso-8859-1?q?at_=CE=C1_altlinux=2Eru?=
Вс Июл 9 02:45:17 MSD 2006


On Sun, Jul 09, 2006 at 02:08:57AM +0400, Kirill Maslinsky wrote:
> > В общем я там его ещё захачил и вот только что залил в incoming.
> > Для экспериментов конечно было бы проще использовать sqlite3, но
> > с автором мы списались, по части database backend'ов можно ожидать
> > некоторого прогресса.
> 
> Огромное спасибо! А то из меня сборщик посредственный -- ужасно много 
> времени уходит на это.
> 
> > Это язык запроса по аннотированному тексту, он понимает структуру
> > предложения; это хорошо.  Я только не понял, он сам умеет текст
> > аннотировать или нет?  Чем тогда аннотировать?
> 
> Насколько я понимаю, он сам ничего не аннотирует, и даже ничего не 
> понимает: это просто реализация некой модели представления данных. 
> Модель же эта привлекла меня следующими качествами: 
> 	- на одну и ту же строку данных можно наложить сколько угодно 
> 	  независимых иерархий, а значит, работает markup overlap 
> 	- допускаются прерывистые компоненты (которых в естественном
> 	  синтаксисе хватает)

У меня вопрос пока попроще.  То есть он работает с аннотированным
текстом, который содержит структурную разметку, то есть типа предложение
"The door was blue" выглядит так:

{clause:
{phrase: {word: The (article}} {word: door (noun)}	(NP)}
{phrase: {word: was (verb)}				(VP)}
{phrase: {word: blue (adjective)}			(AP)}}

При этом Emdros реализует язык запросов (структурированных паттернов)
для поиска по такому уже размеченному тексту.  Язык этот называется MQL.
Больше он ничего не реализует, или же я пока дотуда не дочитал.

А вопрос простой: как разметить текст?  Как из plain text получить
annotated text, который можно анализировать с помощью MQL?
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/devel/attachments/20060709/cafd950a/attachment-0001.bin>


Подробная информация о списке рассылки Devel