[Homeros] ветка украинского языка

Michael Pozhidaev msp на altlinux.ru
Вт Июн 15 19:29:58 UTC 2010


Hello, i_chay!

> Ручное переключение языков и автопереключение -- это, на мой взгляд, вообще к речевому серверу не имеет отношения. Сервер должен поддерживать команду смены языка (или предоставлять вызов для смены языка), но следствием чего будет эта команда -- пользователь нажал на клавишу или модуль определения языка выдал свой результат -- в общем случае, для сервера не должно иметь значения.
> Также не относится к функционалу сервера  (по крайней мере, ядра
> сервера) реализация квази-украинского языка. Если предполагается, что
> это будет подгружаемый модуль (вариант текстового препроцессора) или
> внешней утилиты, то я не совсем понял, зачем сделали отдельную ветку
> для сервера с поддержкой украинского языка?

Реализация квази-украинского языка, конечно же, не часть сервера. Это
можно сделать просто скриптами или простыми средствами linux. В коде
сервера некоторое знание о украинском языке всё-таки должно быть. Он
держит таблицу всех символов, по которой решает, какому языку
принадлежит тот или иной кусок текста. Если текст латинский, то
используем анг. синтезатор, если текст кириллический, то берём
синтезатор русский. Поскольку наборы символов украинского и русского
языков различаются, то и эта таблица должна  составляться немного
по-разному. Поскольку теперь проблем с перезагрузкой параметров нет, то
ручка, меняющая эту таблицу, выглядит тривиально. Ну вот и всё, дело
только в этом. А как потом текст, состоящий из отфильтрованных
украинских букв станет обрабатываться, вот это уже действительно не
задача сервера. Для определённости ещё, может быть, стоит заметить, что
одновременное появление в сервере записей, обрабатывающих русский и
украинский язык, быть не должно. Они пересекаются по множеству
символов. Когда мы говорим о автоматическом распознавании, то
подразумевается, что в сервере указывается некий такой русско-украинский
язык, а синтезатор для этого языка представляет уже механизм
распознавания. Но для сервера это один синтезатор,  не два разных. Может
быть этот момент стоит просветить яснее, поэтому спрашивайте, если нужно.

-- 
Michael Pozhidaev. Tomsk, Russia. E-mail: msp на altlinux.ru
Russian info page: http://www.marigostra.ru/



Подробная информация о списке рассылки Homeros