[Homeros] I: Ветка для украинского языка

tolyangin на mail.ru tolyangin на mail.ru
Вс Июн 13 21:59:53 UTC 2010


Michael Pozhidaev wrote:

> Hello, tolyangin на mail.ru!
>
>> Вот новый оутпут  - третий,  добавить как раз и не получилось.
>
> Тут можно поразбираться, если пришлёте конфиг с ошибкой.

Потом обязательно пришлю. >
>> Как тогда быть с буквами "и" ""е"?  В обоих языках они
>> присутствуют, но читаются по разному В случае с "е" думаю не так
>> страшно, в большинстве случаев по русски она всеравно читается как
>> -э.
>
> Тут затрудняюсь что-нибудь предложить. Поскольку наделить супер
> мозгами наш софт мы не можем, остаётся только размышлять, Как это
> будет приемлемо по удобству для пользователей.
Возможно можно задать шаблон для подмены звуков основываясь на
попадание специфичных для украинского языка символов, в определенном
отрывки текста.  Например в предложении  абзаце  или нескольких
абзацах или параграфе.

О чем то таком писал Степан.

Не знаю можно ли такой шаблон написать с tr, но может быть sed?


>
> Всегда есть возможность сделать ручку, которая что-нибудь
> переключала бы в сервере. В общем, если народ опишет, как он хотел
> бы это видеть на практике, можно придумать, как это реализовать.
>
>> Хотя мне именно такой подход, о каком вы тут говорите,  больше
>> интересен.
>
> Ну да, тоже думал, что без этого должно быть неудобно.
>
>> Опишите здесь каким образом можно настраивать звучание произношения
>> .  Какие секции за что отвечают.
>
> Есть два пути настроить звучание букв:
>
> 1. в вызове синтезатора между iconv и ru_tts добавить ещё вызов tr,
> где составить таблицу замен символов. Подход универсальней, так как
> проще потом подцепить натуральный украинский синтезатор. Но тут надо

что значит "потом подцепить натуральный украинский синтезатор"? 

> 
> знать, кодировки koi8-r и koi8-u держат одинаковые буквы на одних
> местах или нет. То есть, если я возьму текст в koi8-u, где
> используются только буквы, присутствующие в русском языке, нормально
> он прочитается в koi8-r;
>
Вы можете показать как составить такую таблицу?
Потому что второй вариант оказался малоприглядным..


> 2. добавить нужные записи в файл replacements.all. То есть строки
> вида:
>
> ukr:и:ы
>


после добавления строк 
> ukr:и:ы
> ukr:і:и


он оба символа понимает как ы.


Притом мне не понятно.
В одних текстах он читает везде -ы. В других такое впечатление что
правило не срабатывает и  вроде как  не существует вовсе.


написание в емаксе он читает с новыми настройками, а вот весь
браузенинг читает как и раньше, по русски.
Качество чтения большинства текста на выходе получается  не важным.

С остальными символами тоже непонятки. Но я запарюсь ситуации описывать,
сам уже начинаю путаться где какая буква.


Он обе букві начинает чі
> Поскольку файлы replacements всегда кодируются через utf-8, то без
> опаски можно указывать там и русские и украинские буквы. Мне первый
> вариант более симпатичен, но выбор за пользователями.


Подробная информация о списке рассылки Homeros