[Homeros] I: Ветка для украинского языка

tolyangin на mail.ru tolyangin на mail.ru
Вт Июн 15 18:57:35 UTC 2010


Michael Pozhidaev wrote:







 > Всегда есть возможность сделать ручку, которая что-нибудь
> переключала бы в сервере. В общем, если народ опишет, как он хотел
> бы это видеть на практике, можно придумать, как это реализовать.




Я вношу транскрипции для звучания украинских символов и слогов в файл replacements.sam.  когда мне нужно переключить в буфере на чтение украинским произношением переключаюсь по C-e d p sam RET.
В других буферах остается русское произношение, imho удобно.


>
>> Хотя мне именно такой подход, о каком вы тут говорите,  больше
>> интересен.
>
> Ну да, тоже думал, что без этого должно быть неудобно.



Я согласен с Дмитрием, для украинского языка необходимы словари..
Более того, по всей видимости  без таких словарей правильного
звучания украинского языка добиться будет вряд ли возможным..

>> Опишите здесь каким образом можно настраивать звучание произношения
>> .  Какие секции за что отвечают.
>
> Есть два пути настроить звучание букв:
>
> 1. в вызове синтезатора между iconv и ru_tts добавить ещё вызов tr,
> где составить таблицу замен символов. Подход универсальней, так как
> проще потом подцепить натуральный украинский синтезатор. Но тут надо
> знать, кодировки koi8-r и koi8-u держат одинаковые буквы на одних
> местах или нет. То есть, если я возьму текст в koi8-u, где
> используются только буквы, присутствующие в русском языке, нормально
> он прочитается в koi8-r;

Вариант срабатывает если добавлять вызов tr после iconv 
Если добавить вызов перед iconv - речи не будет вовсе.


Но качество речи на выходе получается очень плохое. Слова в которых заменяются произношение рурских букв 'еи' прочитываются чуть ли не по буквам.
С  заменой 'і' более нормально, слова в которых этот символ подменяется звучан ием 'и' читаются слитно, за теми редкими исключениями когда этот символ gпрочитывается мбролой как i.


Отключал rutts словари произношений  аргументом -m это  положения не меняло- слова все равно читались прерывисто.
С другими синтезаторами наблюдалась аналогичная ситуация.


>
> 2. добавить нужные записи в файл replacements.all. То есть строки
> вида:
Качество  чтение получается одинаково плохим  в обоих вариантах. Я предпочел бы читать украинский текст вообще без этих замен . 





>
> ukr:и:ы
>
> Поскольку файлы replacements всегда кодируются через utf-8, то без
> опаски можно указывать там и русские и украинские буквы. Мне первый
> вариант более симпатичен, но выбор за пользователями.


оба варианта на практике не пригодны. преимущество второго в том что можно менять чтения языков на лету для отдельных буферов.



Подробная информация о списке рассылки Homeros