[Homeros] I: Ветка для украинского языка
tolyangin на mail.ru
tolyangin на mail.ru
Вт Июн 15 18:57:35 UTC 2010
Michael Pozhidaev wrote:
> Всегда есть возможность сделать ручку, которая что-нибудь
> переключала бы в сервере. В общем, если народ опишет, как он хотел
> бы это видеть на практике, можно придумать, как это реализовать.
Я вношу транскрипции для звучания украинских символов и слогов в файл replacements.sam. когда мне нужно переключить в буфере на чтение украинским произношением переключаюсь по C-e d p sam RET.
В других буферах остается русское произношение, imho удобно.
>
>> Хотя мне именно такой подход, о каком вы тут говорите, больше
>> интересен.
>
> Ну да, тоже думал, что без этого должно быть неудобно.
Я согласен с Дмитрием, для украинского языка необходимы словари..
Более того, по всей видимости без таких словарей правильного
звучания украинского языка добиться будет вряд ли возможным..
>> Опишите здесь каким образом можно настраивать звучание произношения
>> . Какие секции за что отвечают.
>
> Есть два пути настроить звучание букв:
>
> 1. в вызове синтезатора между iconv и ru_tts добавить ещё вызов tr,
> где составить таблицу замен символов. Подход универсальней, так как
> проще потом подцепить натуральный украинский синтезатор. Но тут надо
> знать, кодировки koi8-r и koi8-u держат одинаковые буквы на одних
> местах или нет. То есть, если я возьму текст в koi8-u, где
> используются только буквы, присутствующие в русском языке, нормально
> он прочитается в koi8-r;
Вариант срабатывает если добавлять вызов tr после iconv
Если добавить вызов перед iconv - речи не будет вовсе.
Но качество речи на выходе получается очень плохое. Слова в которых заменяются произношение рурских букв 'еи' прочитываются чуть ли не по буквам.
С заменой 'і' более нормально, слова в которых этот символ подменяется звучан ием 'и' читаются слитно, за теми редкими исключениями когда этот символ gпрочитывается мбролой как i.
Отключал rutts словари произношений аргументом -m это положения не меняло- слова все равно читались прерывисто.
С другими синтезаторами наблюдалась аналогичная ситуация.
>
> 2. добавить нужные записи в файл replacements.all. То есть строки
> вида:
Качество чтение получается одинаково плохим в обоих вариантах. Я предпочел бы читать украинский текст вообще без этих замен .
>
> ukr:и:ы
>
> Поскольку файлы replacements всегда кодируются через utf-8, то без
> опаски можно указывать там и русские и украинские буквы. Мне первый
> вариант более симпатичен, но выбор за пользователями.
оба варианта на практике не пригодны. преимущество второго в том что можно менять чтения языков на лету для отдельных буферов.
Подробная информация о списке рассылки Homeros