[Homeros] I: Ветка для украинского языка
tolyangin на mail.ru
tolyangin на mail.ru
Вс Июн 13 21:59:53 UTC 2010
Michael Pozhidaev wrote:
> Hello, tolyangin на mail.ru!
>
>> Вот новый оутпут - третий, добавить как раз и не получилось.
>
> Тут можно поразбираться, если пришлёте конфиг с ошибкой.
Потом обязательно пришлю. >
>> Как тогда быть с буквами "и" ""е"? В обоих языках они
>> присутствуют, но читаются по разному В случае с "е" думаю не так
>> страшно, в большинстве случаев по русски она всеравно читается как
>> -э.
>
> Тут затрудняюсь что-нибудь предложить. Поскольку наделить супер
> мозгами наш софт мы не можем, остаётся только размышлять, Как это
> будет приемлемо по удобству для пользователей.
Возможно можно задать шаблон для подмены звуков основываясь на
попадание специфичных для украинского языка символов, в определенном
отрывки текста. Например в предложении абзаце или нескольких
абзацах или параграфе.
О чем то таком писал Степан.
Не знаю можно ли такой шаблон написать с tr, но может быть sed?
>
> Всегда есть возможность сделать ручку, которая что-нибудь
> переключала бы в сервере. В общем, если народ опишет, как он хотел
> бы это видеть на практике, можно придумать, как это реализовать.
>
>> Хотя мне именно такой подход, о каком вы тут говорите, больше
>> интересен.
>
> Ну да, тоже думал, что без этого должно быть неудобно.
>
>> Опишите здесь каким образом можно настраивать звучание произношения
>> . Какие секции за что отвечают.
>
> Есть два пути настроить звучание букв:
>
> 1. в вызове синтезатора между iconv и ru_tts добавить ещё вызов tr,
> где составить таблицу замен символов. Подход универсальней, так как
> проще потом подцепить натуральный украинский синтезатор. Но тут надо
что значит "потом подцепить натуральный украинский синтезатор"?
>
> знать, кодировки koi8-r и koi8-u держат одинаковые буквы на одних
> местах или нет. То есть, если я возьму текст в koi8-u, где
> используются только буквы, присутствующие в русском языке, нормально
> он прочитается в koi8-r;
>
Вы можете показать как составить такую таблицу?
Потому что второй вариант оказался малоприглядным..
> 2. добавить нужные записи в файл replacements.all. То есть строки
> вида:
>
> ukr:и:ы
>
после добавления строк
> ukr:и:ы
> ukr:і:и
он оба символа понимает как ы.
Притом мне не понятно.
В одних текстах он читает везде -ы. В других такое впечатление что
правило не срабатывает и вроде как не существует вовсе.
написание в емаксе он читает с новыми настройками, а вот весь
браузенинг читает как и раньше, по русски.
Качество чтения большинства текста на выходе получается не важным.
С остальными символами тоже непонятки. Но я запарюсь ситуации описывать,
сам уже начинаю путаться где какая буква.
Он обе букві начинает чі
> Поскольку файлы replacements всегда кодируются через utf-8, то без
> опаски можно указывать там и русские и украинские буквы. Мне первый
> вариант более симпатичен, но выбор за пользователями.
Подробная информация о списке рассылки Homeros