[Homeros] Ветка украинского языка

Швець Степан shvets_stepan на ukr.net
Ср Июн 16 08:41:53 UTC 2010


Здравствуйте, господа. в одном из предыдущих писем был поднят вопрос о
возможности/невозможности корректного чтения украинских текстов
русскоязычными синтезаторами.
Цитирую:
Я не филолог, но скажу, что "правильного" звучания с ru_tts добиться
будет не возможно, будь у вас хоть стопицот словарей. У фонемофона нет
необходимых фонем. Навскидку: г глотковое, у неслоговое, и короткое, ц
мягкое. А те фонемы, что есть, не идеальны для украинского языка. В
украинском "ы" и "и" звучит не так, как в русском; тяжение к
озвенчиванию согласных (в то время, как в русском они оглушаются).
С реализацией словаря ударений тоже врядли хорошая затея: в русском
языке гласные принято редуцировать  в слабых слогах, и засчет протяжения
гласной 1 слог выделяется. В украинском же ударение происходит больше
засчет усиления громкости гласной в слоге, но в соседних слогах гласные
у нас не редуцируются. По-этому украинца в москве всегда слышно за версту.
Конец цитаты
Во первых, давайте не будем требовать невозможного. Думаю, я не открою
секрета, если скажу, что даже в пределах русского языка, произношение целого
ряда звуков очень различно, взависимости от региона. Надеюсь, не кому не
взбредет в голову разрабатывать отдельные синтезаторы для точного
воспроизведения особенностей московской, поволжской, кубанской и других
видов речи. Если же взбредет, то от себя могу только пожелать удачи. Что
касается украинского языка, то его поддержка, на довольно приемлемом уровне
реализована в виндовых програмах, о которых я писал раньше. Теория
языкознания и звукообразования у отдельных народов, конечно, штука
интересная, но давайте будем исходить из существующих реалий.
С ударениями, также дело не столь безнадежно. Насколько я могу судить,
акцентирование ударного слога во всех известных мне синтезаторах происходит
путем изменения не столько силы звука, сколько частотного его спектра. В
данном случае, главное, чтобы костюмчик сидел. Иначе говоря, чтоб ударения
находились на своих местах. Еще раз хочу подчеркнуть, что знаком с работой
данного механизма непонаслышке и могу утверждать, что нормальные словари
украинского и русского языков на 99 процентов снимают ощущение дискомфорта.
Но если хочется просто поизвращатся, занимаясь никому не нужным
теоретизированием, то почему бы не вспомнить проблему далеко не идеального
синтеза человеческого голоса самими синтезаторами? Ведь никто же не станет
меня уверять, что тут нет проблем. Есть и довольно ощутимые. И связаны они с
очень бедным, я бы даже сказал, убоким частотным спектром синтезированного
голоса, по сравнению с человеческим.
Я проводил эксперимент однажды. Записал генерируемый синтезатором голос в
звуковой файл и подверг его довольно серъезной частотной обработке в
звуковом редакторе. Проще говоря, усилил, характерные для человеческого
голоса гармоники, прогнал через настроенный соответствующим образом
эквалайзер и увеличил частоту дискретизации. Качество результирующего файла,
оказалось на несколько порядков выше. И что? Любопытно, но не более того. Я
совсем не склонен думать, что кто-то будет чем-то подобным заниматся, при
разработке новых синтезаторов речи. Слишком большим оказывается поток
выходных данных.
А теперь, у меня вопрос ко всем программистам и к Михаилу в частности. Может
есть смысл мне связаться с авторами виндовых говорилок и попросить у них их
словари? Насколько реально портировать это все хозяйство в линукс?



Подробная информация о списке рассылки Homeros