[Homeros] Q: Идеальное речевое окружение

i_chay i_chay на rambler.ru
Пн Июн 21 20:37:11 UTC 2010


Приветствую всех.

Алексей пишет:
> То, что вы предлагаете, я называю "песочницей": а именно созданная под 
> незрячего программа, которая имеет собственный речевой интерфейс. 

Насколько я понял, речь не совсем о программе, а скорее, о некотором (возможно, абстрактном) пользовательском интерфейсе, базирующемся на речевом и звуковом выводе.
Такие интерфейсы нужны не только незрячим. См. например:
http://www.voicexml.org/

Я согласен, что искусственно отрывать речевой интерфейс от графического не следует (в том числе и потому, что это исключает более-менее продуктивное взаимодействие зрячих и незрячих при совместном использовании одной системы/устройства).
Но есть ситуации (например, устройства без поддержки GUI или вообще без дисплея -- бытовая техника, DAISY-проигрыватели, банковские терминалы  и т.п.), в которых самостоятельный речевой интерфейс вполне уместен, а главное, не привязан к GUI ввиду  отсутствия последнего. 
Мне показалось, что обсудить предполагалось именно базовые принципы и организацию пользовательского речевого интерфейса, а не противопоставление одних вспомогательных технологий другим.
Учтем еще, что в gtk+ доступность реализуется через предоставление альтернативного контента, а не через доступ к реальной экранной информации (тоже самое отчасти справедливо и по отношению к Emacspeak). Таким образом, обсуждение  некоторой спецификации, содержащей рекомендации по дизайну звукового / речевого представления альтернативного контента, имеет право на существование (и это тоже можно отнести к понятию удобного речевого окружения).
Иными словами, незрячий пользователь взаимодействует с речевым окружением, независимо от того, связано оно с графическим/текстовым визуальным интерфейсом или нет. Вопрос в том, могут ли и должны ли у такого окружения быть общие принципы, идеология и т. п..; можно ли предложить разработчикам универсальную схему наполнения такого окружения. 
Нередко  разработчик слабо представляет, какую информацию хотел бы от него получить пользователь  вспомогательных технологий (конечно, на этот счет есть кое-какие рекомендации, но не всегда они дают однозначный и полный ответ на вопрос, что надо делать).
присутствует в рекомендациях, например, по назначению ролей accessibility-элементам, но это ведь никак не ограничивает нас в выборе темы для обсуждения.

> Ресурсов у 
> нас и так очень мало, мы не можем пойти путем дублирования всех уже 
> созданых программ, или "дописывая" навески интерфейса к ним. Лучше 
> потратить эти ресурсы на улучшение вспомогательных технологий, которые 
> дадут возможность получать доступ к огромному количеству уже написаных 
> программ.

Это, скорее, разговор о стратегии и тактике развития вспомогательных технологий, нежели о том, что должно собой представлять идеальное речевое окружение. Но стоит заметить, что во втором случае так же, как и в первом, придется "дописывать  навески интерфейса" к уже существующим программам, так как самое слабое место нынешних вспомогательных технологий -- это игнорирование этих технологий разработчиками сторонних приложений.  К примеру, возьмите игры, входящие в дистрибутив GNOME: несмотря на то что GUI в GNOME поддерживает альтернативное представление, в эти игры играть невозможно именно в силу того, что в них не реализован соответствующий интерфейс (хотя среди этих игр есть, в смысли понимания ,  вполне доступные для незрячих).  В данном случае улучшение технологии вряд ли даст заметный результат, пока сам разработчик не реализует необходимые структуры данных для альтернативного представления.

Если же Михаил предлагал обсудить своеобразный "швейцарский нож", который будет иметь исключительно речевой вывод и специально написанные для него модули, реализующие все то, что уже реализовано программами с визуальным пользовательским интерфейсом, то такая разработка уже есть -- называется Adriane (правда, оставить пользователя один на один с речевым выводом там не решились и есть альтернатива в виде текста на экране, но по идее и реализации это очень близко к "песочнице").

Я тоже не совсем понял, зачем упомянута Java (технология проприетарная, будущее ее не так очевидно). И вообще, не существует каких-либо объективных причин привязывать обсуждение идеального речевого окружения к конкретной технологии реализации.

    Успехов. Анатолий.


Подробная информация о списке рассылки Homeros