[room] еду в Одессу,

Пн Авг 31 21:52:01 MSD 2009

никогда не был. Очень хочется.

Сделаю экспресс-доклад на конференции Foss-sea.

Оттуда в Крым, на Мангуп!

Вот текст:

Интересно, что коды живут под свободными лицензиями, а тексты - нет.
Википедия хранит информацию, словарные статьи. Это не "тексты", ибо
достоинство текста - то же, что и достоинства живописного полотна -
подлинность. Прямые - "наивные" - попытки использовать принципы СПО
для текстов, подобные, например, wikisource, можно считать
провалившимися. Они не развиваются. Хранилища текстов, подобные
lib.ru, существуют пока, и слава богу. Но дальнейшая их судьба неясна
из-за лицензионных ограничений, во-первых, и из-за неавторитетности
самих текстов, представленных в этих хранилищах. Лицензионных
ограничений нет для текстов проекта Гуттенберг. Однако авторитетность
представленных там текстов также совсем не ясна. Прочитать-то можно,
но вот что ты читаешь, это вопрос.

То, что все тексты будут в скором времени переведены в электронную
форму, и что дело это перспективное, подтверждается существованием
проектов наподобие google books, конкурирующим микрософтовским, scribd
и пр. Скорее всего, эти проекты тоже нужно признать "наивными", хотя и
в другом роде. Дело в том, что тексты (в широком смысле слова текст)
слишком разнообразны, чтобы было возможно упаковать их в единое
хранилище. Текст есть, вопреки кажущейся очевидности, не вещь, по
крайней мере не неизменная сущность, а, так же как и программа, - есть
процесс, в том числе общественный процесс. Например, практически
каждый диалог Платона в Европе переиздается в виде отдельной книжки
раз в десять лет, и это каждый раз - другой текст. Изменения,
возможно, касаются единственной запятой, но в статье, сопровождающей
публикацию, а статья может занимать половину этой книжки, изменения
будут обоснованы.

Мне кажется, что дело не в решении юридических проблем, которые,
конечно, тоже нужно решать, а в создании программного обеспечения,
которое позволило бы тексту "жить" в электронной форме. Сделало бы его
авторитетным источником. Точно так же, как мы сейчас видим и
используем авторитетные источники программного кода. Конечно,
поддержание авторитетности конкретного текста - задача
соответствующего творческого и компетентного коммьюнити, а вовсе не
всеядных проприетарных гуглемонстров. Не вижу ничего плохого именно в
этом монстре, есть и похуже, но не думаю, что он с задачей справится.

Эта задача - для многих и очень разных коммьюнити, построенных на
принципах FOSS.  Но ПО для функционирования таких коммьюнити пока нет
совсем, и даже задача его создания, по-моему, в программистской среде
пока не осознана. Представьте себе, например, центр, библиотеку, где
хранятся и поддерживаются (распределенно!), например, тексты по
традиционной тибетской медицине. Пользователь, читатель, или
"потребитель текста" должен уметь обратиться к этому центру и получить
интересующий его текст в гарантированно (в том числе и юридически
гарантированно) авторитетном виде.

Что может быть принципом такого хранилища текста? Наверное то, что
текст должен храниться не "в виде байтов", а в среде языка. То есть
каждое слово текста должно быть "понято", то есть распознано и
классифицировано системой, "знающей" соответствующий язык в процессе
его развития. Наверное, это минимальное требование для самой
возможности "авторизации текста".

Вот приблизительно об этом я думаю, работая над http://diglossa.org,
буду рад услышать ваши соображения, и найти единомышленников.

М.