[docs] О разделении инструментов редактора и автора ( было: ALT packaging docs)

Kirill Maslinsky kirill на altlinux.ru
Ср Ноя 17 14:53:08 MSK 2004


Добрый день!

> Дело в том, что вести редактуру в том же формате, что прислал автор, означает только то, что те проблемы, которые
> были у автора с docbook, будут теперь у редактора с присланным форматом. Редактирование ST без валидирования,
> а тем более - человеком, который не знает ST - приводит к тем же последствиям, что и редактирование docbook в аналогичной 
> ситуации. Так что редактор docbook работающий  с ST - это не решение.

Два возможных выхода:

1. Редактор -- этакий полиглот, толмач, который знает все языки разметки
(в конце концов выучить их несравнимо проще, чем естественные языки). 
Да и не так много разных форматов используют авторы. Мне не очень 
нравится этот вариант, слишком высокие требования предъявляются к 
редактору. ;)

2. Автор и редактор общаются на некоем lingua franca, пиджине, где, 
возможно, доступно меньше средств выражения (меньше понятий разметки), 
но зато он не требует специальных познаний и им владеют все. Самый 
естественный (и единственный?) кандидат в такие lingua franca -- plain text.
Всякие производные от diff позволяют легко отслеживать сделанные изменения. 

При этом теряется почти вся метафинформация при передаче
авторский формат <=> plain text <=> DocBook
Её не очень жалко, потому что авторские тексты почти никогда не содержат 
всей необходимой для документа в DOCS метаинформации (логической разметки). 
Её становится жалко, если авторский формат -- тоже DocBook, в этом случае 
править разметку всё-таки проще, чем размечать заново.

А вот задача внесения исправлений в исходные авторские форматы (и автоматизации
этого процесса) ложится на авторов. Задача автоматизации внесения исправлений
из plain text в DocBook -- на участников проекта DOCS. На первый взгляд 
эта задача кажется нетривиальной. У кого-нибудь есть соображения и 
предложения?

> > Проблемы бы не было, если бы процесс преобразования в DocBook был
> > автоматическим, но, но...
> 
> Мне кажется, что тут в принципе нуджно думать только в направлении решений, основанных на автоматизации
> преобразования в обе стороны, причем преобразование должно проходить условно-без потерь. Условно - потому,
> что если один из форматов некой метаинформации не содержит, то сохранить ее там не удастся: можно попробовать только
> сохранить отдельно, но, в общем, кажется это будет тяжело воплотить в жизнь.

В этом направлении я думаю во всякую свободную минуту. Наполеоновская идея 
состоит в том, чтобы разработать язык для написания конвертеров _логически
размеченных документов_. Этаких таблиц соответствия для способов выражения
одной и той же семантической информации в разных форматах разметки.
Но это дело на полжизни.

На данный момент пытаюсь сформулировать по возможности лаконичную и достаточно
абстрактную систему примитивов, в терминах которых можно было бы описать любые
смысловые единицы документа. Сразу оговорюсь во избежание вопросов: XML такой
системы примитивов не предоставляет, в нём нет никаких понятий,
специфических для _документов_. А все документы по интуитивному ощущению
устроены очень сходным образом. 

> PS: Когда-то один мой знакомый (к сожалению, запамятовал, кто именно), с пеной у рта доказывал
> мне, что XML - это такой формат, который поддерживается кучей фирм, которые написали кучу средств,
> позволяющих, например, унифицировать преобразование не только в любой формат, но и из любого формата.
> Я, правда, знаю только как преобразовывать из xml ;), не подумайте, что издеваюсь.

Конечно. Вот ТеХ, например, -- это вообще не формат, равно как и XML. Хотя и на
ТеХе, и на XMLe можно написать систему логической разметки документов. 
Можно даже написать такие системы на TeX и XML, в которых будет эквивалентное
количество метаинформации. Только куче фирм тут придётся написать ещё один
конвертер, чтобы преобразовывать документы в этих, на этот раз эквивалентных,
системах разметки из одной в другую. Так что я не знаю, ни как преобразовывать
в XML, ни как из XML. И не подуймайте, что я издеваюсь. ;))

> PPS: В принципе для ST существует конвертер в docbook, правда, не очень хороший, отчасти потому, что строгая
> разметка в случае ST не столь важна.

А конвертер обратно? Ещё менее вероятно. 

-- 
Kirill Maslinsky
ALT Linux Team * Documentation Project   



Подробная информация о списке рассылки docs