[sisyphus] Re: docbook-dtds

Ivan Chelubeev =?iso-8859-1?q?ijon_=CE=C1_module=2Eru?=
Ср Мар 6 17:29:37 MSK 2002


Vyt wrote:
> On Wed, 06 Mar 2002 17:06:44 +0300
> Ivan Chelubeev <ijon на module.ru> wrote:
> 
> <skipped>
> 
>>>Ок, спасибо. А можно, pls, то же самое на user level? Например,
>>>какие заклинания сотворить для конвертации DocBook XML с русским
>>>текстом в html?
>>>
>>1. Документы создавать в utf-8.
>>2. Для jw, docbook2html и иже с ними определять переменную окружения 
>>SP_ENCODING=xml (чтобы кодировка документа бралась из самого XML-документа):
>>    SP_ENCODING=xml docbook2html -o <output.html> <input.xml>
>>
>>Документация на SGML-парсер SP, на основе которого построен jade, фиксирует 
>>следующую ситуацию с кодировками:
>>   * варианты unicode,
>>   * iso-8859-n,
>>   * японо-китайско-корейские,
>>на Windows (только, если jade собирался msvc) ещё есть:
>>   * ms-dos, windows, wunicode
>>
>>Так что ни cp1251, ни windows-1251, ни koi8-r jade не проходят.
>>
>>Документацию см. либо в src.rpm, либо в cvs openjade-проекта на sourceforge -
>>http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/openjade/sp/doc/,
>>файлы charset.htm, xml.htm
>>
> 
> Спасибо!
> 
> Кстати, sgmltools file.xml с таким началом
> ----
> <?xml version="1.0" encoding="cp1251"?>
> <!DOCTYPE chapter PUBLIC "-//OASIS//DTD DocBook XML V4.1.2//EN"
>                   "http://www.oasis-open.org/docbook/xml/4.1.2/docbookx.dtd">
> ....
> 
> Конвертируется в html вроде бы корректно, во всяком случае, текст
> читаем.
> 
> <skipped>
> 

Файл-то получается, да в нём только латиница читаемая, а вместо русского - 
одни крякозябры (у меня - так; html получается в utf-8, при просмотре в utf-8 
вместо кириллицы - знаки вопроса).







Подробная информация о списке рассылки Sisyphus