[sisyphus] Re: docbook-dtds
Ivan Chelubeev
=?iso-8859-1?q?ijon_=CE=C1_module=2Eru?=
Ср Мар 6 17:29:37 MSK 2002
Vyt wrote:
> On Wed, 06 Mar 2002 17:06:44 +0300
> Ivan Chelubeev <ijon на module.ru> wrote:
>
> <skipped>
>
>>>Ок, спасибо. А можно, pls, то же самое на user level? Например,
>>>какие заклинания сотворить для конвертации DocBook XML с русским
>>>текстом в html?
>>>
>>1. Документы создавать в utf-8.
>>2. Для jw, docbook2html и иже с ними определять переменную окружения
>>SP_ENCODING=xml (чтобы кодировка документа бралась из самого XML-документа):
>> SP_ENCODING=xml docbook2html -o <output.html> <input.xml>
>>
>>Документация на SGML-парсер SP, на основе которого построен jade, фиксирует
>>следующую ситуацию с кодировками:
>> * варианты unicode,
>> * iso-8859-n,
>> * японо-китайско-корейские,
>>на Windows (только, если jade собирался msvc) ещё есть:
>> * ms-dos, windows, wunicode
>>
>>Так что ни cp1251, ни windows-1251, ни koi8-r jade не проходят.
>>
>>Документацию см. либо в src.rpm, либо в cvs openjade-проекта на sourceforge -
>>http://cvs.sourceforge.net/cgi-bin/viewcvs.cgi/openjade/sp/doc/,
>>файлы charset.htm, xml.htm
>>
>
> Спасибо!
>
> Кстати, sgmltools file.xml с таким началом
> ----
> <?xml version="1.0" encoding="cp1251"?>
> <!DOCTYPE chapter PUBLIC "-//OASIS//DTD DocBook XML V4.1.2//EN"
> "http://www.oasis-open.org/docbook/xml/4.1.2/docbookx.dtd">
> ....
>
> Конвертируется в html вроде бы корректно, во всяком случае, текст
> читаем.
>
> <skipped>
>
Файл-то получается, да в нём только латиница читаемая, а вместо русского -
одни крякозябры (у меня - так; html получается в utf-8, при просмотре в utf-8
вместо кириллицы - знаки вопроса).
Подробная информация о списке рассылки Sisyphus