[Comm] htmldoc utf8 русский язык в html файлах

Mikhail Kuligin =?iso-8859-1?q?mail4network_=CE=C1_gmail=2Ecom?=
Сб Авг 16 15:26:11 MSD 2008


Здравствуйте,
(прошу прощения предыдущее письмо с оборванной темой ушло случайно
видимо по горячей клавише gmail web интерфейса)

кто то пользуется htmldoc?
никак htmldoc с русским не дружит
знаю что в сизифе он уже пропатчен, а у меня branch 4.1
и сизифный тянет 2 библиотеки, экспериментировать не хочу так как уже
один раз угробил систему установкой пакетов из сизифа


с htmldoc работаю так:

htmldoc -t html --book --embedfonts --charset utf-8 inputfile.html -f
outputfile.html

вычитал на одном блоге про опцию --embedfonts, там же стянул шрифты с
русскими кодировками и положил в /usr/share/htmldoc/fonts

исходный файл inputfile.html в utf8 кодировке
в outputfile.html  крякозябры, не подходит ни одна кодировка :(

подумал, что может htmldoc будет работать со старыми кодировками,
например koi8-r

iconv -f utf8 -t koi8r input.html -o output.html
получаю:
iconv: недопустимая входная последовательность в позиции 2720

как найти эту последовательность?
обычно ссылаются на ошибку в строке...


Подробная информация о списке рассылки community