[mdk-re] html2text in sylpheed

Mikhail Zabaluev =?iso-8859-1?q?mookid_=CE=C1_sigent=2Eru?=
Пн Мар 19 00:30:37 MSK 2001


Hello Sergey,

On Fri, Mar 16, 2001 at 23:15 +0300, Sergey Vlasov wrote:
>
> On Fri, 16 Mar 2001 12:53:42 +0300
> Vyt <vyt на vzljot.ru> wrote:
> 
> > Hello, All
> > 
> > Получил тут письмо от рассылки citycat, прилагается. При просмотре
> > sylpheed преобразует html в plain text, и это радует. Но в некоторых
> > местах этого письма (про Джю Бонда :) текст показывается в неправильной
> > кодировке (например, фрагмент"технологии - в разведке"). Это проявляется
> > при кодировках koi8-r и 1251, другие не пробовал. Mozilla показывает
> > этот
> > html нормально.
> > Наверное, опять баг, но сам его прибить я не смогу ;(
> 
> Действительно, не перекодирует. Похоже, мешает символ 0x96 из CP1251 - 'en dash'. Для этого символа нет точного эквивалента в koi8-r, поэтому iconv отказывается перекодировать его, а Sylpheed при этом не может придумать ничего лучшего, чем оставить строку без перекодировки. Кстати, подобная ситуация встречается и без HTML - при этом Sylpheed заменяет всю строку на "Code conversion failed".
> 
> Вопрос ко всем - есть ли какие-либо стандартные средства для "приближенной" перекодировки (например, в данном случае можно было бы просто заменить этот символ на обычный '-')? В Windows, например, функции перекодировки всегда работают в этом режиме (например, заменяют псевдографику на "+-|"). Такая возможность в данном случае была бы очень полезна.

Есть recode - независимая от iconv библиотека. Трансляции iconv из glibc
довольно легко расширить своими собственными, но это решение, естественно,
будет специфичным для GNU-систем.

-- 
Stay tuned,
  MhZ                                    mailto:mookid на sigent.ru
-----------
Noncombatant:  A dead Quaker.
-- Ambrose Bierce
[MhZ: в полудреме удивился - откуда это Амброз Бирс мог узнать о Quake]




Подробная информация о списке рассылки community