[mdk-re] Re: [re] Re: [re] HTML в stuphead.

Mikhail Zabaluev =?iso-8859-1?q?mookid_=CE=C1_sigent=2Eru?=
Сб Дек 9 20:56:00 MSK 2000


Hello Roman,

On Sat, Dec 09, 2000 at 01:02 +0300, Roman S wrote:
>
> On Fri, 8 Dec 2000 22:24:22 +0300 (MSK)
> Ivan Zakharyaschev <vanyaz на mccme.ru> wrote:
> 
> > На затронутые вопроосы, наверное, можно взглянуть по-иному, если учитывать
> > внутреннее представление сообщений в Unicode (UTF-8).
> 
> Да, становится в общем-то всё просто, за исключением именования чарсетов...
> Цепочки в общем-то получается простые - 
> current OS charset -> Unicode -> target msg charset
> msg charset -> unicode -> OS charset.

На этапе перекодировки из Unicode в target charset хорошо бы обрабатывать
fallback'и - не заменять все "неуставное" знаком безмерного удивления, а
пытаться подыскать разумный заменитель. recode это умеет, в glibc в
принципе можно добавить (даже для отдельно взятого приложения,
см. 'info libc') "нестрогие" версии кодировок.

-- 
Stay tuned,
  MhZ                                    mailto:mookid на sigent.ru
-----------
Boycott meat -- suck your thumb.




Подробная информация о списке рассылки community