[Comm] UTF-8 а Master 2.2 [JT]

Vitaly Ostanin vyt на vzljot.ru
Пт Мар 28 13:31:06 MSK 2003


On Fri, 28 Mar 2003 02:14:11 +0300
Mikhail Zabaluev <mhz на altlinux.org> wrote:

<skipped/>

> Более того, наличие в Unicode комбинирующих символов
> делает понятия "символ как номер в машинном представлении"
> и "символ как единица текста" неэквивалентными, заставляя
> прибегать к сложным схемам канонизации.
> Насчёт удобства хранения не всё так однозначно:
> строки из правильных (32-битных) wchar_t сжирают уж
> слишком много места при преимущественном пользовании
> ASCII.
> 
> > А для  utf-8 роль Единой  и Единственной вовсе не  подходит.
> > Она просто частный случай в зоопарке многобайтовых кодировок.
> > Причём один из самых простых частных случаев.
> 
> Замечательные свойства, подмеченные Вами, делают UTF-8
> лучшим из возможных кандидатов на универсальную кодировку.

Что подтверждается практическим использованием UTF-8 в качестве
внутреннего представления данных в [the] библиотеке для работы с
XML :)

<skipped/>

-- 
Regards, Vyt
mailto:  vyt на vzljot.ru
JID:     vyt на vzljot.ru
----------- следущая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : отсутствует
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: отсутствует
Url     : /pipermail/community/attachments/20030328/71df6aeb/attachment.bin


Подробная информация о списке рассылки Community