[Comm] UTF-8 а Master 2.2 [JT]

Vitaly Ostanin =?iso-8859-1?q?vyt_=CE=C1_vzljot=2Eru?=
Пт Мар 28 13:31:06 MSK 2003


On Fri, 28 Mar 2003 02:14:11 +0300
Mikhail Zabaluev <mhz на altlinux.org> wrote:

<skipped/>

> Более того, наличие в Unicode комбинирующих символов
> делает понятия "символ как номер в машинном представлении"
> и "символ как единица текста" неэквивалентными, заставляя
> прибегать к сложным схемам канонизации.
> Насчёт удобства хранения не всё так однозначно:
> строки из правильных (32-битных) wchar_t сжирают уж
> слишком много места при преимущественном пользовании
> ASCII.
> 
> > А для  utf-8 роль Единой  и Единственной вовсе не  подходит.
> > Она просто частный случай в зоопарке многобайтовых кодировок.
> > Причём один из самых простых частных случаев.
> 
> Замечательные свойства, подмеченные Вами, делают UTF-8
> лучшим из возможных кандидатов на универсальную кодировку.

Что подтверждается практическим использованием UTF-8 в качестве
внутреннего представления данных в [the] библиотеке для работы с
XML :)

<skipped/>

-- 
Regards, Vyt
mailto:  vyt на vzljot.ru
JID:     vyt на vzljot.ru
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/community/attachments/20030328/71df6aeb/attachment-0005.bin>


Подробная информация о списке рассылки community