[Comm] UTF-8 а Master 2.2 [JT]
Aleksey Novodvorsky
=?iso-8859-1?q?aen_=CE=C1_altlinux=2Eru?=
Чт Мар 6 18:32:54 MSK 2003
Anton Kovalenko пишет:
>>>>>>Aleksey Novodvorsky writes:
>>>>>>
>>>>>>
>
> >> 2. поддержка bash (readline), textutils, fileutils с
> >> точки зрения UTF8
>
> > Поддержка UTF-8 базовыми утилитами Unix -- большая
> > проблема, так как требует их серьезного концептуального
> > пересмотра и тщательного аудита. Мое _личное_ мнение --
> > сквозной переход Unix на UTF-8 locales практически
> > невозможен, так как приведет к большим проблемам с
> > security.
>
>Это очень странно слышать. Сквозной переход на UTF-8 locales --
>попросту бессмысленен. А вот корректная поддержка multibyte
>characters, _частным случаем_ которой является UTF-8 -- уже
>становится традицией.
>
Да, конечно.
Но -- не сквозная. Сквозная поддержка multibyte locales приведет к
описанным мною ранее проблемам.
Сквозная поддержка требует принципиально новых разработок.
>
>Что же касается security, -- в системе, где имена файлов case
>sensitive, да ещё с такой приличной кодировкой, как UTF-8 (где
>невозможен \000 в середине строки, где любой встретившийся
>символ из диапазона ascii всегда означает самого себя, где
>никакой ascii-символ не имеет альтернативного представления) --
>непонятно, откуда возьмутся проблемы.
>
При чем здесь имена файлов? Когда Вы имеете дело с "символом
неопределенной длины" -- проблемы неизбежны.
На самом деле, до сих пор всплывают проблемы c security даже при работе
в не-POSIX locale.
Rgrds, AEN
Подробная информация о списке рассылки community