[Comm] UTF-8 а Master 2.2 [JT]

Aleksey Novodvorsky =?iso-8859-1?q?aen_=CE=C1_altlinux=2Eru?=
Чт Мар 6 18:32:54 MSK 2003


Anton Kovalenko пишет:

>>>>>>Aleksey Novodvorsky writes:
>>>>>>            
>>>>>>
>
>    >>  2.  поддержка bash  (readline),  textutils, fileutils  с
>    >> точки зрения UTF8
>
>    > Поддержка  UTF-8   базовыми  утилитами  Unix  --  большая
>    > проблема, так как  требует их  серьезного концептуального
>    > пересмотра  и тщательного  аудита. Мое _личное_  мнение --
>    > сквозной  переход   Unix  на  UTF-8  locales  практически
>    > невозможен,  так  как  приведет  к  большим  проблемам  с
>    > security.
>
>Это очень странно слышать.  Сквозной переход на UTF-8 locales --
>попросту  бессмысленен.  А  вот корректная  поддержка  multibyte
>characters,  _частным  случаем_ которой  является  UTF-8 --  уже
>становится традицией.
>
Да, конечно.
Но -- не сквозная. Сквозная поддержка multibyte locales приведет к
описанным мною ранее проблемам.
Сквозная поддержка требует принципиально новых разработок.

>
>Что же  касается security, --  в системе, где имена  файлов case
>sensitive, да  ещё с такой приличной кодировкой,  как UTF-8 (где
>невозможен  \000  в  середине  строки, где  любой  встретившийся
>символ  из  диапазона ascii  всегда  означает  самого себя,  где
>никакой ascii-символ не  имеет альтернативного представления) --
>непонятно, откуда возьмутся проблемы.
>
При чем здесь имена файлов? Когда Вы имеете дело с "символом
неопределенной длины" -- проблемы неизбежны.
На самом деле, до сих пор всплывают проблемы c security даже при работе
в не-POSIX locale.

Rgrds, AEN






Подробная информация о списке рассылки community