[devel] [JT] О кодировке названий файлов при монтировании

Alexey Morozov =?iso-8859-1?q?alex-altlinux_=CE=C1_idisys=2Eiae=2Ensk=2Esu?=
Вс Фев 27 20:16:24 MSK 2005


On Sun, Feb 27, 2005 at 05:37:58PM +0300, Vitaly Lipatov wrote:
> On Sunday 27 February 2005 15:37, Alexey Morozov wrote:
> > Я тут отсутствовал на работе некоторое время (и вероятно, еще
> > пару дней буду отсутствовать). Ну и плюс, попробовал таки
> > UTF-8 локаль в альте
> >
> > :-).
> Ну и как, как? :)
...бип-бип-бип. Для тех, кто не успел, передаем сигналы точного
времени еще раз: бип-бип-бип...

> > Что касается примеров, как можно сломать - очень просто.
> > Достаточно определить (и начать пользоваться) локалью, которая
> > отсутствует в ваших мапах. Плюс к тому, мне показалось, что
> Ну попробуйте. У меня все локали - glibc. Значит, и там её нет.
Но не все локали glibc у вас. Так понятнее?

> Ну что же вы всё общие слова-то?
> И, кстати, что обсуждаем?
Методологию соответствия локали и чарсета. У вас (вернее, да, конечно,
в проекте WINE, код которого вы анализировали) этот вопрос решен
чрезвычайно просто: взяли наиболее распространенные локали (фикс.
список) и сопоставили каждой из них кодировку в юниксе и в винде.
На выходе имеем словарь соответствий фиксированной опять же длины.
Что несколько не сочетается с возможностями программы localedef.
Вот и вся претензия моя.

> Ну тут мы всегда были в изгоях и ваяли патчи на предмет поддержки 
> любимой национальной кодировки.
:-)

> > : ${SYSFONTACM:=koi8-r}
> > : ${SYSMOUNTCHARSET:=$SYSFONTACM}
> >
> > Этого, вообще говоря, достаточно.
> Кстати говоря, тут есть пролёт с codepage -> короткие названия 
> будут кракозябрами.
Коротких названий нет. Если где-то есть драйвера FAT, которые не пишут
"юникодных имен", эти случаи можно считать маргинальными и к делу не
относящимися.

> > > > В отсутствии [должной] поддержки tatar_cyr, официально
> > Ошибка в том, что для татарского (на основе кириллицы)
> > используется кодовая таблица, отсутствующая в описании в
> > lib/data/get_charset_data.h
> А что за локаль и как кодировка называется?
Я не вполне уверен, как она называется, лучше спросить у носителей
языка, возможно, это какое-то расширение CP1251. В любом случае,
в ваших таблицах упоминается только tt_RU.utf8, который у нас, в общем,
нерабочий ;-)

> > становится... несколько неустойчивой, т.к., вообще говоря,
> > локали в глибц - вещь [еще пока] динамически настраиваемая.
> Я не в курсе - можно ли для локали ru_RU.KOI8-R поставить 
> кодировку CP1251?
Нет, по логике вещей. Но это и не обязательно. Достаточно, например,
определить локаль, отличающуюся от ru_RU.KOI8-R значением, к примеру,
LC_NUMERIC ;-). Новое, не описанное доселе имя, и вся схема, кажется,
ломается.

> неграмотности. В Сизиф отправлена версия 0.0.9, там есть 
> достаточный прогресс по сравнению с тем, что вы видели.
Да, я на нее и глядел.

> > Э-э-э, вы не поверите и будете смеяться :-). По крайней мере,
> > те из них, которые сочтены полезными для всей системы в целом.
> Ну например? Кроме LANG.
> Я смотрю по /etc/profile.d/lang.sh
Ну, значит пока потребности в большем не возникало :-)

> > Насчет UTF-8. Похоже, счастья нет. По крайней мере, обещанное
> > чудо не задалось в случае SuSe, да, судя по zsh'овой рассылке,
> > не задастся нигде...
> Да ладно, будет счастье. Просто ещё время не пришло. А что они, 
> не хотят, концепция не позволяет или код кривой?
Они там c zle воюют. Насчет того, что это просчет кодирования или
проектировки, сказать ничего не могу, в код не глядел. Вероятно, все
же, проектирования.


----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url     : <http://lists.altlinux.org/pipermail/devel/attachments/20050227/c95c3939/attachment-0001.bin>


Подробная информация о списке рассылки Devel