[Comm] Использование UTF-локали в ALT Linux

Vladimir NOVIKOV =?iso-8859-1?q?vnovikov_=CE=C1_novikov=2Eorg?=
Чт Дек 30 14:24:31 MSK 2004


Привет,

Alexej Kryukov wrote:

> Да я, в общем-то, не про дисковое пространство. Просто соотношение
> (1 байт == 1 символ) удобно во многих отношениях, да к тому же
> приятнее из чисто эстетических соображений. По крайней мере,
> в сравнении с UTF-8.

Удобно сегодня, так как многие программы не умеют толком обрабатывать 
такие файлы, завтра это будет по фигу. С другой стороны, одноязычные 
тексты действительно можно хранить в восьмибитной кодировке. Проблема 
появляется, когда в глобально русскоязычный файл надо вставить два 
французских слова ;-)
Но если файл одноязычный и призван таким осталься (модель договора, к 
примеру), why not? Хотя именно такой случай у меня был. Составлял 
контракт на русском языке между российской и французской фирмами, 
требовалось только вставить название фирмы и адрес. Модель была в КОИ8 
на русском, а в названии и адресе, как на грех, полно аксанов. Пришлось 
переводить файл в UTF-8.

> Ха! Знаем, проходили :) И я именно по этой причине имел привычку
> запускать OOo всегда в юникодной локали... пока не прочел у того
> же Паскаля, как сделать локаленезависимый Compose. И, подложив его
> к своей любимой ru_RU.CP1251, понял, что ru_RU.UTF-8 мне теперь,
> собственно говоря, без надобности.

А где про это прочитать? На его сайте в разделе про  xkb я что-то не 
нашел. И почему любимая локаль 1251? Чем мотивируете, какие достоинства? 
Нет ли проблем с манами или чем-то ещё? Есть ли недостатки по сравнению 
с кои?

> В X 4.4 / X.org основное усовершенствование заключается в том,
> что этот самый Compose теперь можно держать в домашнем каталоге,
> а не подкладывать к той или иной локали. Это и в самом деле намного
> удобнее, но принципиально новых возможностей, как видите, не
> добавляет.

М-да, до Windows ещё далеко-далеко в этом плане. На самом деле, у меня 
клавиатур значительно больше. Просто привык, даже общаясь на русском с 
украинцами или сербами, а на английском или французском с 
чехами/словаками/поляками/шведами и прочими литовцами, правильно хотя бы 
их имена писать, со всеми значками.

В иксах такое сегодня весьма затруднительно. В Windows или на Маке 
просто щёлкаешь мышкой и выбираешь нужную раскладку. Потом можно убрать, 
если мешает.

> То есть, собственно, не выход из положения, а откат на C для тех, кого
> не устраивала UTF-8? К сожалению, в наших условиях наличие пользователей
> с разными локалями неприемлемо из-за дурной привычки давать файлам
> русские имена ;-) Соответственно, получается, что при системной локали
> ru_RU.UTF-8 и у рута должна быть тоже не C, а, например, en_US.UTF-8,
> если, конечно, он не хочет ломать голову над именами файлов.

За русские имена файлов - мочить в сортире (tm).
С другой стороны, при системной ru_RU.UTF-8, у рута en_US.UTF-8 можно 
ещё создать пользователя с локалью С, чтобы мог работать с некоторыми 
консольными программами, которые неправильно обрабатывают Unicode. 
Согласен, что это костыли, но что делать, кому сейчас легко?



Подробная информация о списке рассылки community