[Comm] Использование UTF-локали в ALT Linux
Vladimir NOVIKOV
=?iso-8859-1?q?vnovikov_=CE=C1_novikov=2Eorg?=
Чт Дек 30 14:24:31 MSK 2004
Привет,
Alexej Kryukov wrote:
> Да я, в общем-то, не про дисковое пространство. Просто соотношение
> (1 байт == 1 символ) удобно во многих отношениях, да к тому же
> приятнее из чисто эстетических соображений. По крайней мере,
> в сравнении с UTF-8.
Удобно сегодня, так как многие программы не умеют толком обрабатывать
такие файлы, завтра это будет по фигу. С другой стороны, одноязычные
тексты действительно можно хранить в восьмибитной кодировке. Проблема
появляется, когда в глобально русскоязычный файл надо вставить два
французских слова ;-)
Но если файл одноязычный и призван таким осталься (модель договора, к
примеру), why not? Хотя именно такой случай у меня был. Составлял
контракт на русском языке между российской и французской фирмами,
требовалось только вставить название фирмы и адрес. Модель была в КОИ8
на русском, а в названии и адресе, как на грех, полно аксанов. Пришлось
переводить файл в UTF-8.
> Ха! Знаем, проходили :) И я именно по этой причине имел привычку
> запускать OOo всегда в юникодной локали... пока не прочел у того
> же Паскаля, как сделать локаленезависимый Compose. И, подложив его
> к своей любимой ru_RU.CP1251, понял, что ru_RU.UTF-8 мне теперь,
> собственно говоря, без надобности.
А где про это прочитать? На его сайте в разделе про xkb я что-то не
нашел. И почему любимая локаль 1251? Чем мотивируете, какие достоинства?
Нет ли проблем с манами или чем-то ещё? Есть ли недостатки по сравнению
с кои?
> В X 4.4 / X.org основное усовершенствование заключается в том,
> что этот самый Compose теперь можно держать в домашнем каталоге,
> а не подкладывать к той или иной локали. Это и в самом деле намного
> удобнее, но принципиально новых возможностей, как видите, не
> добавляет.
М-да, до Windows ещё далеко-далеко в этом плане. На самом деле, у меня
клавиатур значительно больше. Просто привык, даже общаясь на русском с
украинцами или сербами, а на английском или французском с
чехами/словаками/поляками/шведами и прочими литовцами, правильно хотя бы
их имена писать, со всеми значками.
В иксах такое сегодня весьма затруднительно. В Windows или на Маке
просто щёлкаешь мышкой и выбираешь нужную раскладку. Потом можно убрать,
если мешает.
> То есть, собственно, не выход из положения, а откат на C для тех, кого
> не устраивала UTF-8? К сожалению, в наших условиях наличие пользователей
> с разными локалями неприемлемо из-за дурной привычки давать файлам
> русские имена ;-) Соответственно, получается, что при системной локали
> ru_RU.UTF-8 и у рута должна быть тоже не C, а, например, en_US.UTF-8,
> если, конечно, он не хочет ломать голову над именами файлов.
За русские имена файлов - мочить в сортире (tm).
С другой стороны, при системной ru_RU.UTF-8, у рута en_US.UTF-8 можно
ещё создать пользователя с локалью С, чтобы мог работать с некоторыми
консольными программами, которые неправильно обрабатывают Unicode.
Согласен, что это костыли, но что делать, кому сейчас легко?
Подробная информация о списке рассылки community