[Comm] Использование UTF-локали в ALT Linux

Alexej Kryukov =?iso-8859-1?q?akrioukov_=CE=C1_mail=2Eru?=
Пт Дек 31 00:19:24 MSK 2004


On Thursday 30 December 2004 14:24, Vladimir NOVIKOV wrote:
> Привет,
>
> Но если файл одноязычный и призван таким осталься (модель договора, к
> примеру), why not? Хотя именно такой случай у меня был. Составлял
> контракт на русском языке между российской и французской фирмами,
> требовалось только вставить название фирмы и адрес. Модель была в
> КОИ8 на русском, а в названии и адресе, как на грех, полно аксанов.
> Пришлось переводить файл в UTF-8.

Вот и я о том же: why not?

Более характерный пример -- повествовательные тексты, взятые, например,
из электронных библиотек. Естественно, я предпочитаю их держать в
текстовом формате (ну не в doc'ах же!), и при этом люблю оформлять
в стиле Лексикона, т. е. с разбивкой на строки одинаковой длины.
А представьте, что файл в UTF-8: визуально строки одинаковые, но
в байтах-то -- нет! Непорядок, однако :)

Разумеется, я не говорю о том случае, когда текст действительно содержит
специфические символы разных языков: тут я сам первый буду выступать
за Юникод :)

> А где про это прочитать? На его сайте в разделе про  xkb я что-то не
> нашел. 

Я, собственно, имел в виду вот этот его пост:
http://www.mail-archive.com/i18n@xfree86.org/msg01562.html
Кстати, я как-то уже давал эту ссылку, отвечая Вам же...

Практически же локаленезависимый Compose легко получить следующим
образом: берем файл от en_US.UTF-8 и удаляем (с помощью sed'а
или как-то еще) все закавыченные строки. Это проверено и работает.

> И почему любимая локаль 1251? Чем мотивируете, какие 
> достоинства? 

Так это же очевидно: достаточно просто сравнить две таблицы 
кодировки.

В самом деле, cp1251:

-- является не чисто русской, а общеславянской;
-- содержит типографские символы, в т. ч. парные кавычки и знак номера;
-- русские буквы в ней расположены в алфавитном порядке;
-- заглавные предшествуют строчным, как это сделано практически
во всех кодировках, кроме koi.

Плюс совместимость с виндой как немаловажный довесок.

> Нет ли проблем с манами или чем-то ещё? Есть ли 
> недостатки по сравнению с кои?

Ну, были проблемы с неграмотно написанными (без явного указания 
кодировки) *.po-файлами в koi8: естественно, при локали cp1251
в интерфейсе программы получается бНОПНЯ наоборот. Но сейчас
таких программ практически не осталось, поскольку основным 
источником проблем был Gnome 1.* со своими приложениями.

> М-да, до Windows ещё далеко-далеко в этом плане.  На самом деле, у 
> меня клавиатур значительно больше. Просто привык, даже общаясь на
> русском с украинцами или сербами, а на английском или французском с
> чехами/словаками/поляками/шведами и прочими литовцами, правильно хотя
> бы их имена писать, со всеми значками.

Я здесь как-то писал о том, что в Windows действительно намного
удобнее работать с многоязычными текстами в неюникодовых приложениях
типа Word 7, PageMaker или QuarkXpress. Что же касается юникодовых,
то настоящая загвоздка была только в Compose, и по устранении ее
иксы IMHO ничем не уступают Windows. 

> В иксах такое сегодня весьма затруднительно. В Windows или на Маке
> просто щёлкаешь мышкой и выбираешь нужную раскладку. Потом можно
> убрать, если мешает.

Ну так а командная строка на что? setxkbmap с нужными параметрами,
и все дела. Или настраивайте стандартный переключатель в KDE либо
Gnome (который делает именно это -- выполняет setxkbmap на каждое
переключение раскладки).




Подробная информация о списке рассылки community