[Comm] Использование UTF-локали в ALT Linux
Alexej Kryukov
=?iso-8859-1?q?akrioukov_=CE=C1_mail=2Eru?=
Пт Дек 31 00:19:24 MSK 2004
On Thursday 30 December 2004 14:24, Vladimir NOVIKOV wrote:
> Привет,
>
> Но если файл одноязычный и призван таким осталься (модель договора, к
> примеру), why not? Хотя именно такой случай у меня был. Составлял
> контракт на русском языке между российской и французской фирмами,
> требовалось только вставить название фирмы и адрес. Модель была в
> КОИ8 на русском, а в названии и адресе, как на грех, полно аксанов.
> Пришлось переводить файл в UTF-8.
Вот и я о том же: why not?
Более характерный пример -- повествовательные тексты, взятые, например,
из электронных библиотек. Естественно, я предпочитаю их держать в
текстовом формате (ну не в doc'ах же!), и при этом люблю оформлять
в стиле Лексикона, т. е. с разбивкой на строки одинаковой длины.
А представьте, что файл в UTF-8: визуально строки одинаковые, но
в байтах-то -- нет! Непорядок, однако :)
Разумеется, я не говорю о том случае, когда текст действительно содержит
специфические символы разных языков: тут я сам первый буду выступать
за Юникод :)
> А где про это прочитать? На его сайте в разделе про xkb я что-то не
> нашел.
Я, собственно, имел в виду вот этот его пост:
http://www.mail-archive.com/i18n@xfree86.org/msg01562.html
Кстати, я как-то уже давал эту ссылку, отвечая Вам же...
Практически же локаленезависимый Compose легко получить следующим
образом: берем файл от en_US.UTF-8 и удаляем (с помощью sed'а
или как-то еще) все закавыченные строки. Это проверено и работает.
> И почему любимая локаль 1251? Чем мотивируете, какие
> достоинства?
Так это же очевидно: достаточно просто сравнить две таблицы
кодировки.
В самом деле, cp1251:
-- является не чисто русской, а общеславянской;
-- содержит типографские символы, в т. ч. парные кавычки и знак номера;
-- русские буквы в ней расположены в алфавитном порядке;
-- заглавные предшествуют строчным, как это сделано практически
во всех кодировках, кроме koi.
Плюс совместимость с виндой как немаловажный довесок.
> Нет ли проблем с манами или чем-то ещё? Есть ли
> недостатки по сравнению с кои?
Ну, были проблемы с неграмотно написанными (без явного указания
кодировки) *.po-файлами в koi8: естественно, при локали cp1251
в интерфейсе программы получается бНОПНЯ наоборот. Но сейчас
таких программ практически не осталось, поскольку основным
источником проблем был Gnome 1.* со своими приложениями.
> М-да, до Windows ещё далеко-далеко в этом плане. На самом деле, у
> меня клавиатур значительно больше. Просто привык, даже общаясь на
> русском с украинцами или сербами, а на английском или французском с
> чехами/словаками/поляками/шведами и прочими литовцами, правильно хотя
> бы их имена писать, со всеми значками.
Я здесь как-то писал о том, что в Windows действительно намного
удобнее работать с многоязычными текстами в неюникодовых приложениях
типа Word 7, PageMaker или QuarkXpress. Что же касается юникодовых,
то настоящая загвоздка была только в Compose, и по устранении ее
иксы IMHO ничем не уступают Windows.
> В иксах такое сегодня весьма затруднительно. В Windows или на Маке
> просто щёлкаешь мышкой и выбираешь нужную раскладку. Потом можно
> убрать, если мешает.
Ну так а командная строка на что? setxkbmap с нужными параметрами,
и все дела. Или настраивайте стандартный переключатель в KDE либо
Gnome (который делает именно это -- выполняет setxkbmap на каждое
переключение раскладки).
Подробная информация о списке рассылки community