[Comm] koi8-r to translit

Serge Skorokhodov =?iso-8859-1?q?suralis-s_=CE=C1_mtu-net=2Eru?=
Ср Окт 5 13:27:38 MSD 2005


Hello Aleksander,

>>> А кои8 под это заточен, достаточно вычесть константу из
>>> табличного кода кирилической буквы. Не помню какая, но легко
>>> узнать от кода кирилической 'А' отнять код латинской 'A' и
>>> прибавить 1.
>>
>> Просто сбросить в ноль самый старший бит кода символа. Для
>> кодов >=160 это равносильно вычитанию константы 128.

ANG> Не мужики, тут не всё так просто. Вот простой пример когда
ANG> для одной русской буквы (обычно шипящих) надо две англицкие

саша ->> sasha

ANG> А иногда и три
ANG> :-(

Правильный транслит (или волапЮк:) получить --- смотрите в
сторону виндовых программ вроде shtirlitz и т.д., а главное --- в
сторону их opensource прототипов. Там должны быть таблицы
транслитерации. Не думаю, что это серьезная проблема, даже если
придется что-то писать самому:)

Но. Если срезать у koi старший бит, то by design должно
получиться нечто кривое, но читабельное для русскоязычных, что-то
на подобие той транслитерации, которая часто используется в SMS.
Например 'щ' будет 'W' и т.д. Т.е. все кириллические буквы будут
отображаться латинскими, либо эквивалентными, либо со схожим
начертанием.

-- 
Best regards,
 Serge Skorokhodov                            mailto:suralis-s на mtu-net.ru




Подробная информация о списке рассылки community