[Comm] koi8-r to translit

Aleksander N. Gorohovski =?iso-8859-1?q?angel_=CE=C1_feht=2Edgtu=2Edonetsk=2Eua?=
Ср Окт 5 10:59:23 MSD 2005


On Wed, 05 Oct 2005 11:39:28 +0400, Olvin wrote:

> Alexandr O. Potapov wrote:
>>> Кому нибудь попадалась программка (или сценарий),
>>> который трансформирует текст, состоящий из
>>> русских букв (например, в кодировке koi8-r) в их "условное  
>>> соответствие"
>>> на английском (кажется называется translit).
>>> Например,
>>> мама -> mama
>>> саша -> sasha
>>> ...
>>> Зачем мне это нужно:
>>> возникла необходимость переименования (замены кирилицы на английские
>>> буквы) каталогов/файлов на ftp-сервере, чтобы win-клиенты могли хоть
>>> как-то их прочитать.
>> А кои8 под это заточен, достаточно вычесть константу из табличного
>> кода кирилической буквы. Не помню какая, но легко узнать от кода
>> кирилической 'А' отнять код латинской 'A' и прибавить 1.
>
> Просто сбросить в ноль самый старший бит кода символа. Для кодов >=160  
> это равносильно вычитанию константы 128.

Не мужики, тут не всё так просто. Вот простой пример когда для одной  
русской
буквы (обычно шипящих) надо две англицкие

саша -> sasha

А иногда и три
:-(

Что-то такое делает броузер Links, но подумал, что может есть штатное вроде
iconv



Подробная информация о списке рассылки community