[sisyphus] amarok 1.4 и русские буквы в тэгах

Хихин Руслан hihin на yandex.ru
Пн Июл 31 12:38:56 MSD 2006


Здравствуйте Mikhail Yakshin
  В сообщении от 10 мая 2006 16:03 Mikhail Yakshin написал(a):
 Извините, что вмешиваюсь в дискуссию. Как я понял проблема в том, 
что в тегах Amarok отсутствует информация о том какая конкретная 
кодировка используется.

Могу предложить свой эмпирический метод.
Каждому яззыку соответствует определённая частотность букв в словах, 
например, в русском яззыке самая частая буква "O", потом идут другие, 
(которые я не помню) буквы  и так далее пусть это будут "a" и "п"
( я в юности любил разгадывать сообщения, когда каждой букве 
соответствовал один неизвестный символ - см Артур Конан Дойл "Пляшущие 
человечки" http://www.lib.ru/AKONANDOJL/sh_dancm.txt ) 
Так вот выбираем из тэга, допустим три самые частые буквы и смотрим в 
какой кодировке самые частые буквы сообщения попадают на множество 
кодов "О", "А" и "П". - там где совпадений больше, скорей всего, это и 
будет искомая кодровка. Естественно это надо делать не руками :)   

-- 
С  уважением Хихин Руслан
----------- следущая часть -----------
Было удалено вложение не в текстовом формате...
Имя     : отсутствует
Тип     : application/pgp-signature
Размер  : 189 байтов
Описание: отсутствует
Url     : http://lists.altlinux.org/pipermail/sisyphus/attachments/20060731/10e47280/attachment.bin 


Подробная информация о списке рассылки Sisyphus