[sisyphus] amarok 1.4 и русские буквы в тэгах
Хихин Руслан
=?iso-8859-1?q?hihin_=CE=C1_yandex=2Eru?=
Пн Июл 31 12:38:56 MSD 2006
Здравствуйте Mikhail Yakshin
В сообщении от 10 мая 2006 16:03 Mikhail Yakshin написал(a):
Извините, что вмешиваюсь в дискуссию. Как я понял проблема в том,
что в тегах Amarok отсутствует информация о том какая конкретная
кодировка используется.
Могу предложить свой эмпирический метод.
Каждому яззыку соответствует определённая частотность букв в словах,
например, в русском яззыке самая частая буква "O", потом идут другие,
(которые я не помню) буквы и так далее пусть это будут "a" и "п"
( я в юности любил разгадывать сообщения, когда каждой букве
соответствовал один неизвестный символ - см Артур Конан Дойл "Пляшущие
человечки" http://www.lib.ru/AKONANDOJL/sh_dancm.txt )
Так вот выбираем из тэга, допустим три самые частые буквы и смотрим в
какой кодировке самые частые буквы сообщения попадают на множество
кодов "О", "А" и "П". - там где совпадений больше, скорей всего, это и
будет искомая кодровка. Естественно это надо делать не руками :)
--
С уважением Хихин Руслан
----------- следующая часть -----------
Было удалено вложение не в текстовом формате...
Имя : =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Тип : application/pgp-signature
Размер : 189 байтов
Описание: =?iso-8859-1?q?=CF=D4=D3=D5=D4=D3=D4=D7=D5=C5=D4?=
Url : <http://lists.altlinux.org/pipermail/sisyphus/attachments/20060731/10e47280/attachment-0003.bin>
Подробная информация о списке рассылки Sisyphus