[mdk-re] Re: [mdk-re] Как определить кодировку?
cornet
=?iso-8859-1?q?cornet_=CE=C1_zmail=2Eru?=
Чт Авг 2 13:04:18 MSD 2001
Sergey Degtyaryov wrote:
>
> Доброго времени суток, Sergey,
>
> 02.08.2001 в 12:16 Вы сказали буквально следующее:
>
> SD> Доброго времени суток, cornet,
>
> SD> 02.08.2001 в 11:52 Вы сказали буквально следующее:
>
> c>> Буду рад если я ошибаюсь и кто то скажет как можно определить
> c>> кодировку обычного текстовика кроме как наметанным глазом.
>
> SD> Это можно и нужно использовать.
>
> Да, конвертируется регистр букв русского алфавита.
> Таким образом, поставив, например, 50% - как уровень количества
> заглавных букв, анализируем текст. Получили больше 50% - текст надо
> перекодировать, получили меньше - открыли правильно.
> 50% - из головы, но думается, что вполне подойдет.
> Тексты, естественно средние, крайности вроде ПИСЕМ О НЕМЕДЛЕННОМ
> СПАСЕНИИ ОТ ЭТОГО ЛИНУКСА распознаваться не будут.
> Естественно все это относится к koi8 и win1251
Вот именно! Это все _эвристические_ методы :-(( и я очень
сомневаюсь, что кто то сможет предложить строгие математические,
подходящие для любого текста и любой кодировки фактической и
отображаемой.
--
******** FIRE & STEEL ********
Подробная информация о списке рассылки community