[mdk-re] Re: [mdk-re] Как определить кодировку?

cornet =?iso-8859-1?q?cornet_=CE=C1_zmail=2Eru?=
Чт Авг 2 13:04:18 MSD 2001


Sergey Degtyaryov wrote:
> 
> Доброго времени суток, Sergey,
> 
> 02.08.2001 в 12:16 Вы сказали буквально следующее:
> 
> SD> Доброго времени суток, cornet,
> 
> SD> 02.08.2001 в 11:52 Вы сказали буквально следующее:
> 
> c>> Буду рад если я ошибаюсь и кто то скажет как можно определить
> c>> кодировку обычного текстовика кроме как наметанным глазом.
> 
> SD> Это можно и нужно использовать.
> 
> Да, конвертируется регистр букв русского алфавита.
> Таким образом, поставив, например, 50% - как уровень количества
> заглавных букв, анализируем текст. Получили больше 50% - текст надо
> перекодировать, получили меньше - открыли правильно.
> 50% - из головы, но думается, что вполне подойдет.
> Тексты, естественно средние, крайности вроде ПИСЕМ О НЕМЕДЛЕННОМ
> СПАСЕНИИ ОТ ЭТОГО ЛИНУКСА распознаваться не будут.
> Естественно все это относится к koi8 и win1251

Вот именно! Это все _эвристические_ методы :-(( и я очень
сомневаюсь, что кто то сможет предложить строгие математические,
подходящие для любого текста и любой кодировки фактической и
отображаемой.

-- 
******** FIRE & STEEL ********




Подробная информация о списке рассылки community