[devel] I: new package (SpamOracle)

Vitaly Lugovsky =?iso-8859-1?q?vsl_=CE=C1_ontil=2Eihep=2Esu?=
Сб Окт 26 14:40:22 MSD 2002


On Sat, 26 Oct 2002, Alex Ott wrote:

>  VL>  Если кто заинтересован - прошу тестировать. Русский язык прикручен
>  VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал
>  VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!)
>  VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала
>  VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного
>  VL> "хорошего" не потерялось.
> 
> Могу поделиться своей базой спама, на которой я отлаживал спам-детектор
> (работающий по тому же алгоритму, что и spamoracle), написанный на
> mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не
> вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно
> это спам, похожий на деловые письма, и корейский спам.

 Это не страшно - главное, чтоб нормальные письма за спам не считались.
Ну а корейцев я по кодировке режу.





Подробная информация о списке рассылки Devel