[devel] I: new package (SpamOracle)
Vitaly Lugovsky
=?iso-8859-1?q?vsl_=CE=C1_ontil=2Eihep=2Esu?=
Сб Окт 26 14:40:22 MSD 2002
On Sat, 26 Oct 2002, Alex Ott wrote:
> VL> Если кто заинтересован - прошу тестировать. Русский язык прикручен
> VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал
> VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!)
> VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала
> VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного
> VL> "хорошего" не потерялось.
>
> Могу поделиться своей базой спама, на которой я отлаживал спам-детектор
> (работающий по тому же алгоритму, что и spamoracle), написанный на
> mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не
> вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно
> это спам, похожий на деловые письма, и корейский спам.
Это не страшно - главное, чтоб нормальные письма за спам не считались.
Ну а корейцев я по кодировке режу.
Подробная информация о списке рассылки Devel