[devel] I: new package (SpamOracle)

Alex Ott =?iso-8859-1?q?ottalex_=CE=C1_narod=2Eru?=
Сб Окт 26 17:55:49 MSD 2002


>>>>> "VL" == Vitaly Lugovsky writes:
 VL> On Sat, 26 Oct 2002, Alex Ott wrote: Если кто заинтересован - прошу
 VL> тестировать. Русский язык прикручен абы как, но по крайней мере для
 VL> меня всё работает неплохо. Базу делал на >20000 "хороших" писем (ну
 VL> конечно же, списки рассылки ALT Linux!)  и >1000 "плохих" (это что за
 VL> два дня мне пришло). С момента начала тестирования уже две сотни
 VL> спамовых писем ушло на помойку и ни одного "хорошего" не потерялось.
 >>  Могу поделиться своей базой спама, на которой я отлаживал
 >> спам-детектор (работающий по тому же алгоритму, что и spamoracle),
 >> написанный на mzscheme. База большая, где-то около 80 мегабайт --
 >> сколько уж писем и не вспомню. Сейчас программа дает сбой где-то на
 >> одном письме из 10. Обычно это спам, похожий на деловые письма, и
 >> корейский спам.

 VL>  Это не страшно - главное, чтоб нормальные письма за спам не
 VL> считались.  Ну а корейцев я по кодировке режу.

Я выложу где-нибудь у себя эту базу. Нормальные письма не режутся. (по
крайней мере на наших тестах), но я пока в продакшион не ставил систему. 

-- 
With best wishes, Alex Ott
-------------------------------
Jet Infosystems, Moscow, Russia    mailto: ottalex на narod.ru
http://xtalk.msk.su/~ott/          ICQ #22005116




Подробная информация о списке рассылки Devel