[devel] I: new package (SpamOracle)
Alex Ott
=?iso-8859-1?q?ottalex_=CE=C1_narod=2Eru?=
Сб Окт 26 17:55:49 MSD 2002
>>>>> "VL" == Vitaly Lugovsky writes:
VL> On Sat, 26 Oct 2002, Alex Ott wrote: Если кто заинтересован - прошу
VL> тестировать. Русский язык прикручен абы как, но по крайней мере для
VL> меня всё работает неплохо. Базу делал на >20000 "хороших" писем (ну
VL> конечно же, списки рассылки ALT Linux!) и >1000 "плохих" (это что за
VL> два дня мне пришло). С момента начала тестирования уже две сотни
VL> спамовых писем ушло на помойку и ни одного "хорошего" не потерялось.
>> Могу поделиться своей базой спама, на которой я отлаживал
>> спам-детектор (работающий по тому же алгоритму, что и spamoracle),
>> написанный на mzscheme. База большая, где-то около 80 мегабайт --
>> сколько уж писем и не вспомню. Сейчас программа дает сбой где-то на
>> одном письме из 10. Обычно это спам, похожий на деловые письма, и
>> корейский спам.
VL> Это не страшно - главное, чтоб нормальные письма за спам не
VL> считались. Ну а корейцев я по кодировке режу.
Я выложу где-нибудь у себя эту базу. Нормальные письма не режутся. (по
крайней мере на наших тестах), но я пока в продакшион не ставил систему.
--
With best wishes, Alex Ott
-------------------------------
Jet Infosystems, Moscow, Russia mailto: ottalex на narod.ru
http://xtalk.msk.su/~ott/ ICQ #22005116
Подробная информация о списке рассылки Devel