[docs] Proposal для admin-документаловки

Vitaly Lugovsky vsl на ontil.ihep.su
Вт Окт 29 22:58:15 MSK 2002


 Предлагаю включить следующий текст в раздел "Борьба со спамом"
в документацию:

---------------
Ещё один способ борьбы со спамом основан на фильтрации на уровне
пользователя. Для этого пользователь должен собрать две достаточно
репрезентативные выборки "хороших" и "плохих" писем в формате mbox,
после чего воспользоваться пакетом SpamOracle. Пример:

$ rm -f $HOME/.spamoracle.db
$ spamoracle add -v -good goodmails -spam badmails

где goodmails --- mbox-база примеров "правильных" писем, а 
badmails --- mbox-база примеров "плохих" писем. Возможно перечисление
нескольких mbox-файлов. Практика показывает, что для хорошей работы
статистического фильтра требуется около тысячи плохих и хороших писем, с
дальнейшим обновлением базы.

 Для использования филтра SpamOracle необходимо пропускат почту через
procmail. Пример соответствующего $HOME/.procmailrc:

:0fw
| /usr/bin/spamoracle mark

:0
* ^X-Spam: yes;
mail/spambox

:0
* ^X-Attachments:.*name=".*\.(pif|scr|exe|bat)"
mail/spambox


:0
* ^X-Attachments:.*type="audio/(x-wav|x-midi)
mail/spambox

 Теоретические основы этого способа фильтрации изложены в следующей
работе:
http://www.paulgraham.com/spam.html

 Текущая версия SpamOracle воспринимает только KOI8-R и CP1251 кодировки.
Разбиения по словам для Unicode пока не реализовано, как и перекодирования
в одну выбранную кириллическую страницу.
-----------------------

ЗЫ: отстал я от жизни. Где исходники уже готовой документации  в docbook?
И куда мне вклиниваться в документацию по математическим приложениям?





Подробная информация о списке рассылки docs