[mdk-re] Blocklist for junkbuster

Ivan Kudryashov =?iso-8859-1?q?jony_=CE=C1_chat=2Eru?=
Чт Мар 29 11:37:12 MSD 2001


Hello, Yuri V. Anikin!

29.03.2001 06:28:21, you wrote:

YVA> Во-вторых, попытаюсь несколько пояснить ситуацию с фильтрацией
YVA> "плохих" сайтов: в классе свободного доступа на машинах стоит Win98,
YVA> защиты от изменения настроек у которого практически нет. Задача -- "мягко
YVA> убрать" посетителей, мешающих тем, кто приходит действительно
YVA> поработать. 

Один  из  способов  (кстати,  практически  системнонезависимый)  иметь
актуальный  список "плохих" сайтов (кстати, почему именно эротического
содержания  -  любители  разглядывать  фото автомобилей с точки зрения
траффика  мало  отличаются  от  порноманов  )  -  это просто регулярно
проверять  кэш  прокси  на  наличие  там "плохих" страниц (кстати, тут
справится   достаточно   элементарный  скрипт  из  find  и  нескольких
операторов  обвязки,  а  для  разбора  самих  страниц  можно  привлечь
немногим  более  сложную  программу  на  C)  и дописывать имена сайтов
(можно  домены)  в  файл  блокировки,  одновременно стирая их из кэша.
Запускать этот скрипт автоматом раз в час, или как угодно, натравливая
только  на  свежепоявившиеся  файлы.  Что  характерно - этот способ не
тормозит  загрузку,  потому  что  фильтр  получается постмодерирующий.
Посетители  "наполнят"  файлы  блокировки  за каких-нибудь пару-тройку
дней.  Но,  кстати,  надо  иметь в виду то, что придётся принудительно
_разрешать_  некоторые сайты, главным образом - поисковики. Потому что
иначе после первого же деятеля, поискавшего в альтависте "hard porno",
вся альтависта станет недоступна (критерий выполнится, потому что вся
страница будет заполнена сплошными ключевыми словами). И вообще, к
фильтрации надо аккуратно подходить, "плохие" слова часто встречаются
во вполне невинных текстах.

-------------------------------------------
С уважением, 
Ivan Kudryashov <jony на chat.ru> ICQ 1547081






Подробная информация о списке рассылки community