[mdk-re] Blocklist for junkbuster
Ivan Kudryashov
=?iso-8859-1?q?jony_=CE=C1_chat=2Eru?=
Чт Мар 29 11:37:12 MSD 2001
Hello, Yuri V. Anikin!
29.03.2001 06:28:21, you wrote:
YVA> Во-вторых, попытаюсь несколько пояснить ситуацию с фильтрацией
YVA> "плохих" сайтов: в классе свободного доступа на машинах стоит Win98,
YVA> защиты от изменения настроек у которого практически нет. Задача -- "мягко
YVA> убрать" посетителей, мешающих тем, кто приходит действительно
YVA> поработать.
Один из способов (кстати, практически системнонезависимый) иметь
актуальный список "плохих" сайтов (кстати, почему именно эротического
содержания - любители разглядывать фото автомобилей с точки зрения
траффика мало отличаются от порноманов ) - это просто регулярно
проверять кэш прокси на наличие там "плохих" страниц (кстати, тут
справится достаточно элементарный скрипт из find и нескольких
операторов обвязки, а для разбора самих страниц можно привлечь
немногим более сложную программу на C) и дописывать имена сайтов
(можно домены) в файл блокировки, одновременно стирая их из кэша.
Запускать этот скрипт автоматом раз в час, или как угодно, натравливая
только на свежепоявившиеся файлы. Что характерно - этот способ не
тормозит загрузку, потому что фильтр получается постмодерирующий.
Посетители "наполнят" файлы блокировки за каких-нибудь пару-тройку
дней. Но, кстати, надо иметь в виду то, что придётся принудительно
_разрешать_ некоторые сайты, главным образом - поисковики. Потому что
иначе после первого же деятеля, поискавшего в альтависте "hard porno",
вся альтависта станет недоступна (критерий выполнится, потому что вся
страница будет заполнена сплошными ключевыми словами). И вообще, к
фильтрации надо аккуратно подходить, "плохие" слова часто встречаются
во вполне невинных текстах.
-------------------------------------------
С уважением,
Ivan Kudryashov <jony на chat.ru> ICQ 1547081
Подробная информация о списке рассылки community