Previous Entry Add to Memories Share Next Entry
Тонкая фильтрация спама MDAEMON
авафот
[info]mexicanose
Поделюсь решением последней из админских задач, которой пришлось таки заняться, когда на мой локальный почтовый адрес пришло за три дня 800 спам-писем, пришлось вытаскивать себя из этого болота как "тот самый Мюнхгаузен", не без помощи гугла, но и не без админской смекалки.

Чем руководствовался: http://www.mdaemon.org.ru/forum/%C1%E5%E7%EE%EF%E0%F1%ED%EE%F1%F2%FC%20%E8%20%E0%ED%F2%E8%F1%EF%E0%EC/396a9ba50e10205c29b0ba0669925380

Как сделал:

на тот случай, если вдруг приведенная выше ссылка похерится, да и вобще немного по-своему. Вобщем я делал тонкую фильтрацию спама на MDAEMON 12.0 следующим образом:

1. Средства онлайн фильтрации: DNSBL, ReverseLookup, Backscatter Protection, Dinamical Screening (эти опции у меня включены), SPF, Тарпиттинг и Грейлистинг (эти опции я отключил). Впринципи тут все можно подрегулировать в ходе работы.

2. Включаем сам спам-фильтр для эвристики: цитирую ссылку выше "Включаешь необученную эвристику (assasin), говоришь "метить, но пропускать". Порог метки ставишь стандартный = 5.0, порог уничтожения поднимаешь "за облака", скажем, 100.0"

Скриншот моего фильтра.

Спам-фильтр MDAEMON

3. Подготовка к обучению байесовского метода. "Если база байеса уже есть, но не нравится как она работает или неизвестно ее происхождение, то нужно просто стереть файлы bayes_seen,bayes_toks, bayes_journal.
Отключаем байесова автообучение и белый список (авто), иначе обучение будет корявым, база будет постоянно переполняться и будет происходить вытеснение старых записей."

4. Находим папки где баес хранит свой спам и неспам (хам) или создаем две public IMAP-папки — одну для спама и одну для хама,  внеся соответствующие пути в настройки Байесова фильтра. Папки по умолчанию лучше не оставлять так как в ряде случаев наблюдается неверно прописанные пути в конфиг-файле, при изменении же пути будет изменен и соответсвующий конфиг. Здесь важна длина пути, опытным путем определили значение в 12 символов:

C:\MDSpam
C:\MDHam


5. Далее, там же в настройках отключаем Баесовкое автообучение, которое поумолчанию назначено на полночь каждые сутки. 6. Далее, собственно если ваши локальные спам-папки уже полны спамом, то смело копируем их содержимое в папку C:\MDSpam указанную выше. В C:\MDHam следует положить письма из входящих, которые точно не спам. Пропорции советуют придерживаться равной например 200/200.

C:\MDaemon\Users\домен.ru\имя_юзера\message\Спам.IMAP отсюда кидаем в
C:\MDSpam

C:\MDaemon\Users\домен.ru\имя_юзера\message отсюда кидаем в
C:\MDHam

Прим. 2) если пользователи работают с обычными MS Outlook-клиентами, то стоит выставить в настройках аутлука - сохранение копий на сервере, если таковая опция не включена, то соответственно и папки message на серваке у всех будут пустые.

7. Жмем поочереди кнопки "Обучиться" в меню Байесова классификация и кнопку "Перезапустить" в меню Фильтр спама.
8. Заключение. "Кормить после этого Байесу нужно письма ТОЛЬКО С ОШИБОЧНОЙ КЛАССИФИКАЦИЕЙ  
Т.е. спам, ошибочно не помеченный ассассином или хам ошибочно помеченный...  — Нет ошибок классификации — ОБУЧАТЬ БАЙЕСА НЕЧЕМУ. Через 3-4 недели (если АККУРАТНО все сделано) получаешь ошибку фильтрации <1% (типично 0.01..0.1%). Если аккуратно все сделано будешь иметь 2-5 штук спам'а в неделю."

Сейчас обнулил счетчики и удалил правила Байеса, то есть фильтрация ведется только по 1 пункту, что уже отсеивает 90% спама, примерно 3-4 спам письма в день вместо 200-300.








You are viewing [info]mexicanose's journal