1.5, SubGun (??), 22:15, 19/08/2021 [ответить] [﹢﹢﹢] [ · · · ]
| +5 +/– |
Радостно видеть, что, даже спустя столько лет, проект развивается. И есть есть хоть одна альтернатива проприетарщине.
| |
|
2.10, Онаним (?), 23:59, 19/08/2021 [^] [^^] [^^^] [ответить]
| +/– |
Да альтернатива-то она есть, только толку от неё нет.
Как фильтр - замечательный проект.
Но к сожалению, проприетарщина вывозит именно за счёт большой базы для репутационных фильтров, которые создать, не имея большой сети MTA, проблематично.
| |
2.14, Ph0zzy (ok), 08:09, 20/08/2021 [^] [^^] [^^^] [ответить]
| +1 +/– |
Проект хороший. Но такие громкие заявления, что "есть хоть одна альтернатива" - а что не так с spamasassin?
| |
|
|
4.16, 1 (??), 09:25, 20/08/2021 [^] [^^] [^^^] [ответить]
| +1 +/– |
> Perl...
Это к тому что не на расте ?
> Плюс угрёбищная интеграция.
С чем интересно ?
Проблема spamassassin одна - не может он маштабироваться ...
Когда поток писем становится по настоящему большим - он выжирает все доступные ресурсы.
| |
|
5.17, Онаним (?), 09:39, 20/08/2021 [^] [^^] [^^^] [ответить]
| +3 +/– |
>> Perl...
> Это к тому что не на расте ?
Я даже не знаю, что из этих двух сортов выбрать...
> Проблема spamassassin одна - не может он маштабироваться ...
Perl.
| |
5.18, Онаним (?), 09:40, 20/08/2021 [^] [^^] [^^^] [ответить]
| +1 +/– |
Хотя на самом деле масштабируется горизонтально он достаточно легко, просто надо следить за тем, чтобы тренинг шёл на всех серверах однообразно.
| |
|
|
|
|
1.11, Аноним (11), 00:04, 20/08/2021 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
>Примечательно, что код парсеров написан не на языке Си, а на C++17, что требует для сборки наличия компилятора с поддержкой данного стандарта.
А что html4ever их не удовлетворил?
| |
|
2.19, Онаним (?), 09:49, 20/08/2021 [^] [^^] [^^^] [ответить]
| –1 +/– |
Вы о чём?
Хрустоподелкам в этой сфере не место вообще, от слова "совсем".
| |
|
1.21, Gogi (??), 12:41, 20/08/2021 [ответить] [﹢﹢﹢] [ · · · ]
| –1 +/– |
Не представляю, какими "статистическими методами" можно отделить спам от деловой почты! Обилием смайликов?
Спам - это такие же письма, как и все остальные. Более того - они успешно маскируют содержимое. Если я-то не всегда понимаю, где спам, как поймёт робот?!
Но проблема не в этом... проблема в ценности письма! Если "пропустить спам в ящик" - допустимо, то "выкинуть в спам деловое письмо" - категорически НЕТ! И даже если "правильное" письмо не удалили, а просто кинули в спам, а потом вам предлагают его найти в "Spam" папке, то чем это отличается от той же ручной сортировки?!!?
| |
|
2.23, Аноним (-), 14:47, 20/08/2021 [^] [^^] [^^^] [ответить]
| +1 +/– |
Поизучайте тему классификаторов. Для начала, можно изучить Наивный Байесовский Классификатор.
| |
2.24, Корпоративный_сисадмин (?), 17:29, 20/08/2021 [^] [^^] [^^^] [ответить]
| +1 +/– |
Простейший пример - десятки одинаковых писем отправляемые разным, иногда не существующим получателям. Часто - валящий неделями и месяцами. Вот уж где статистике и маш.обучению самое место.
| |
2.27, sage (??), 19:21, 21/08/2021 [^] [^^] [^^^] [ответить]
| +/– |
Rspamd работает на удивление хорошо. Они используют:
* Локальные классификаторы, которые можно обучить вручную на архивах спам и не-спам писем;
* DNSBL, URIBL и (собственный, если не ошибаюсь) сервер со спам-строками, хеши которых загружаются из интернета
Классификация писем осуществляется по множеству признаков, в т.ч. rspamd может обучаться тому, ответили ли вы какому-то корреспонденту, или нет, перенесли ли из спама в inbox письмо (или наоборот).
| |
|
1.22, Gogi (??), 12:49, 20/08/2021 [ответить] [﹢﹢﹢] [ · · · ]
| –4 +/– |
Пока что я отсекаю спам прямо по IP - собираю адреса всех уродов и тупо удаляю их письма.
Что итересно, некоторое время назад ящик был относительно чистый, а вот последний месяц шакалы прямо активизировались! Забанил кучу адресов, включая iCloud и amazon - пи****оры сами виноваты, что дают облака кому ни попадя.
| |
|
2.25, Nogi (?), 22:07, 20/08/2021 [^] [^^] [^^^] [ответить]
| +3 +/– |
админ почты локалхоста? В любой среде где более 10 юзеров биги (гугл/яху/эпл/фб/амазон) резать можно
только по контенту, где rspamd просто шедеврально справляется с задачей, лучше платных аналогов.
| |
|
3.26, BrainFucker (ok), 03:12, 21/08/2021 [^] [^^] [^^^] [ответить]
| –2 +/– |
> В любой среде где более 10 юзеров биги (гугл/яху/эпл/фб/амазон) резать можно только по контенту,
Ага, то-то я смотрю антиспам гугла и яндекса часто фейлит.
Яндекс, впрочем, такое впечатление что у них почту админы локалхоста конфигурили. Смешно, они грейлистинг используют, лол (удел мелких сервачков).
| |
|
4.28, PnD (??), 22:41, 23/08/2021 [^] [^^] [^^^] [ответить]
| +/– |
Это ничего что (избирательный) грейлистинг — практически единственное *законно* доступное оператору связи решение? (Чуть утрирую, но "на входе" это крайне эффективный метод парализовать спамо-специфичные сервисы. По итогам массового внедрения спамеры уже́ опустились до лома юзерских аккаунтов и рассылки по паре писем в минуту /больше на моей делянке абы-кому низзя/.)
Впрочем, минимум одна проблема у яндекса таки наблюдается. Они используют в телематике (пример: их резолверы) нечто доморощенно-самописное. Причём, писа́вший похоже уже покинул их ряды, так что проблему с навечно залипающими в кэшах записями решать некому.
| |
|
5.29, BrainFucker (ok), 02:07, 24/08/2021 [^] [^^] [^^^] [ответить]
| +/– |
> Это ничего что (избирательный) грейлистинг — практически единственное *законно* доступное оператору связи решение?
Грейлистинг самое тупое и вредное решение, к тому же давно бесполезное. Оно вносит большую задержку в доставку почты.
Напомню, что его цель это отклонение писем, отправленных просто скриптами, а не полноценным почтовым сервером. Но такого спама сейчас мало. Большая часть спама сейчас это корпоративные серверы, причём с самими серверами зачастую всё нормально, у них валидный SPF и DKIM, а спам очевидно рассылают трояны с компов сотрудников контор. Ну или некоторая часть серверов возможно криворукими админами оставлена как open relay, но таких мало сейчас, т.к. это недефолтная конфигурация.
Так вот, есть более безвредные способы определить отправил письмо почтовый сервер или тупо скрипт. Впрочем, если SPF и DKIM валиден, то не пофиг ли? Но яндекс в грейлистинг отправляет вообще тупо всё, если это не почтовый сервис из белого списка типа gmail, mailru и т.п.
| |
|
6.30, Vsevolod Stakhov (?), 03:01, 24/08/2021 [^] [^^] [^^^] [ответить]
| +1 +/– |
> Грейлистинг самое тупое и вредное решение, к тому же давно бесполезное. Оно вносит большую задержку в доставку почты.
Вы путаете безусловный и избирательый грейлистинг. Избирательный грейлистинг значит, что почтовая система не уверена в оценке данного конкретного письма (и не факт, что это как-то связано со скриптами и прочим). Возможно, через 10 минут этот IP (или содержимое письма) уже будет в каких-то RBL или иных "черных" списках, а возможно и нет. В худшем случае вы несколько задержите хорошее письмо, но в лучшем - отбросите спам или что похуже.
Безусловный грейлистинг - это достаточно тупо, но избирательный может быть очень хорошим средством борьбы со спамерами. И именно такой грейлистинг реализован в Rspamd. Более того, Rspamd реализует при грейлистиге не только проверку триплетов (или дублетов) метаданных, типа ip/mail from, но и сохраняет хеш от контента письма, что позволяет проходить грейлистингу даже если IP сменился на другой глобус.
| |
|
|
|
|
|
|
2.33, Александр (??), 13:32, 01/09/2021 [^] [^^] [^^^] [ответить]
| +/– |
Спрашивал когда-то в Telegram чате rspamd, как реализовать такой сценарий. Мне почему-то там ответили, что это глупая идея. Возможно, даже это был Всеволод. После этого спрашивать там что-то еще не захотелось.
В общем сделал это через правило для модуля metadata exporter.
Посмотрите, в описании этого модуля на сайте есть пример с селектором is_reject_authed.
Только я заменил его на is_reject
Не знаю насколько это правильно, может есть более лучшие способы.
| |
|
3.34, Корпоративный_сисадмин (?), 15:35, 14/09/2021 [^] [^^] [^^^] [ответить]
| +/– |
> В общем сделал это через правило для модуля metadata exporter.
> Посмотрите, в описании этого модуля на сайте есть пример с селектором is_reject_authed.
Спасибо, думаю это то что нужно. И явно не худший вариант реализации (я уже начал было заголовки X-Spam отлавливать...)
| |
|
|
|