Чистка пользователей - 2 Минус 200 000 ботов

Итак у нас осталось 931 916 пользователей

Базовый принцип определения ботов:

1) не логинились ни разу на сайт по новой авторизации
2) Имеют более 4х точек до собаки
3) Не имеют русских символов в логине
4) Не имеют ни одного комента на сайте
5) Нет комментов на форуме
6) почта не заканчивается на .ru

Получили вот такой список:


Далее мы заметили что у ботов есть специфичные домены.

Проанализировали статистику использования почтовых доменов и поняли, что есть домены, которые используются только ботами. Например 51344 пользователей зарегистрированные с почтой от китайского домена sina.com

Кроме того, если взять hotmail и aol и по ним отфильтровать по тому же принципу (отсутствие коментов, отсутствие русских букв, древняя дата регистрации и т.п.) то ещё тысяч 50 будет

Вот список зарегистрированных пользователей по доменам:

gmail.com 276645
mail.ru 187429
yandex.ru 60572
sina.com 51344
hotmail.com 30979
aol.com 25890
rambler.ru 23972
bk.ru 12390
dolphinmail.org 11724
buchananinbox.com 11537
hamstermail.net 11387
expressgopher.com 11330
jeffersonbox.com 11294
tylerexpress.com 10927
list.ru 10179
trumanpost.com 8578
inbox.ru 8079
pinkinbox.org 7875
greeninbox.org 7676
yahoo.com 5439
outlook.com 4940
ya.ru 4210

Обратите внимание sina.com на 4м месте. Все регистрации сделаны в 2013 году

Начальная цифра перед чисткой была - 1130779 пользователей. Минус 200 000 ботов. Завтра продолжим.
Редактировано: 16 июля 2019

Комментарии:
Вот это вы работу провели!
И теперь лучше все будет работать?
А чего они вдруг в 2013 году набежали?
нашли еще 123 000 пользователей использующие спам-домены:

@greeninbox.org
@pinkinbox.org
@trumanpost.com
@tylerexpress.com
@jeffersonbox.com
@expressgopher.com
@hamstermail.net
@buchananinbox.com
@dolphinmail.org
@mailondandan.com
@orangeinbox.org
@luxurychanel.com
@newsinhouse.com
@siteposter.net
@hooverexpress.net
@mailabconline.com
@niketexanshome.com
@blackinbox.org
@alexamaci.denver-pop3.top
@jpcoachoutletvip.com
@vipraybanuk.co.uk
@prokonto.pl
@oakleysunglassesdiscountusw.com
@fogkkmail.com
@justafou.com
@dfgggg.org
@yandexmailserv.com
@buyhermeshere.com
@tom.com
@satabmail.com
@besttopbeatssale.com

Нажали кнопку удалить. Ждем результатов)

sveetna, ну, конечно ) Мы за этого год провели огромную работу по техническому долгу". Если вы обратили внимание, Клерк практически перестали "падать".
Какой смысл в существовании этих "ботов"?
Боты - это специальное ПО, которое выполняет какие-либо действия через интерфейс предназначенный для людей.
Еще боты - это обувь, но это определение в данном случае совсем не катит.
Почему вы называете их ботами?
Если они не логинятся и ничего не пишут, зачем кому-то понадобились эти учетные записи?
Да еще в таком количестве?
Заготовка для какой-то спам или а'ля-дидос атаки?

Да, конечно! Боты - это обувь!
Не вижу никакого смысла в создании такого количества "ботов" (хотя это не боты).
Кроме одного - чтобы владельцу ресурса представить себя как очень популярный портал с большим количеством пользователей.
А эти мейлы реальные? Живые? Или их просто кто-то составил случайным образом?
Если вы обратили внимание, Клерк практически перестали "падать".
обратила, думала, мне кажется
молодцы!!!
200k "ботов" для попыток взлома или каких-то деструктивных действий?
13-й год - наверное, тех логов уже нет и узнать откуда их плодили не получится.
Остается - память, простая человеческая память. ©Тегеран 43
Если это было в 13 году, надо подумать и вспомнить что там тогда было в 12-13 году?
Кто из лучших друзей или надежных партнеров и зачем приготовил 200k логинов?
И куда они (лучшие друзья) потом делись, почему план по использованию этих "ботов" не был реализован?
Думай, голова, шапку куплю ...
А чего они вдруг в 2013 году набежали?
По опыту прошлой работы, они в те времена вообще очень активно бегали. Некоторые даже спам размещали, просто не все смогли это сделать. В конечном счёте все они оказались или заблокированными, или заброшенными (регистрации новых, к слову, идут постоянно). А при большом количестве пользователей (не важно, живых или рекламных) начинаются определённые проблемы со скоростью работы; нужно проводить чистку.
 

Подтвердите удаление записи