Чистка пользователей - 2 Минус 200 000 ботов
Базовый принцип определения ботов:
1) не логинились ни разу на сайт по новой авторизации
2) Имеют более 4х точек до собаки
3) Не имеют русских символов в логине
4) Не имеют ни одного комента на сайте
5) Нет комментов на форуме
6) почта не заканчивается на .ru
Получили вот такой список:
Далее мы заметили что у ботов есть специфичные домены.
Проанализировали статистику использования почтовых доменов и поняли, что есть домены, которые используются только ботами. Например 51344 пользователей зарегистрированные с почтой от китайского домена sina.com
Кроме того, если взять hotmail и aol и по ним отфильтровать по тому же принципу (отсутствие коментов, отсутствие русских букв, древняя дата регистрации и т.п.) то ещё тысяч 50 будет
Вот список зарегистрированных пользователей по доменам:
gmail.com 276645
mail.ru 187429
yandex.ru 60572
sina.com 51344
hotmail.com 30979
aol.com 25890
rambler.ru 23972
bk.ru 12390
dolphinmail.org 11724
buchananinbox.com 11537
hamstermail.net 11387
expressgopher.com 11330
jeffersonbox.com 11294
tylerexpress.com 10927
list.ru 10179
trumanpost.com 8578
inbox.ru 8079
pinkinbox.org 7875
greeninbox.org 7676
yahoo.com 5439
outlook.com 4940
ya.ru 4210
Обратите внимание sina.com на 4м месте. Все регистрации сделаны в 2013 году
Начальная цифра перед чисткой была - 1130779 пользователей. Минус 200 000 ботов. Завтра продолжим.
И теперь лучше все будет работать?