Слово honeypot означает нечто, что сделано для намеренного привлечения внимания нарушителей и их отлова. В применении к поисковикам использующим ссылочное ранжирование (Google, Yahoo, MSN, Yandex и т.д.), это могут быть специально сделанные или просто отобранные вручную гостевухи, появление ссылок в которых означает, что данную ссылку спамят. Например, Мэтт Катц может вручную отобрать 100 загаженных но не умирающих гостевух (с другими Мэту лень возиться) и мониторить их на предмет появления ссылок. Если ссылка появляется сразу в нескольких гестах, то это 100% спам.

Что же делать, если такие хани-поты попали к вам в базу? Вычистить их оттуда очень тяжело, а эффективность базы, отравленной ханипотами в лучшем случае падает, а в худшем база начинает работать со знаком минус. Лучшее из решений “в лоб” что пришло мне в голову – делить базу пополам и смотреть с какой половины базы выходит больше толку, но если в базе несколько ханипотов, то они вполне могут оказаться во всех поделенных частях. Так что можно делать немного по другому.

Можно отбирать доры, дающие больше трафа чем другие и смотреть бэки на эти доры, собирая из этих бэков чистую базу. Таким образом со временем образуется большая грязная база и база поменьше, но зато приносящая больший эффект. Большую базу можно периодически собирать по новой обычными способами. Откуда собирать чистую базу понятно - из моего обнаружителя бэков, проверяя там старые, бывшие в топе доры.

Похожие посты