« Синонимайзер vs Рерайтер (rewriter) | Евро флешмоб »
Слово honeypot означает нечто, что сделано для намеренного привлечения внимания нарушителей и их отлова. В применении к поисковикам использующим ссылочное ранжирование (Google, Yahoo, MSN, Yandex и т.д.), это могут быть специально сделанные или просто отобранные вручную гостевухи, появление ссылок в которых означает, что данную ссылку спамят. Например, Мэтт Катц может вручную отобрать 100 загаженных но не умирающих гостевух (с другими Мэту лень возиться) и мониторить их на предмет появления ссылок. Если ссылка появляется сразу в нескольких гестах, то это 100% спам.
Что же делать, если такие хани-поты попали к вам в базу? Вычистить их оттуда очень тяжело, а эффективность базы, отравленной ханипотами в лучшем случае падает, а в худшем база начинает работать со знаком минус. Лучшее из решений “в лоб” что пришло мне в голову – делить базу пополам и смотреть с какой половины базы выходит больше толку, но если в базе несколько ханипотов, то они вполне могут оказаться во всех поделенных частях. Так что можно делать немного по другому.
Можно отбирать доры, дающие больше трафа чем другие и смотреть бэки на эти доры, собирая из этих бэков чистую базу. Таким образом со временем образуется большая грязная база и база поменьше, но зато приносящая больший эффект. Большую базу можно периодически собирать по новой обычными способами. Откуда собирать чистую базу понятно - из моего обнаружителя бэков, проверяя там старые, бывшие в топе доры.
14 Responses
March 19th, 2008 at 15:45:32
// php gravatar() ?>1очень хорошая методика. Беру на заметку.
March 19th, 2008 at 16:39:30
// php gravatar() ?>2Имхо, поисковики просто не учитывают ссылки с таких гест. А так можно валить конкурентов(баян).
March 19th, 2008 at 17:22:17
// php gravatar() ?>32TerVer
Учитывают – про использование honeypot’ов некоторые даже откровенно пишут, вот тут есть ссылки на мелкософтские доки: http://pseudo-tech-notes.blogspot.com/2006/12/blog-post.html
March 19th, 2008 at 21:12:50
// php gravatar() ?>4Да мелкософт так увлекся отловом спамеров, что вообще на полгода останавливал индексацию
Очень очевидное решение, но вопрос отделения белого от черного не снимает. Я проспамливаю конкурентов и что? на этот атакуемый ресурс и белые и грязные ссылики… БАЯН
)
March 19th, 2008 at 21:30:05
// php gravatar() ?>5Хотя конечно это похоже на мелко софт, учесть все гесты, учесть на что они ссылаются, посчитать что еще ссылается на миллиарды доров, отстроить для этого пару датацентров… А гугль просто не учиттыват ссылки с таких ресурсов, и хоть обспамся – нету качественных бэков, нету дора в топе
March 19th, 2008 at 23:22:40
// php gravatar() ?>6TerVer, молодец, усе верно, а то так можно завалить всех и вся.
У майкрософта если мозга не хватает, они просто рубят топором. А моск у них регулярно выключается.
March 19th, 2008 at 23:34:51
// php gravatar() ?>72TerVer
Так что всё грамотно там. Очевидно там тоже есть какие-то коэффициенты для регуляции а не тупо “нашёл 100 ссылок с ханипотов и забанил”.
Вообще там много факторов учитывается – и покажите мне хоть кого-нибудь кто будет проспамливать чужой свежий дор.
March 20th, 2008 at 04:15:11
// php gravatar() ?>8кстати, интересная тема.
буквально две-три недели назад, спамом я спокойно пролазил в топ по виагре. на сегодняшний день, в базу было добавлено 10к новых ресурсов и сейчас не вылазит вообще ничего. ни по одному кейворду.
надо проверить.
я сам использую “ловушки”, что бы отслеживать,что там сть нового у других, но как то не думал, что поисковики тоже занимаются подобным.
March 20th, 2008 at 14:34:53
// php gravatar() ?>9Тогда надо в спам сообщения вставлять левые сайты пиаристые.
В доры то уже многие вставляют…
March 21st, 2008 at 14:29:42
// php gravatar() ?>10Очень интересно наблюдать борьбу поисковиков с дорвейщиками. Такие интересные и всё новые способы придумываются.
March 23rd, 2008 at 23:24:10
// php gravatar() ?>11TerVer, да, идея неплохая.
June 18th, 2008 at 15:39:31
// php gravatar() ?>12[...] тем же подсетям или владельцам доменов. Под вопросом: ханипоты, страницы-ловушки [...]
June 24th, 2008 at 17:06:03
// php gravatar() ?>13Ханипоты могут и просто отрицательно влиять на исключительно свежие сайты, загоняя их далеко в з-цу выдачи.
А на примелькавшиеся сайты не повлиять вообще никак.
February 3rd, 2011 at 17:33:27
// php gravatar() ?>14[...] подправляли напильником свою выдачу. Гугл наделал ханипотов, заставил своих работников установить бинговский [...]
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf