« Hot Trends | Разновидность рефспама: спам закрытой статистики »
Один из самых противных видов ссылочного спама это рефспам. Это очень простая вещь: есть несколько известных бесплатных скриптов, которые показывают что-то вроде “последние сославшиеся страницы” или “топ30 реферралов”. Самые известные примеры это 2 скрипта статистики – Webalizer и Webstats, их в основном и спамят. Процесс спама состоит в многократном дёрганьи любой страницы сайта на котором установлен скрипт статистики, с нужным реферралом, чтобы ссылка появилась на странице статистики в топ30. Большинство сайтов где стоят такие скрипты, находятся по признакам гуглом, то есть известны спамерам, поэтому чтобы попасть в топ, нужно переспамить других спамеров, а это значит нужно серьёзно досить сайты со скриптом.
Технически рефспам делается на порядки легче чем спам в комментах или по гостевухам, основная проблема в этом деле – это как раз конкуренция между спамерами и постоянно уменьшающаяся база вебалайзеров. Какой вред может быть от этого?
Главный вред это бессмысленный расход трафа и лишняя нагрузка на сервер. Чтобы проспамить ссылку, спамеру вовсе не нужно загружать страницу целиком, достаточно послать запрос скажем на первые 100 байт, если сайт полностью динамический, то сервер при этом нагрузится точно также, как при генерации целой страницы. Например, какие-то мои сайты попали в базу одного настырного спамера, и он уже года 2 меня спамит, вот свежий сайтик, который был проспамлен сегодня: wildcreditcard.com. Сами сайты у этого спамера получаются лучше, чем спам, поскольку вебалайзера у меня разумеется нет и никогда не было.
А сайтики чем дальше, тем становятся затейливей, например там явно используется какая-то технология для переписывания контента, возможно также есть какой-то генератор шаблонов, потому что похожие но неидентичные сайты этот спамер запускает сотнями. Как защититься это такого спама? Я делаю так: если реф не пустой и сославшийся сайт неизвестнен скрипту, то я вызываю gethostbyname (с кешированием конечно) и если ип спамерский, то запрос дальше не обрабатывается, а реф попадает в спамлист доменов. Менее ресурсозатратного способа мне придумать не удалось, думаю что его и нету. К счастью, спамер не обладает большой базой доступных ip адресов для хостинга, поэтому новые ip появляются не так часто, видимо когда его выгоняет очередной хостер.
21 Responses
October 8th, 2007 at 06:57:36
// php gravatar() ?>1Если помнишь на blackhatseo в форуме обсуждались разные апгрейды этого метода, аля накрутка счетчиков, если грамотно и большими объемами, то рыбы наловить можно… ну как впрочем во всем. А вообще +1 что метод – “отстой пидарский, восьмидесятое гавно” © Джей и молчаливый Боб”
October 8th, 2007 at 09:10:22
// php gravatar() ?>2Проще на уровне апача это делать, модреврайтом например
October 8th, 2007 at 09:34:05
// php gravatar() ?>3некоторые из ресов
_http://www.google.com/search?num=100&hl=ru&safe=off&client=opera&rls=en&hs=hCR&q=%22Feel+free+to+%2A+us%22+%22Copyrighted+Protected+by+US+and+International+law.%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=
_http://www.google.com/search?num=100&hl=ru&safe=off&client=opera&rls=en&hs=FP6&q=%22Copyrighted+Protected+by+US+and+International+law.+%2A+%C2%A9%22&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA&lr=
но чтото даже по проиндексированым кускам текста нету их в выдаче..
October 8th, 2007 at 13:04:17
// php gravatar() ?>4San4es, а как это через реврайт сделать? Внутри реврайта можно резолвить хосты?
October 8th, 2007 at 18:16:57
// php gravatar() ?>5давно это видел, на память примерно так – создаеться файлик с ипами прописываються дерективы в htaccess(путь до файлика и действия)
October 8th, 2007 at 18:36:01
// php gravatar() ?>6Файлик с ИПами это понятно, как домену резолв сделать, вот в чём вопрос.
October 9th, 2007 at 15:16:19
// php gravatar() ?>7Старый способ. С год назад уже результатов не давал
October 9th, 2007 at 15:28:01
// php gravatar() ?>8Kass, способ конечно старый, тут всё зависит насколько он старый лично для тебя.
Я про него узнал в 2004м и по моему он уже тогда результатов не давал. А ты пишешь что год назад (в 2006м) не давал, то есть подразумевается что до этого он тебе что-то давал?
А люди до сих пор мне сервера им долбят, значит наверное он им что-то даёт до сих пор. А вообще то я писал о защите от рефспама, а не как сервер кому-то завалить.
October 16th, 2007 at 22:24:09
// php gravatar() ?>9в 2005м оно рулило еще как, за сутки по всем известным таблеткам в топе за день оказывался, на неделю-полторы, 6 серверов трудилось спамя =) да и до сих пор еще спамят не только вебализерs, а блоги даже, типа inurl:disp=stats если кто помнит и в теме=)
October 16th, 2007 at 22:25:20
// php gravatar() ?>10это было к словам афтара по поводу “Я про него узнал в 2004м и по моему он уже тогда результатов не давал.” =)
November 14th, 2007 at 17:20:02
// php gravatar() ?>11[...] для поиска инсталляций нужных скриптов. В посте про рефспам я написал, что сайты с установленными вебалайзерами в [...]
November 14th, 2007 at 17:21:00
// php gravatar() ?>12[...] Про рефспам | Используем гугл для проверки прокси [...]
February 2nd, 2008 at 21:26:10
// php gravatar() ?>13[...] где я бываю, толку не было. Потом догадался – нужен рефспам. Понятно что рефспамить топовые ресурсы с сотнями [...]
February 3rd, 2008 at 17:29:56
// php gravatar() ?>14Спам это зло – а рефспам темболее
May 22nd, 2008 at 16:31:59
// php gravatar() ?>15[...] Рефспам и как с ним бороться. http://alexf.name/2007-10-08/pro-refspam/ [...]
August 9th, 2008 at 04:02:04
// php gravatar() ?>16alexf, может я туплю, но нельзя ли было попробовать что-то вроде такого:
RewriteEngine On
RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammer1.com.*$ [OR]
RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammer2.com.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammer3.com.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammer4.com.*$ [NC]
RewriteRule \.*$ http://www.disney.com [R,L]
August 11th, 2008 at 20:09:20
// php gravatar() ?>17organic, спамеры каждый день спамят 10-20 новых сайтов, адреса которых заранее неисвестны. Твой код кто подправлять будет по 20 раз в день? Пушкин, Александр Сергеевич?
Что ты будешь делать, когда через месяц такого подправления, у тебя будет 600 строк RewriteCond? Не надо придумывать велосипед, я написал рабочее решение.
September 8th, 2008 at 11:43:23
// php gravatar() ?>18Тему с Webalizer яндекс сегодня прикрыл.
September 24th, 2008 at 11:14:11
// php gravatar() ?>19по хид запросу активное содержимое не запускается апачем.
October 8th, 2009 at 15:28:13
// php gravatar() ?>20[...] года назад я написал про рефспам с целью оставления ссылки в открытой статистике сайта и рефспам закрытой [...]
October 17th, 2009 at 08:38:55
// php gravatar() ?>21Космический инвестор, как именно яндекс ее прикрыл?
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf