18 Oct
Posted by alexf as SEO, wordpress, идеи, ниши, новичкам, палю тему, шняга
« Поиск хитроботов гугла | Про Чичваркина »
Придумал, как принудительно палить темы блоггеров-финбомжей и прочих мастеров ласто. Которые любят вести блоги по рецепту – грамм мяса на ведро каши, да и то не на каждое.
Можно автоматически выловить у таких блоггеров всю “тушёнку”, то есть ссылки. Особенно легко это делается для блогов на блогспоте, делаем запрос вида http://myseolife.blogspot.com/search?max-results=1000 и из полученного файла извлекаем все внешние ссылки. Для вордпресса вроде такого хитрого запроса нету, но несложно просканировать блог на несколько страниц назад, вот так. В довесок к вырезанию ссылок, можно регекспом вырезать из текста все домены, как то так preg_match_all(‘/\b[a-zA-Z0-9-]{3,25}\.[a-zA-Z]{2,4}\b/’, $text, $domains); (потом оставить только .com).
В качестве примера, посмотрим на что ссылается ижевский бомж:
2007-10-17 20:49:11 Tema [forums.affiliatebunker.com] cnt [11]
2007-10-17 20:49:11 Tema [www.affiliatebunker.com] cnt [9]
2007-10-17 20:49:11 Tema [www.casinoportal.ru] cnt [8]
2007-10-17 20:49:11 Tema [bp3.blogger.com] cnt [5]
2007-10-17 20:49:11 Tema [www.armadaboard.com] cnt [5]
2007-10-17 20:49:11 Tema [rusppc.blogspot.com] cnt [4]
2007-10-17 20:49:11 Tema [romanpushkin.blogspot.com] cnt [4]
2007-10-17 20:49:11 Tema [davydov.blogspot.com] cnt [4]
2007-10-17 20:49:11 Tema [www.squidoo.com] cnt [4]
2007-10-17 20:49:11 Tema [site-kontent.ru] cnt [4]
2007-10-17 20:49:11 Tema [maulnet.ru] cnt [3]
2007-10-17 20:49:11 Tema [bp1.blogger.com] cnt [3]
2007-10-17 20:49:11 Tema [www.kopernik.name] cnt [3]
2007-10-17 20:49:11 Tema [bp2.blogger.com] cnt [3]
2007-10-17 20:49:11 Tema [casinoportal.ru] cnt [3]
2007-10-17 20:49:11 Tema [umklaidet.blogspot.com] cnt [3]
2007-10-17 20:49:11 Tema [konkoff.blogspot.com] cnt [3]
2007-10-17 20:49:11 Tema [www.wickedfire.com] cnt [3]
2007-10-17 20:49:11 Tema [ru.titanpay.com] cnt [2]
2007-10-17 20:49:11 Tema [epavel.ru] cnt [2]
2007-10-17 20:49:11 Tema [brokenbrake.biz] cnt [2]
2007-10-17 20:49:11 Tema [forums.digitalpoint.com] cnt [2]
2007-10-17 20:49:11 Tema [affiliaterra.blogspot.com] cnt [2]
2007-10-17 20:49:11 Tema [www.stevepavlina.com] cnt [2]
2007-10-17 20:49:11 Tema [www.income.com] cnt [2]
2007-10-17 20:49:11 Tema [www.kinovip.com] cnt [2]
2007-10-17 20:49:11 Tema [marketing.3fn.net] cnt [2]
2007-10-17 20:49:11 Tema [technorati.com] cnt [2]
2007-10-17 20:49:11 Tema [malyshbezkarlsona.blogspot.com] cnt [2]
2007-10-17 20:49:11 Tema [homelessinmoscow.blogspot.com] cnt [2]
2007-10-17 20:49:11 Tema [artyom-maynas.blogspot.com] cnt [2]
2007-10-17 20:49:11 Tema [www.partnerclub.ru] cnt [2]
2007-10-17 20:49:11 Tema [miku.ws] cnt [2]
2007-10-17 20:49:11 Tema [www.allseo.ru] cnt [2]
2007-10-17 20:49:11 Tema [www.google.com] cnt [2]
13 Responses
October 18th, 2007 at 15:13:53
// php gravatar() ?>1А как же контекст? Тогда надо хотя бы пару предложений ещё выцеплять – то, в котором ссылка содержится, и соседние.
Да и вообще, часто люди говорят нечто полезное вообще без ссылок.
October 18th, 2007 at 16:13:21
// php gravatar() ?>2Тогда портянка получится немеряной длины, а смысл всего действа как раз в сокращении и оптимизации читаемого. Хотя конечно можно и так. Вообще, самое интересное там, где счётчик упоминаний 1, всё что выше это обычно всякие баннеры и блогроллы.
October 18th, 2007 at 16:14:52
// php gravatar() ?>3Так надо из фида брать, тогда не будет никаких блогроллов и счётчиков )
October 18th, 2007 at 16:19:52
// php gravatar() ?>4Так фид разве можно размотать больше чем он сам позволяет, то есть 10-20 постов? Посмотри запрос, он весь блог на блоггере вытягивает.
October 18th, 2007 at 16:25:51
// php gravatar() ?>5На блоггере как раз можно XML получить, а вот с другими платформами – не знаю. Может и не выйдет, действительно.
October 19th, 2007 at 14:06:43
// php gravatar() ?>6Хм … Надо поэкспериментировать с этим …
October 19th, 2007 at 19:16:03
// php gravatar() ?>7Тормоз, как на блоггере XML получить?
October 19th, 2007 at 19:31:45
// php gravatar() ?>8Вот у красавчега почитай – http://myseolife.blogspot.com/2007/09/blogger-com.html
Я таким образом ебуку давыдовскую сделал
http://master-pipes.ru/viewtopic.php?id=79
October 19th, 2007 at 20:41:02
// php gravatar() ?>9Хм, вот ведь, я же оттуда ссылочку то и взял, на обычную выдачу. А хмл не заметил!
October 22nd, 2007 at 08:20:11
// php gravatar() ?>10“а вот с другими платформами – не знаю”
А кто мешает чужое фидбернером цопнуть? Он же никак авторство не проверяет.
October 22nd, 2007 at 13:44:14
// php gravatar() ?>11Я не понял, зачем чужое цопать фидбёрнером? Если у хозяина блога, фид отдаёт только 10 постов, то цопанье не поможет, о чём написано выше.
October 28th, 2007 at 08:27:00
// php gravatar() ?>12Действительно работает, можно взять и выкачать кучу блогов и читать уже в оффлайне.
November 13th, 2007 at 12:41:15
// php gravatar() ?>13надо показывать текст линка хотябы
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf