« Спамилка от гугла? | Апдейты поисковиков »
Под обычной индексацией страниц сайта понимается ситуация, когда бот поисковика заходит по внешней ссылке на какую-то страницу сайта, например на морду, находит там ссылки на внутренние страницы и обходит их тоже, находит на них ещё ссылки на более внутренние страницы и идёт туда. Работает это медленно и печально, есть разные способы помочь ботам в этом нелегком деле.
1. Добавление всех страниц сайта вручную (либо скриптом) через “аддурилку”, форму на сайте поисковика, куда можно добавить свой сайт. Вроде бы хорошо работает в Яндексе, с Гуглом непонятно, работает ли вообще хоть как-то, может данные оттуда даже никуда не записываются. Прикол: капчу, которую показывает Гугл на странице аддурилки, можно не вводить, работает одинаково. :)
2. Ротация внутренних ссылок на морде сайта и на других проиндексированных страницах. Классика. Недостаток в том, что зухмашина Гугл не любит, когда уже проиндексированный документ сильно меняется, так что способо не особо хороший и ускорение от него не особо сильное.
3. Создание ссылочных хтмл карт, хостящихся отдельно, на трастовых хостах. Как разновидность: создание хсс карт – огромных нтмл-портянок с хсс ссылками. Этот способ вроде как даже выращивает ТИЦ в Яндексе. Хакеры, ломающие вордпресс выкладывают такие карты на ломаные хосты, в результате новые сломаные хосты индексируются довольно шустро и формально у них получается бесспамная работа, но на пару лет за неё всё равно могут посадить.
4. Создание хитрых RSS-карт, когда карта ссылок генерится не сразу вся, а симулируется создание RSS-ленты, которая пингуется в пингосервисы. Для индексации тысяч страниц наверное не подойдёт, реализовать такое довольно сложно, зато страницы должны моментально попадать в “быстрый индекс”.
5. Разбивка ссылок на блоки и сабмит их в различные закладочные сервисы, которых сейчас уже есть несколько сотен. Хорошо тем, что сразу появляется постоянный беклинк, плохо тем что требует реализации довольно сложного скриптового сценария, либо тяжелой ручной работы, там где нет импорта закладок.
6. Развешивание ссылок на сетях сплогов. Примерно похоже на предыдущий пункт, но легче реализуемо, поскольку сплоги управляются однотипно и их могут быть тысячи (на блоггере и WPMU-сайтах). Опять же, тоже образуются постоянные бэки (пока не снесут сплог).
7. Принудительное заманивание адсенс-бота на страницу с установленным адсенсом. Как известно, зухмашина Гугл использует некий кэш для индексируемых страниц, так что если страницу прочитает медиа-бот, то про неё будет знать и гугльбот, но неясно поможет ли это индексации. Скорей всего, поможет, скоро буду знать наверняка.
Показываемый адсенс при этом совсем не обязательно должен принадлежать владельцу сайта, поскольку защиту против показа адсенс объявлений ввели совсем недавно, найти незащищенный код на просторах интернета не составляет никакой проблемы. Ещё хорошо тем, что скорость индексации зависит только от скорости отрисовки страниц браузером, тем более что можно запускать паралленьно несколько процессов.
P.S.: Ставьте ссылки на пост, канальи!
16 Responses
April 10th, 2008 at 16:01:42
// php gravatar() ?>1а sitemaps не помогают?
Google uses your Sitemap to learn about the structure of your site and to increase our coverage of your webpages.
http://www.google.com/support/webmasters/bin/answer.py?answer=35769
April 10th, 2008 at 16:03:35
// php gravatar() ?>2Насчет последнего способа… Гугл постоянно уверяет, что между ботами нету никакой связи. Обратное, вроде, никто не доказал. Т.е. медиа-бота пригнать на сайт раз плюнуть, но он не связа с основным индексом.
P.S. Катпчу твою невозможно ввести, т.к. фокус постоянно на URI стоит (Firefox 2/0/13)
April 10th, 2008 at 16:14:42
// php gravatar() ?>3bondar, это где он такое уверяет? Год-два назад гугл сам новость рассказывал, что данные всех ботов валятся в одну кучку, из которой их потом разгребают.
Капчу надо табом переключать.
April 10th, 2008 at 16:20:33
// php gravatar() ?>4У кого-то из буржуев читал довольно давно, что эти боты занимаются каждый своим делом. Адсенс не влияет на индексацию. Типа проверяли даже.
April 10th, 2008 at 16:25:25
// php gravatar() ?>5medar, тут как раз ключевой момент – когда было это “довольно давно”.
Потому что довольно недавно сам гугл утверждал обратное.
April 11th, 2008 at 12:13:43
// php gravatar() ?>6Реально из них самый простой это картами сайта спамить, где угодно причем.
April 12th, 2008 at 14:43:27
// php gravatar() ?>7беки, беки, беки….
пинг, пинг, пинг….
и вуаля
April 14th, 2008 at 10:12:58
// php gravatar() ?>8Вац из “хсс ссылки”?
April 14th, 2008 at 22:03:56
// php gravatar() ?>9Пинг уже не работает в тех промышленных масштабах, что раньше =))
April 16th, 2008 at 19:38:51
// php gravatar() ?>10>Год-два назад гугл сам новость рассказывал, что данные всех ботов валятся в одну кучку, из которой их потом разгребают.
Угу:
http://www.mattcutts.com/blog/boston-pubcon-2006-day-1/#comment-22471
April 23rd, 2008 at 12:07:28
// php gravatar() ?>11а где ваши доказательства
)
пока наблюдаю обратное: пропинговал – роботы приходят
April 23rd, 2008 at 23:53:36
// php gravatar() ?>12Цены на гмайло все видели? Это сильно упрощает кучу вещей.
May 13th, 2008 at 19:26:39
// php gravatar() ?>13кто нибудь боролся с проблемой, когда на пинг боты не приходят ??????
May 21st, 2008 at 01:41:55
// php gravatar() ?>14[...] много-много WPMU сайтов. На входе вводится список WPMU хостов, желаемая тема для сплогов и их количество, контент и [...]
May 22nd, 2008 at 16:34:18
// php gravatar() ?>15[...] Нетривиальные способы загона страниц в индекс гугла. http://alexf.name/2008-04-10/7-sposobov-prinuditelnoj-indeksacii-stranic-poiskovikami/ [...]
October 18th, 2008 at 03:02:46
// php gravatar() ?>16[...] в блогах: 7 способов принудительной индексации страниц поисковиками. [...]
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf