« Опять про спаливание тем | Технология SEO отбеливания »
Пытаюсь обточить напильником вордпресс, чтобы он правильней индексировался в гугле. По умолчанию, вордпресс генерит слишком много дуплицированного контента, за что гугл может отпессимизировать. Например, посты видны на морде блога, в категориях, в месяцах, в днях, и на страницах. Если к тому-же висит виджет-календарь и список категорий, как у меня, то дни и категории совершенно классически получают больший вес и в гугле видны выше постов. Как исправить? Понятно что лучший способ – это заставить кого-то на себя ссылаться, но по малопонятным причинам на меня ссылаться почти никто не хочет.
То-ли люди боятся увиденные у меня темы спалить дальше (канальи), то-ли не понимают прочитанного, но тогда откуда столько читателей?
Вариант что я пишу никому ненужную чушь я отбрасываю.
Поэтому в ожидании ссылок можно доработать сам вордпресс, чтобы он не выставлял лишнее на показ гуглу. Файл robots.txt у меня имеет такой вид:
User-agent: Googlebot
Disallow: /category/
Disallow: /page/
Disallow: /2007/
Disallow: /2008/
Чтобы при этом не запретилось идексирование страниц, вид пермалинка пришлось сменить на самодельный. В инструкции пишут, что нельзя убирать дату, поэтому я поменял косую черту на тире: /%year%-%monthnum%-%day%/%postname%/. Таким образом посты не подпадают под запрет в роботс.тхт и вроде календарь продолжает работать нормально. Пытался переделать виджеты, чтобы они были с nofollow ссылками, но потом отказался от этой затеи, так как сейчас – вроде более правильно. Осталось подождать переиндексации гуглом съехавших постов.
27 Responses
November 14th, 2007 at 09:28:36
// php gravatar() ?>1Я каналья
Но ссылку на тебя в блогролле поставил.
November 14th, 2007 at 11:35:45
// php gravatar() ?>2А что мешает воспользоваться технологией sutemaps? http://www.arnebrachhold.de/2005/06/05/google-sitemaps-generator-v2-final
Делает то же самое, но изящнее. Но главное не забыть вырубить “automatic priority calculation”.
November 14th, 2007 at 11:58:15
// php gravatar() ?>3А я поставил себе “All in One SEO Pack” (http://wp.uberdose.com/2007/03/24/all-in-one-seo-pack/)
одна из фич:
Duplicate Content
You can have “noindex” and the like generated for archive-, category- and tag pages if you seem to have trouble with duplicate content.
November 14th, 2007 at 13:04:22
// php gravatar() ?>4Alick, а зачем вырубать “automatic priority calculation”?
November 14th, 2007 at 13:22:19
// php gravatar() ?>5а не проще ноуфоллоу поставить на эти линки?
November 14th, 2007 at 13:41:18
// php gravatar() ?>6medar, спасибо за сцылку.
Alick, до сайтмапов у меня ещё руки не дошли, по идее то что я сделал и так должно исправить ситуацию.
Ivan, да, я видел какие-то сео-плагины, но руками надёжней, точно знаешь чего делаешь.
dimok, я сначала так и сделал – переписал виджеты на нофоллоу. Но это не исправляет ситуацию, если категории и календарь уже в индексе гугла, как у меня. Посмотрим как теперь индекс перестроится.
November 14th, 2007 at 13:42:25
// php gravatar() ?>7Спасибо за инфу, давно искал, как уменьшить дубликаты контента в гугле. Яша вродь и так нормально индексит. Давно читаю твой блог через feedreader и мне он нравится. Будешь первым в моем blogroll’e
November 14th, 2007 at 13:46:09
// php gravatar() ?>8samik, если не вырубить, то к постам без комментов будет присваиваться приоритет 0,1. В то время как у разделов и календаря 0,5. Получается – с чем боролись, на то и напоролись.
November 14th, 2007 at 13:47:37
// php gravatar() ?>9alexf, в принципе, решение через robots.txt – оно более универсальное, да.
November 14th, 2007 at 18:39:36
// php gravatar() ?>10alexf, А как тот роботс.тхт, что ты написал, может запретить индексирование страниц, если у них линки будут типа: blog.com/post.html
November 14th, 2007 at 18:44:15
// php gravatar() ?>11Это будет хорошо и для Яндекса, а не только для Google.
Чем меньше дублей, тем лучше.
November 14th, 2007 at 20:08:35
// php gravatar() ?>12alman, думаю что никак не может, если пост не озаглавливать 2007.
Но в документации к вордпрессу написано, что такие пермалинки лучше не использовать, я выше дал ссылку.
November 14th, 2007 at 23:27:06
// php gravatar() ?>13та они там врут все
я не на одном блоге такие пермалинки юзаю и все зашибись… по теме, я бы еще поставил плагин site map.
November 14th, 2007 at 23:35:16
// php gravatar() ?>14ну и по ссылке что ты дал все влом было читать но там где про ” Using only %postname%” я что то не нашел чтобы прям таки нельзя было:
If you use postname as the only element in your permalinks to create a structure such as myblog.com/post-title, the rewrite rules may make it impossible to access pages such as your stylesheet (which has a similar format) or the /wp-admin/ folder. It’s best to include some numeric data (e.g. the post ID or date) in the permalink to prevent this from happening.
а а чтобы оно находило все файлы как надо пишем такой текст:
RewriteEngine On
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
который они кстати сами и предлагают,
и вот эта фигня:
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
как раз и говорит апачу что перенаправлять на index.php только то чего не существует…
имхо посты типа blog.com/10-10-2007/post-nema.htm как то не кошерно смотрятся
)
November 15th, 2007 at 18:37:40
// php gravatar() ?>15alman, Если бы было не “”влом читать”, то там в следующем предложении пишут о сути проблемы.
November 15th, 2007 at 19:59:29
// php gravatar() ?>16[...] Правим водрпресс под гугл (все хорошо, но забыл про nofollow) [...]
November 16th, 2007 at 01:23:35
// php gravatar() ?>17alexf, процитируй если не трудно…
November 19th, 2007 at 15:57:55
// php gravatar() ?>18Интересно. Обязательно попробую на своем новом блоге
November 22nd, 2007 at 06:14:19
// php gravatar() ?>192 Ivan: All in One SEO Pack действительно хорош. Использую этот плагин уже давно и не на одном блоге на движке wordpress. По запросам site:имя_блога_на_движке_вордпресса/category (или arhive) показывает noindex в Google.
2 alexf: Руками-то надежней, но зачем велосипед придумывать? Можно же доработать существующий код по-своему, хотя в All in One SEO Pack и дописывать-то нечего – все работает прекрасно. По крайней мере описанные в Посте проблемы по поводу дубликата контента решены.
November 23rd, 2007 at 00:23:59
// php gravatar() ?>20[...] в индексе до сих пор старые урлы, так что как сработал эксперимент пока непонятно. Пока трафа с гугла меньше [...]
November 23rd, 2007 at 04:59:32
// php gravatar() ?>21Florid, надо будет глянуть этот плагин, спасибо. Я правда не пойму как он проблему с календарём и категориями решит, смотрю он у тебя стоит и там роботс пустой.
November 25th, 2007 at 06:14:50
// php gravatar() ?>22Ну с календарем не знаю, а вот с категориями – в настройках плагина есть опция запрет на индексацию. Вот к примеру:
- Использовать тег noindex для рубрик
- Использовать тег noindex для архивов
- Использовать тег noindex для архивов по тегам
А robots.txt я и не заводил
December 19th, 2007 at 16:54:42
// php gravatar() ?>23[...] по правке вордпресса под гугл вроде окончился, наконец то гугл снёс (почти) все [...]
January 26th, 2008 at 22:07:13
// php gravatar() ?>24А если во такая шняга в заголовке благодаря плагину all in one seo pack прописывается
страницу только гугл пропустит или яша тоже?
January 27th, 2008 at 09:48:46
// php gravatar() ?>25alexf, мне кажется, или ты таким образом потерял кучу ссылок на посты с категорий и архивов, да и вообще осложнил Гуглоботу жизнь?
January 27th, 2008 at 13:45:01
// php gravatar() ?>26Я еще не сотворил этого. Такая возможность плагином дается, но пока она не активирована. Вот думаю, стоит или нет включать этот запрет.
February 11th, 2008 at 04:04:54
// php gravatar() ?>27В All-In-One был глюк неприятный – капитализация русских строк не работала, я починил
Теперь все заголовки переписываются корректно, и если в php есть mbsting – то и капитализация работает.
Пофиксеный плаг лежит вот тут: Лудим-Паяем, All-in-One SEO Pack Починяем!
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf