« О популярных вещах | Сбор ПРа 2 »
Пришла на ум идея, как сделать рейтинг форумов, в чём-то аналогичный рейтингу блогов. Надо просканировать выдачу гугла и других поисковиков вот по такому запросу, вытянуть все сабдомены. На сабдоменах прочитать морду и какую-нибудь секретную специальную страницу, которая есть только у движка форума, чтобы подстраховаться от обдуривания. С морды распарсить циферки и положить в табличку. Можно сделать дёшево и сердито, чтобы не забивалось мусором, поставить какой-то разумный лимит, если меньше Х подписчиков, в таблицу не включать.
В буржунете аналогичная штука давно есть, называется: http://www.big-boards.com/ Сайт кстати довольно полезный, рекомендую поизучать, там даже есть русские форумы, но мало.
12 Responses
November 27th, 2007 at 19:30:19
// php gravatar() ?>1запрос надо отдельный под каждый движок? как потом “смешивать” различные движки?
по какому признаку ставить позиции, если например пост с сапы первый в выдаче, а морда форума сапы странице на 7ой. ?
неплохая идея
November 27th, 2007 at 20:41:27
// php gravatar() ?>2Не понял причём тут сапа?
November 27th, 2007 at 22:19:26
// php gravatar() ?>3Спасибо за big-boards.com, хороший рейтинг “живых” форумов
November 28th, 2007 at 01:31:15
// php gravatar() ?>4alexf, идея интересная. Жду реализации
November 28th, 2007 at 01:35:21
// php gravatar() ?>5alexf, по тому запросу, у меня на первом месте forum.sape.ru..
November 28th, 2007 at 02:11:09
// php gravatar() ?>6Ага, понял. Я ж написал – из выдачи парсим сабдомены, и считаем их инсталляциями форумов. Для каждого популярного движка нужен свой парсер, это да. Для рунета свой парсер понадобился ещё и для каждой версии перевода на русский. Но это не такая большая проблема.
November 28th, 2007 at 03:51:53
// php gravatar() ?>7Ну, допустим, на форуме, который я поддерживаю собственный перевод на русский язык, а приветственное сообщение вообще отсутствует.
Думаю для составления базы форумов разумней все же по признакам страниц их парсить. И потом форум может не только на сабдомене стоять, может и в корне домена
November 28th, 2007 at 16:21:47
// php gravatar() ?>8Можно сразу использовать запрос
“Активные участники” “Приветствуем нового пользователя” “Часовой пояс” “время”
и тырить данные прямо из сниппетов. В сниппете будет написано время индексации, его какнть пересчитываем в дневную статистику по средней по больце кривой посещаемости за день
И все
November 28th, 2007 at 16:52:43
// php gravatar() ?>9euhenio, Да, идея про сниппеты прикольная!
December 5th, 2007 at 19:03:22
// php gravatar() ?>10А как же быть с теми, кого поисковики не индексируют?
Где то я уже натыкался на рейтинг форумов…
December 6th, 2007 at 00:30:06
// php gravatar() ?>11Тех кого не индексируют – вручную добавлять, а как ещё?
September 25th, 2008 at 16:41:30
// php gravatar() ?>12Смысл рейтинга – обратная ссылка (счетчик) с участников рейтинга… если ее нету это просто списки
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf