Нашёл новый (для меня) источник, откуда можно копи-тыбзить чужой контент. Все знают, что у жж есть страница с недавно опубликованными публичными постами, так вот, оказывается такая же штука есть у всего 6 апарта. Как пользоваться описано тут: http://updates.sixapart.com/.
Более интесный способ добычи контента, это ковырять жж “с обратной стороны”, оказывается целая куча старого контента из журналов не проиндексирована. Непонятно с чем это связано, вроде бы в журналах все записи перелинкованы. Думаю что дело в переходе сервера жж на многосабдоменную схему работы, всё что было написано до перехода – медленно переиндексируется до сих пор. Алгоритм может быть примерно такой – берём жж с номером меньше 2х миллионов, по календарю выходим на самые старые посты, проверяем их наличие в гугле. Если их там нет, имеем уникальный контент. Проблему с правообладателем, то есть хозяином журнала можно решить 2мя способами: первый – переехать в Молдавию, где блюстители копирайта до вас не доберутся. :)  Второй – выбирать только заброшенные журналы, где автор написанного врядли будет следить за тем, что его старые посты где-то появились по новой.

Похожие посты