Понял, что надо написать статью “для самых маленьких”, а то видимо мои старые посты на форумах ушли глубоко в архивы, люди по асе задают совсем примитивные вопросы. Начнём с того что такое дор. Дорвей это страница или сайт, целью которой является индексация в поисковике с целью получения поискового трафика оттуда. При этом такие страницы можно [...]

Пара полезных инструментов для процессинга (в правильном направлении) текстов: 1. Open Text Summarizer - на входе подаётся длинный текст, например найденный в гугле пдф. На выходе имеем обрезанную копию, которая не совсем уникальна, но и не является копией 1 в 1. 2. Яндексовский mystem. Программа производит морфологический анализ слов на русском языке. Полезно для генерации стандартных [...]

Пришла в голову мысль, как легко и быстро восстановить усопший сайт из сохранённой копии на сервере веб-архива archive.org. Стандартный ответ на этот вопрос на всех форумах – “парсер напиши”. А на самом деле ведь всё уже написано. Например в Firefox’е есть такой плагин под названием ScrapBook. Он для этой цели вполне должен подойти. Там даже [...]

Нашёл новый (для меня) источник, откуда можно копи-тыбзить чужой контент. Все знают, что у жж есть страница с недавно опубликованными публичными постами, так вот, оказывается такая же штука есть у всего 6 апарта. Как пользоваться описано тут: http://updates.sixapart.com/. Более интесный способ добычи контента, это ковырять жж “с обратной стороны”, оказывается целая куча старого контента из [...]

Пока господин HKey обещает программу к концу года, я тоже не сижу сложа руки и свою тулзу уже написал. Результаты не то чтобы сильно хорошие, но от простого синонимайзера отличаются очень сильно в положительную сторону. Сам я хоть в Штатах жил 5 лет, но к иностранным языкам у меня с детства нелюбовь (как в принципе и [...]

Заинтересовался идеей, про которую рассказал kass.ws. Смысл такой, что пользуясь новой фичей гугла (hot trends), можно получить список горячих тем, тех которые недавно стали популярными. Из этого списка предлагается отобрать то по чему маленькая конкуренция, найти статью, переписать её, засабмитить в сплог и вылезти в топ по запросу. В общем когда я стал это делать [...]

« Previous Page« Previous Entries  Next Entries »Next Page »