« Curl и cookies | Проблемы с Directi/ResellerClub »
Год назад я писал, как сделать простой автоматический синонимайзер. За год вроде бы нормальных публичных решений не появилось, было несколько попыток, но за такие деньги, что среди широкой публики эти решения не разошлись. Под Рунет вообще по-моему нет ни одного автоматически работающего синонимайзера, максимум до чего дошёл прогресс это различные китайские подделки под синонимайзер – ручные рерайтеры.
Приватные решение тоже есть, причём иногда очень прилично выглядящие, текст получается почти читаемый. Вся загвоздка в этом “почти” – с этой оговоркой, сайты сделанные такими скриптами пригодны только под продажу ссылок, а для этой цели нагенерить страниц можно гораздо более простыми способами. Как-то даже мне блог спамили такимм – типа сайт однофамильцев, где надёрганы новости из Яндекса по определенной фамилии и вытянутые статьи немного переделаны для уникальности.
5 Responses
August 26th, 2008 at 13:53:04
// php gravatar() ?>1Да как синонимайзера так и переводчика толкового до сих пор никто так и не сделал что хренова для всех нас =\ а может у кого то и есть да не делится =\
August 30th, 2008 at 07:46:11
// php gravatar() ?>2Синономайзеры толковые есть, но все приватные.
В итоге текста получаются читаемые но всетаки машина лучше человека текст не обработает.
Anfi
Кто деньгями делиться будет
September 9th, 2008 at 10:38:57
// php gravatar() ?>3Сам пробовал написать синонимайзер на PHP, естественно лажанулся, ибо общаая база синонимов превращает текст в нечитаемую помойку, базу надо делить на направления, выделять абсолютные синонимы и тд и тп… Порой как представишь всё это, так проще сесть и ручками переделать нужный текст!
January 18th, 2010 at 08:16:19
// php gravatar() ?>4Задача состоит не в том, чтобы написать скрипт замены, а в составлении базы замен. В большинстве опробованных синонимайзеров это делается чисто механически, в результате получается либо трудночитаемый или неуникальный текст. Начнем с того, что обработке моожет подлежать текст, уже обработанный или отрерайченый. В результате получаем ахинею.
В принципе – алгоритм синонимизации можно представить себе таким образом. Предположим – имеем тематический текст на 200-300к знаков, это грубо 150 страниц. Собираем уникальный массив из слов, с указанием частоты вхождений этих слов в тексте. После этого только начинается составление базы замен. Это процесс сложный и кропотливый. Так никто не поступает, а в результате – фильтры и баны.
February 21st, 2011 at 11:01:50
// php gravatar() ?>5Выход один : писать тексты самому
RSS feed for comments on this post · TrackBack URI
Написать комментарий
Про что писал
Календарь
Куйворды
Архив
Подписка на блог
Статистика подписки
Страницы
Комментарии
Последние посты
Blogroll
Счётчики
Свежие записи
Последние комментарии
Интересное на блоге
Самое комментируемое
SEO блог где палят темы is proudly powered by WordPress - BloggingPro theme modified by alexf