Пара полезных инструментов для процессинга (в правильном направлении) текстов: 1. Open Text Summarizer - на входе подаётся длинный текст, например найденный в гугле пдф. На выходе имеем обрезанную копию, которая не совсем уникальна, но и не является копией 1 в 1. 2. Яндексовский mystem. Программа производит морфологический анализ слов на русском языке. Полезно для генерации стандартных [...]