Определение дуплицированных текстов

отметили
2
человека
в архиве
Обнаружил статью, про использование шинглов (shingles) для определения дуплицированного текста, вкупе с алгоритмом. Некоторое время покодил и реализовал данный в статье алгоритм. С данной реализацией предлагаю ознакомиться и вам.
Добавил mizhgan mizhgan 28 Ноября 2006
Комментарии участников:
Dimonuch
0
Dimonuch, 28 Ноября 2006 , url
вот за ссылку на статью спасибо. Пригодится!


Войдите или станьте участником, чтобы комментировать