Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Сравнение на схожесть текста и записи из БД / 3 сообщений из 3, страница 1 из 1
15.10.2013, 01:03
    #38427451
Искандар
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Сравнение на схожесть текста и записи из БД
Здравствуйте уважаемые пользователи форума. Возникла задача в реализации системы сравнения текстов на схожесть, иными словами на предмет плагиата. Реализация системы на php, хранение данных в БД MySQL. Принцип работы заключается в следующем, пользователь открывает страницу и в диалоге загрузки файла на сервер выбирает *.doc файл и загружает его на сервер. Система проводит операции над содержимым doc-файла (очистка от лишних символов, стоп-слов и прочее) записывает результат в базу и проверяет с уже существующими записями в базе на предмет их схожести. Результат сравнения выводится на той же странице. Может быть, так, что текст внутри doc файла может быть заимствован из нескольких источников, и записи о них могут храниться в базе. В записях также указывается и автор текста. Нужно чтобы результат имел вид - "Загруженный файл имеет схожесть с (перечисление записей в базе, которые имеют схожесть) авторами которых являются (перечисление авторов текстов в записях)". Возможно ли такое реализовать? Как реализовать такую идею? С чего начать? Хотелось бы выслушать ваше мнение, советы, или ссылки на что то полезное в этом направлении, реализации отдельных моментов, все, что может быть полезным. Спасибо заранее.
...
Рейтинг: 0 / 0
15.10.2013, 05:41
    #38427491
r u
r u
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Сравнение на схожесть текста и записи из БД
Искандар,

почему именно doc файлы? уверяю вы с ними намучаетесь. плюс сама по себе задача довольно сложная.
советую для начала почитать по теме. думаю есть какието готовые библиотеки или решения, по поиску плагиата в текстах.
...
Рейтинг: 0 / 0
15.10.2013, 14:18
    #38428218
Искандар
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Сравнение на схожесть текста и записи из БД
r u, так как документооборот на этом формате более распространен, что можете посоветовать взамен ему? готовые библиотеки конечно же есть, некоторые решения можно использовать, но это не решает всей задачи. Перед написанием на форум гуглил тему неделю, кое какие наработки накопились, но хотелось бы услышать мнение масс.
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Сравнение на схожесть текста и записи из БД / 3 сообщений из 3, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]