Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Сравнение на схожесть текста и записи из БД
|
|||
|---|---|---|---|
|
#18+
Здравствуйте уважаемые пользователи форума. Возникла задача в реализации системы сравнения текстов на схожесть, иными словами на предмет плагиата. Реализация системы на php, хранение данных в БД MySQL. Принцип работы заключается в следующем, пользователь открывает страницу и в диалоге загрузки файла на сервер выбирает *.doc файл и загружает его на сервер. Система проводит операции над содержимым doc-файла (очистка от лишних символов, стоп-слов и прочее) записывает результат в базу и проверяет с уже существующими записями в базе на предмет их схожести. Результат сравнения выводится на той же странице. Может быть, так, что текст внутри doc файла может быть заимствован из нескольких источников, и записи о них могут храниться в базе. В записях также указывается и автор текста. Нужно чтобы результат имел вид - "Загруженный файл имеет схожесть с (перечисление записей в базе, которые имеют схожесть) авторами которых являются (перечисление авторов текстов в записях)". Возможно ли такое реализовать? Как реализовать такую идею? С чего начать? Хотелось бы выслушать ваше мнение, советы, или ссылки на что то полезное в этом направлении, реализации отдельных моментов, все, что может быть полезным. Спасибо заранее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.10.2013, 01:03 |
|
||
|
Сравнение на схожесть текста и записи из БД
|
|||
|---|---|---|---|
|
#18+
Искандар, почему именно doc файлы? уверяю вы с ними намучаетесь. плюс сама по себе задача довольно сложная. советую для начала почитать по теме. думаю есть какието готовые библиотеки или решения, по поиску плагиата в текстах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.10.2013, 05:41 |
|
||
|
Сравнение на схожесть текста и записи из БД
|
|||
|---|---|---|---|
|
#18+
r u, так как документооборот на этом формате более распространен, что можете посоветовать взамен ему? готовые библиотеки конечно же есть, некоторые решения можно использовать, но это не решает всей задачи. Перед написанием на форум гуглил тему неделю, кое какие наработки накопились, но хотелось бы услышать мнение масс. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.10.2013, 14:18 |
|
||
|
|

start [/forum/topic.php?fid=23&fpage=101&tid=1463363]: |
0ms |
get settings: |
8ms |
get forum list: |
15ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
28ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
31ms |
get tp. blocked users: |
1ms |
| others: | 220ms |
| total: | 317ms |

| 0 / 0 |
