|
|
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
defecatorнет, выше говорится про фнутренний формат PDF файла. А после парсинга там всё однозначно должно быть, вроде бы Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь. А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 17:04:43 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
ТС-у могу порекомендовать сравнивать битмапы, как результат рендера pdf-файлов. но боюсь и такую задачу он не осилит, в виду отсутствия готовых компонентов... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 19:34:05 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Как идея. Выгружать текст (текст вообще внутренним может быть со всякими тегами). Далее эти два текста дать на вход какой-либо утилиты с диффами, которые покажут разницу (на каких строках есть). Отобрать самые большие различия (опытным путем), найти их примерное местоположение и показывать это в своем приложении. Типа, где-то тут есть, сами ищите. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 20:31:09 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Dimonkadefecatorнет, выше говорится про фнутренний формат PDF файла. А после парсинга там всё однозначно должно быть, вроде бы Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь. А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать.. в конкретных компонентах наружу торчат не какие-то там инструкции, а вполне себе нормальный текст, графика и форматирование. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 20:33:07 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
defecator, Ответ support'а Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript. Gnostice Information Technologies ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 21:48:54 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
насколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 21:53:05 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompdefecator, Ответ support'а Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript. Gnostice Information Technologies я ни разу не говорил, что PDFtoolkit умеет что-то там сравнивать. Я говорил, что PDFtoolkit может качественно распарсить файл PDF и выдать наружу готовые объекты. А как ты их будешь сравнивать - твоё дело. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.06.2017, 09:08:58 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompнасколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а? а если PDF состоит из сканированных страниц ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.06.2017, 09:09:26 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Т.е. есть документ PDF что-то в нем меняется, например добавился/удалился абзац. С помощью модуля нужно сравнить и увидеть эти изменения. Я бы ограничился сравнением именно текста. Его вытаскивать через pdftotext. Если сканы то путь к OCR (бесплатные компоненты тоже есть), но это уже не так весело ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.06.2017, 10:19:10 |
|
||
|
|

start [/forum/topic.php?fid=58&msg=39475258&tid=2042118]: |
0ms |
get settings: |
9ms |
get forum list: |
17ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
86ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
64ms |
get tp. blocked users: |
2ms |
| others: | 228ms |
| total: | 427ms |

| 0 / 0 |
