|
|
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
нужны компоненты для сравнения 2-х PDF, желательно freeware, есть какие-то варианты? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 09:45:40 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Что сравнивать собираешься? Если один в рисунках, другой в тексте, но визуально (для человека) они одинаковые? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 09:53:55 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
wadman, нее, разные версии одного и того же файла wadmanодин в рисунках, другой в тексте такого не должно быть ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 10:22:39 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompтакого не должно быть Тогда достаточно сравнивать как текстовый файл. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 10:27:29 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
wadmannikompтакого не должно быть Тогда достаточно сравнивать как текстовый файл. так текст из PDF ишшо вытянуть надо ;-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 10:29:26 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
а что если ТС нужно не просто текст сравнивать, а ещё, например, чтобы фонт написания буковок не поменялся или ещё какие параметры оформления ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 10:30:43 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikomp, Цель сравнения какая? Достаточно ли сравнить контрольную сумму этих файлов? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 11:47:15 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompнужны компоненты для сравнения 2-х PDF, желательно freeware, есть какие-то варианты? можно экспортировать оба PDFа в серию PNG-картинок одинакового разрешения (Ghostscript'ом, например) и сравнивать их между собой ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 12:13:59 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Гугл по сочетанию "pdf diff" выдает немало, в частности . ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 12:39:10 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Нужно реализовать в приложении возможность, которая позволяла бы сотрудникам небольшой проектной организации сравнивать версии PDF документов, которые были созданы в результате процедуры изменения. Т.е. есть документ PDF что-то в нем меняется, например добавился/удалился абзац. С помощью модуля нужно сравнить и увидеть эти изменения. Сторонние приложения видел, есть такая функция и в Adobe Reader Pro, но вот беда, он платный, вряд ли он будет установлен у клиента. Есть еще вариант, установить стороннюю программу и иcпользовать ее ActiveX, но я не знаю какую прогу ставить (кроме, конечно, платной Adobe Reader Pro). может подскажите? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 12:58:14 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Кроик Семён, не представляю, каким должен быть алгоритм сравнения картинок, каждую с каждой что-ли? и какие различия я смогу найти сравнивая таким образом картинки? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 13:01:29 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
храни все версии. кому надо, пусть сравнивают глазками. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 13:17:57 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompсравнивать версии PDF документов, которые были созданы в результате процедуры изменения. А создаются они как? Может diff создавать на этапе создания PDF. Ну или сравнивать оригинальные документы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 13:38:56 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompКроик Семён, не представляю, каким должен быть алгоритм сравнения картинок, каждую с каждой что-ли? и какие различия я смогу найти сравнивая таким образом картинки? согласен, метод тупой. не продумал до конца. А по твоему изначальному запросу: подобные программы существуют: open-source - плагин для WinMerge xdocdiff WinMerge Plugin (а вот его исходник на VB6) DiffPDF , платная Diff PDF с github'а. Название то же, но бесплатная плюс другие ссылки отсюда пример поиска в google ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 16:50:00 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
А просто fc не поможет? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 17:13:59 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
GatorА просто fc не поможет?Там zlib потоки ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 17:47:16 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Hello, _vasilisk_! You wrote on 1 июня 2015 г. 17:55:14: _vasilisk_> Там zlib потоки могут быть. но не обязаны. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 17:54:40 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Мимопроходящийно не обязаны. Будем надеяться на везение. Я когда-то писал PDF парсер. Это полный трындец. Одну и ту же вещь, согласно спецификации, можно сделать разными способами. Вот сколько разных источников PDF, столько у меня было вариантов текста ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 18:02:31 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
_Vasilisk_столько у меня было вариантов текстаДа. Но меня Бог миловал. Я только страницы считал. В потоке. Иногда - весь файл читать приходилось, а иногда только первую сотню байт - там было "Linearize" - сигнал-сигнатура для меня. И рядом - число страниц. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.06.2015, 18:25:11 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Вынужден вновь поднять данную тему. Проблема таже, нужно сравнить 2 pdf файла ну и визуализировать различия. Интересны именно компоненты для Delphi, а не приложения, в которых это уже реализовано ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 13:35:15 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompВынужден вновь поднять данную тему. Проблема таже, нужно сравнить 2 pdf файла ну и визуализировать различия. Интересны именно компоненты для Delphi, а не приложения, в которых это уже реализовано Легко ! Заносишь 500 баксов сюда: https://www.gnostice.com/PDFtoolkit_VCL.asp и твоя проблема решена ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 13:42:44 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
defecatorЛегко ! Заносишь 500 баксов сюда: https://www.gnostice.com/PDFtoolkit_VCL.asp и твоя проблема решена Если бы решена. :-) Потом решаешь следующую проблему - что со всеми этими pdf-потрохами делать? Что там сравнивать?? :D ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 16:20:25 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
DimonkadefecatorЛегко ! Заносишь 500 баксов сюда: https://www.gnostice.com/PDFtoolkit_VCL.asp и твоя проблема решена Если бы решена. :-) Потом решаешь следующую проблему - что со всеми этими pdf-потрохами делать? Что там сравнивать?? :D там наружу будет торчать структура документа. Её и сравниваешь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 16:26:05 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
defecatorтам наружу будет торчать структура документа. Её и сравниваешь. Ну так выше уже умпоминали, что структура может совершенно быть разной, а содержимое одним и тем же. Ну т.е. реально потребуется ИИ, чтобы отличить изменения формы хранения содержимого от изменения самого содержимого. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 16:34:14 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Dimonkadefecatorтам наружу будет торчать структура документа. Её и сравниваешь. Ну так выше уже умпоминали, что структура может совершенно быть разной, а содержимое одним и тем же. Ну т.е. реально потребуется ИИ, чтобы отличить изменения формы хранения содержимого от изменения самого содержимого. нет, выше говорится про фнутренний формат PDF файла. А после парсинга там всё однозначно должно быть, вроде бы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 16:36:50 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
defecatorнет, выше говорится про фнутренний формат PDF файла. А после парсинга там всё однозначно должно быть, вроде бы Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь. А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 17:04:43 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
ТС-у могу порекомендовать сравнивать битмапы, как результат рендера pdf-файлов. но боюсь и такую задачу он не осилит, в виду отсутствия готовых компонентов... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 19:34:05 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Как идея. Выгружать текст (текст вообще внутренним может быть со всякими тегами). Далее эти два текста дать на вход какой-либо утилиты с диффами, которые покажут разницу (на каких строках есть). Отобрать самые большие различия (опытным путем), найти их примерное местоположение и показывать это в своем приложении. Типа, где-то тут есть, сами ищите. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 20:31:09 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Dimonkadefecatorнет, выше говорится про фнутренний формат PDF файла. А после парсинга там всё однозначно должно быть, вроде бы Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь. А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать.. в конкретных компонентах наружу торчат не какие-то там инструкции, а вполне себе нормальный текст, графика и форматирование. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 20:33:07 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
defecator, Ответ support'а Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript. Gnostice Information Technologies ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 21:48:54 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
насколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.06.2017, 21:53:05 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompdefecator, Ответ support'а Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript. Gnostice Information Technologies я ни разу не говорил, что PDFtoolkit умеет что-то там сравнивать. Я говорил, что PDFtoolkit может качественно распарсить файл PDF и выдать наружу готовые объекты. А как ты их будешь сравнивать - твоё дело. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.06.2017, 09:08:58 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
nikompнасколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а? а если PDF состоит из сканированных страниц ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.06.2017, 09:09:26 |
|
||
|
сравнение PDF
|
|||
|---|---|---|---|
|
#18+
Т.е. есть документ PDF что-то в нем меняется, например добавился/удалился абзац. С помощью модуля нужно сравнить и увидеть эти изменения. Я бы ограничился сравнением именно текста. Его вытаскивать через pdftotext. Если сканы то путь к OCR (бесплатные компоненты тоже есть), но это уже не так весело ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.06.2017, 10:19:10 |
|
||
|
|

start [/forum/topic.php?all=1&fid=58&tid=2042118]: |
0ms |
get settings: |
8ms |
get forum list: |
21ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
57ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
76ms |
get tp. blocked users: |
2ms |
| others: | 221ms |
| total: | 409ms |

| 0 / 0 |
