powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Delphi [игнор отключен] [закрыт для гостей] / сравнение PDF
35 сообщений из 35, показаны все 2 страниц
сравнение PDF
    #38972954
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
нужны компоненты для сравнения 2-х PDF, желательно freeware, есть какие-то варианты?
...
Рейтинг: 0 / 0
сравнение PDF
    #38972959
Фотография wadman
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Что сравнивать собираешься?
Если один в рисунках, другой в тексте, но визуально (для человека) они одинаковые?
...
Рейтинг: 0 / 0
сравнение PDF
    #38972983
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
wadman,

нее, разные версии одного и того же файла
wadmanодин в рисунках, другой в тексте

такого не должно быть
...
Рейтинг: 0 / 0
сравнение PDF
    #38972994
Фотография wadman
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nikompтакого не должно быть
Тогда достаточно сравнивать как текстовый файл.
...
Рейтинг: 0 / 0
сравнение PDF
    #38972999
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
wadmannikompтакого не должно быть
Тогда достаточно сравнивать как текстовый файл.

так текст из PDF ишшо вытянуть надо ;-)
...
Рейтинг: 0 / 0
сравнение PDF
    #38973001
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
а что если ТС нужно не просто текст сравнивать, а ещё, например, чтобы фонт написания буковок не поменялся или ещё какие параметры оформления ?
...
Рейтинг: 0 / 0
сравнение PDF
    #38973090
goldmi45
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nikomp,

Цель сравнения какая? Достаточно ли сравнить контрольную сумму этих файлов?
...
Рейтинг: 0 / 0
сравнение PDF
    #38973121
Фотография Кроик Семён
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nikompнужны компоненты для сравнения 2-х PDF, желательно freeware, есть какие-то варианты?

можно экспортировать оба PDFа в серию PNG-картинок одинакового разрешения (Ghostscript'ом, например) и сравнивать их между собой
...
Рейтинг: 0 / 0
сравнение PDF
    #38973157
Гхостик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Гугл по сочетанию "pdf diff" выдает немало, в частности .
...
Рейтинг: 0 / 0
сравнение PDF
    #38973189
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нужно реализовать в приложении возможность, которая позволяла бы сотрудникам небольшой проектной организации сравнивать версии PDF документов, которые были созданы в результате процедуры изменения. Т.е. есть документ PDF что-то в нем меняется, например добавился/удалился абзац. С помощью модуля нужно сравнить и увидеть эти изменения.

Сторонние приложения видел, есть такая функция и в Adobe Reader Pro, но вот беда, он платный, вряд ли он будет установлен у клиента.

Есть еще вариант, установить стороннюю программу и иcпользовать ее ActiveX, но я не знаю какую прогу ставить (кроме, конечно, платной Adobe Reader Pro). может подскажите?
...
Рейтинг: 0 / 0
сравнение PDF
    #38973192
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Кроик Семён,

не представляю, каким должен быть алгоритм сравнения картинок, каждую с каждой что-ли? и какие различия я смогу найти сравнивая таким образом картинки?
...
Рейтинг: 0 / 0
сравнение PDF
    #38973224
Мимопроходящий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
храни все версии.
кому надо, пусть сравнивают глазками.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
сравнение PDF
    #38973247
angel_zar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nikompсравнивать версии PDF документов, которые были созданы в результате процедуры изменения.
А создаются они как? Может diff создавать на этапе создания PDF. Ну или сравнивать оригинальные документы.
...
Рейтинг: 0 / 0
сравнение PDF
    #38973529
Фотография Кроик Семён
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nikompКроик Семён,

не представляю, каким должен быть алгоритм сравнения картинок, каждую с каждой что-ли? и какие различия я смогу найти сравнивая таким образом картинки?

согласен, метод тупой. не продумал до конца.

А по твоему изначальному запросу: подобные программы существуют:
open-source - плагин для WinMerge xdocdiff WinMerge Pluginвот его исходник на VB6)

DiffPDF , платная

Diff PDF с github'а. Название то же, но бесплатная

плюс другие ссылки отсюда

пример поиска в google
...
Рейтинг: 0 / 0
сравнение PDF
    #38973578
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А просто fc не поможет?
...
Рейтинг: 0 / 0
сравнение PDF
    #38973638
Фотография _Vasilisk_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GatorА просто fc не поможет?Там zlib потоки
...
Рейтинг: 0 / 0
сравнение PDF
    #38973645
Мимопроходящий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Hello, _vasilisk_!
You wrote on 1 июня 2015 г. 17:55:14:

_vasilisk_> Там zlib потоки
могут быть.
но не обязаны.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
сравнение PDF
    #38973655
Фотография _Vasilisk_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Мимопроходящийно не обязаны.

Будем надеяться на везение.

Я когда-то писал PDF парсер. Это полный трындец. Одну и ту же вещь, согласно спецификации, можно сделать разными способами. Вот сколько разных источников PDF, столько у меня было вариантов текста
...
Рейтинг: 0 / 0
сравнение PDF
    #38973686
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
_Vasilisk_столько у меня было вариантов текстаДа.
Но меня Бог миловал. Я только страницы считал. В потоке.
Иногда - весь файл читать приходилось, а иногда только первую сотню байт - там было "Linearize" - сигнал-сигнатура для меня.
И рядом - число страниц.
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
сравнение PDF
    #39474735
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вынужден вновь поднять данную тему.
Проблема таже, нужно сравнить 2 pdf файла ну и визуализировать различия. Интересны именно компоненты для Delphi, а не приложения, в которых это уже реализовано
...
Рейтинг: 0 / 0
сравнение PDF
    #39474739
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
nikompВынужден вновь поднять данную тему.
Проблема таже, нужно сравнить 2 pdf файла ну и визуализировать различия. Интересны именно компоненты для Delphi, а не приложения, в которых это уже реализовано

Легко !
Заносишь 500 баксов сюда:
https://www.gnostice.com/PDFtoolkit_VCL.asp

и твоя проблема решена
...
Рейтинг: 0 / 0
сравнение PDF
    #39474906
Фотография Dimonka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
defecatorЛегко !
Заносишь 500 баксов сюда:
https://www.gnostice.com/PDFtoolkit_VCL.asp

и твоя проблема решена

Если бы решена. :-) Потом решаешь следующую проблему - что со всеми этими pdf-потрохами делать? Что там сравнивать?? :D
...
Рейтинг: 0 / 0
сравнение PDF
    #39474912
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
DimonkadefecatorЛегко !
Заносишь 500 баксов сюда:
https://www.gnostice.com/PDFtoolkit_VCL.asp

и твоя проблема решена

Если бы решена. :-) Потом решаешь следующую проблему - что со всеми этими pdf-потрохами делать? Что там сравнивать?? :D

там наружу будет торчать структура документа.
Её и сравниваешь.
...
Рейтинг: 0 / 0
сравнение PDF
    #39474929
Фотография Dimonka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
defecatorтам наружу будет торчать структура документа.
Её и сравниваешь.
Ну так выше уже умпоминали, что структура может совершенно быть разной, а содержимое одним и тем же. Ну т.е. реально потребуется ИИ, чтобы отличить изменения формы хранения содержимого от изменения самого содержимого.
...
Рейтинг: 0 / 0
сравнение PDF
    #39474935
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Dimonkadefecatorтам наружу будет торчать структура документа.
Её и сравниваешь.
Ну так выше уже умпоминали, что структура может совершенно быть разной, а содержимое одним и тем же. Ну т.е. реально потребуется ИИ, чтобы отличить изменения формы хранения содержимого от изменения самого содержимого.

нет, выше говорится про фнутренний формат PDF файла.
А после парсинга там всё однозначно должно быть, вроде бы
...
Рейтинг: 0 / 0
сравнение PDF
    #39474957
Фотография Dimonka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
defecatorнет, выше говорится про фнутренний формат PDF файла.
А после парсинга там всё однозначно должно быть, вроде бы
Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь.
А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать..
...
Рейтинг: 0 / 0
сравнение PDF
    #39475041
ТС-у могу порекомендовать сравнивать битмапы, как результат рендера pdf-файлов.
но боюсь и такую задачу он не осилит, в виду отсутствия готовых компонентов...
...
Рейтинг: 0 / 0
сравнение PDF
    #39475067
Фотография JayDi
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как идея. Выгружать текст (текст вообще внутренним может быть со всякими тегами). Далее эти два текста дать на вход какой-либо утилиты с диффами, которые покажут разницу (на каких строках есть). Отобрать самые большие различия (опытным путем), найти их примерное местоположение и показывать это в своем приложении. Типа, где-то тут есть, сами ищите.
...
Рейтинг: 0 / 0
сравнение PDF
    #39475068
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Dimonkadefecatorнет, выше говорится про фнутренний формат PDF файла.
А после парсинга там всё однозначно должно быть, вроде бы
Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь.
А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать..

в конкретных компонентах наружу торчат не какие-то там инструкции, а вполне себе нормальный текст, графика и форматирование.
...
Рейтинг: 0 / 0
сравнение PDF
    #39475097
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
defecator,

Ответ support'а

Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript.

Gnostice Information Technologies
...
Рейтинг: 0 / 0
сравнение PDF
    #39475098
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
насколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а?
...
Рейтинг: 0 / 0
сравнение PDF
    #39475201
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
nikompdefecator,

Ответ support'а

Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript.

Gnostice Information Technologies

я ни разу не говорил, что PDFtoolkit умеет что-то там сравнивать.
Я говорил, что PDFtoolkit может качественно распарсить файл PDF и выдать наружу готовые объекты.

А как ты их будешь сравнивать - твоё дело.
...
Рейтинг: 0 / 0
сравнение PDF
    #39475202
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
nikompнасколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а?

а если PDF состоит из сканированных страниц ?
...
Рейтинг: 0 / 0
сравнение PDF
    #39475258
dvim
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Т.е. есть документ PDF что-то в нем меняется, например добавился/удалился абзац. С помощью модуля нужно сравнить и увидеть эти изменения.

Я бы ограничился сравнением именно текста.
Его вытаскивать через pdftotext.

Если сканы то путь к OCR (бесплатные компоненты тоже есть), но это уже не так весело
...
Рейтинг: 0 / 0
сравнение PDF
    #39475290
Фотография Dimonka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Кстати DevEx сделал просматривалку PDF в последнем апдейте, в которой по идее тоже есть доступ к структуре.
Основной вопрос что с этим делать? Если сравнивать только текст, то pdftotext самый реальный вариант.
...
Рейтинг: 0 / 0
35 сообщений из 35, показаны все 2 страниц
Форумы / Delphi [игнор отключен] [закрыт для гостей] / сравнение PDF
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]