powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Delphi [игнор отключен] [закрыт для гостей] / сравнение PDF
10 сообщений из 35, страница 2 из 2
сравнение PDF
    #39474957
Фотография Dimonka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
defecatorнет, выше говорится про фнутренний формат PDF файла.
А после парсинга там всё однозначно должно быть, вроде бы
Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь.
А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать..
...
Рейтинг: 0 / 0
сравнение PDF
    #39475041
ТС-у могу порекомендовать сравнивать битмапы, как результат рендера pdf-файлов.
но боюсь и такую задачу он не осилит, в виду отсутствия готовых компонентов...
...
Рейтинг: 0 / 0
сравнение PDF
    #39475067
Фотография JayDi
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как идея. Выгружать текст (текст вообще внутренним может быть со всякими тегами). Далее эти два текста дать на вход какой-либо утилиты с диффами, которые покажут разницу (на каких строках есть). Отобрать самые большие различия (опытным путем), найти их примерное местоположение и показывать это в своем приложении. Типа, где-то тут есть, сами ищите.
...
Рейтинг: 0 / 0
сравнение PDF
    #39475068
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Dimonkadefecatorнет, выше говорится про фнутренний формат PDF файла.
А после парсинга там всё однозначно должно быть, вроде бы
Там однозначно будет набор инструкций по рисованию страниц документа. С этим не поспоришь.
А вот дальше что с этими инструкциями делать - это уже интересно. Потому что последовательность интрукций может быть разная, а рисовать будет одно и то же. А может быть и не одно и то же. А может быть даже и не рисовать..

в конкретных компонентах наружу торчат не какие-то там инструкции, а вполне себе нормальный текст, графика и форматирование.
...
Рейтинг: 0 / 0
сравнение PDF
    #39475097
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
defecator,

Ответ support'а

Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript.

Gnostice Information Technologies
...
Рейтинг: 0 / 0
сравнение PDF
    #39475098
nikomp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
насколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а?
...
Рейтинг: 0 / 0
сравнение PDF
    #39475201
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
nikompdefecator,

Ответ support'а

Currently PDFtoolkit do not support comparing files.Using PDFtoolkit you can edit, enhance, secure, merge, split, view, digitally sign, and print PDF documents and process PDF forms. PDFtoolkit can extract text, export to images, and also add digital signatures. PDFtoolkit does not require PDF software such as Adobe PDF library, Adobe Acrobat Professional, Adobe PDF Reader or GhostScript.

Gnostice Information Technologies

я ни разу не говорил, что PDFtoolkit умеет что-то там сравнивать.
Я говорил, что PDFtoolkit может качественно распарсить файл PDF и выдать наружу готовые объекты.

А как ты их будешь сравнивать - твоё дело.
...
Рейтинг: 0 / 0
сравнение PDF
    #39475202
Фотография defecator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
nikompнасколько состоятельна идея, например, пересохранить pdf в формат doc и сравнивать уже средствами word'а?

а если PDF состоит из сканированных страниц ?
...
Рейтинг: 0 / 0
сравнение PDF
    #39475258
dvim
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Т.е. есть документ PDF что-то в нем меняется, например добавился/удалился абзац. С помощью модуля нужно сравнить и увидеть эти изменения.

Я бы ограничился сравнением именно текста.
Его вытаскивать через pdftotext.

Если сканы то путь к OCR (бесплатные компоненты тоже есть), но это уже не так весело
...
Рейтинг: 0 / 0
сравнение PDF
    #39475290
Фотография Dimonka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Кстати DevEx сделал просматривалку PDF в последнем апдейте, в которой по идее тоже есть доступ к структуре.
Основной вопрос что с этим делать? Если сравнивать только текст, то pdftotext самый реальный вариант.
...
Рейтинг: 0 / 0
10 сообщений из 35, страница 2 из 2
Форумы / Delphi [игнор отключен] [закрыт для гостей] / сравнение PDF
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]