Гость
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Полиграфический анализ PDF / 8 сообщений из 8, страница 1 из 1
05.02.2017, 00:15
    #39398738
Shocker.Pro
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
Коллеги. Возникла задача написать некий анализатор.
На входе PDF-файл.
Необходимо его проанализировать с полиграфической точки зрения. Причем проверки самые разнообразные и включают в себя например:
- проверку количества страниц, формата и полей (в том числе обрезных полей, то есть если какое-то изображение идет на краю листа "под обрез", то оно должно выступать в достаточной мере за границу обреза)
- проверка встроенных картинок (начиная от разрешения и цветовой схемы и заканчивая попиксельным анализом на предмет непревышения некоторых ограничений)
- анализ встроенных шрифтов (а точнее их отсутствие - все должно быть переведено в кривые)
- отсутствие ICC-профиля

Так как анализировать сам PDF, ввиду закрытости формата, видимо, не очень целесообразно, сходу возникает такие идеи:
1. Распечатать PDF виртуальным принтером в растровый файл. Это позволит проанализировать то, что можно проанализировать попиксельно (поля, заполнение и т.п.)
2. Распечатать в какой-нить EPS-формат, в котором можно проанализировать встроенные растровые изображения на предмет формата, посмотреть наличие шрифтов не в кривых и т.п.


Прошу советов - в каком направлении еще можно подвигаться, какие библиотеки можно использовать, какие есть другие идеи, как это реализовать?
...
Рейтинг: 0 / 0
05.02.2017, 01:04
    #39398740
Siemargl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
судя по кол-ву просмотрщиков, pdf не такой уж и закрытый
...
Рейтинг: 0 / 0
05.02.2017, 10:06
    #39398770
Siemargl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
вот просмотрщик в исходниках http://mupdf.com
...
Рейтинг: 0 / 0
05.02.2017, 10:21
    #39398773
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
Shocker.ProТак как анализировать сам PDF, ввиду закрытости формата, видимо, не очень целесообразно
формат открытый - http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/pdf_reference_1-7.pdf

pdf - это сжатый постскрипт, грубо говоря, шрифты и изображения - просто ресурсы.
преобразовывать в EPS - никакого смысла, можно лишь потерять часть метаданных.
(или майкрософтный XPS имелся ввиду?)

есть немалое количество библиотек с самыми разными лицензиями.

начать можно с iTextSharp ( https://sourceforge.net/projects/itextsharp/ )
...
Рейтинг: 0 / 0
05.02.2017, 10:51
    #39398786
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
Shocker.Pro,

и важно не перестараться - подобные продукты на рынке живут давно - https://www.enfocus.com/en/products/pitstop-pro - например
...
Рейтинг: 0 / 0
05.02.2017, 11:56
    #39398800
Shocker.Pro
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
Изопропилили майкрософтный XPS имелся ввиду?нет, я имел ввиду постскрипт, ок, спасибо за инфу
Изопропилподобные продукты на рынке живут давноЯ положился на слова заказчика, что подобные продукты сильно навороченные и дорогие, а ему нужен небольшой функционал с пакетной обработкой. Отослал ему ссылку.
...
Рейтинг: 0 / 0
05.02.2017, 12:14
    #39398807
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
Shocker.Proчто подобные продукты сильно навороченные и дорогие
и это правда. http://www.globalvisioninc.com/esko/ например
...
Рейтинг: 0 / 0
06.02.2017, 20:23
    #39399635
Т-Миронов
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Полиграфический анализ PDF
Shocker.ProИзопропилили майкрософтный XPS имелся ввиду?нет, я имел ввиду постскрипт, ок, спасибо за инфу
Изопропилподобные продукты на рынке живут давноЯ положился на слова заказчика, что подобные продукты сильно навороченные и дорогие, а ему нужен небольшой функционал с пакетной обработкой. Отослал ему ссылку.

Мне интересно сколько будет стоить написать такой анализатор?
...
Рейтинг: 0 / 0
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Полиграфический анализ PDF / 8 сообщений из 8, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]