Гость
Map
Форумы / Visual Basic [игнор отключен] [закрыт для гостей] / Выдернуть из PDF-документа таблицу и импортировать / 8 сообщений из 8, страница 1 из 1
03.08.2021, 17:47
    #40088318
Игорь1973
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
Приветствую!
Как лучше сделать такую задачу? Может как картинку распознать?
Есть ли какие-нибудь DLL для распознавания PDF-формата?
Или только платный API от Adobe? Наверное, по подписке сдают в аренду?
Спасибо.
...
Рейтинг: 0 / 0
03.08.2021, 18:05
    #40088321
dvim
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
Игорь1973,

Есть pdf2text - вполне его и к Vb прикручивали в свое время.
У вас точно vb старый...
Восстановить таблицу из текста сложно - но иногда возможно.

Вообще рекомендуют tabula - если текста не хватит, но надо рыть туда
...
Рейтинг: 0 / 0
03.08.2021, 21:02
    #40088395
Игорь1973
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
dvim, спасибо за ответ.
Да,VB6 классика.

А что значит
авторВосстановить таблицу из текста
где текст? Текст это ж то что надо.

PDF-документ - обычная накладная приобретенные стройматериалы из Петровича.
То есть там таблица содержит Название, Количество, Цена, Сумма.
...
Рейтинг: 0 / 0
03.08.2021, 21:10
    #40088399
dvim
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
Игорь1973,
Полно онлайн сервисов pdf2text - проверьте свой Pdf
если сможете по тексту восстановить таблицу - то вперед.

Если нет - tabula
...
Рейтинг: 0 / 0
03.08.2021, 21:19
    #40088401
Игорь1973
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
А, понял pdf2text выдает TXT файл с голым текстом.
Табличные данные вперемешку. Но попробовать написать алгоритм вполне можно.
Спасибо за наводку.
...
Рейтинг: 0 / 0
03.08.2021, 22:08
    #40088424
Shocker.Pro
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
Так Word умеет открывать pdf, и даже таблички там будут. Не в исходном виде, естественно, но я успешно писал парсер. Там проблема была только в том, что нужно было склеить разрывы страниц. Если разрыв страницы проходил через середину ячейки или даже через середину слова, то это оказывалось в разных ячейках разных таблиц. Но если дальнейшая задача извлечь данные, наплевав на форматирование, это вполне удобно, потому что будешь иметь дело вполне себе с объектами table/row/cell, а не с голым текстом
...
Рейтинг: 0 / 0
03.08.2021, 23:51
    #40088446
Игорь1973
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
Спасибо дорогой Shocker.Pro
А начиная с какой версии Word стал это уметь?
...
Рейтинг: 0 / 0
04.08.2021, 00:04
    #40088451
Shocker.Pro
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выдернуть из PDF-документа таблицу и импортировать
Не помню, я для 2016 вроде делал
...
Рейтинг: 0 / 0
Форумы / Visual Basic [игнор отключен] [закрыт для гостей] / Выдернуть из PDF-документа таблицу и импортировать / 8 сообщений из 8, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]