powered by simpleCommunicator - 2.0.31     © 2024 Programmizd 02
Форумы / Visual Basic [игнор отключен] [закрыт для гостей] / Выдернуть из PDF-документа таблицу и импортировать
8 сообщений из 8, страница 1 из 1
Выдернуть из PDF-документа таблицу и импортировать
    #40088318
Игорь1973
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Приветствую!
Как лучше сделать такую задачу? Может как картинку распознать?
Есть ли какие-нибудь DLL для распознавания PDF-формата?
Или только платный API от Adobe? Наверное, по подписке сдают в аренду?
Спасибо.
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088321
dvim
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Игорь1973,

Есть pdf2text - вполне его и к Vb прикручивали в свое время.
У вас точно vb старый...
Восстановить таблицу из текста сложно - но иногда возможно.

Вообще рекомендуют tabula - если текста не хватит, но надо рыть туда
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088395
Игорь1973
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
dvim, спасибо за ответ.
Да,VB6 классика.

А что значит
авторВосстановить таблицу из текста
где текст? Текст это ж то что надо.

PDF-документ - обычная накладная приобретенные стройматериалы из Петровича.
То есть там таблица содержит Название, Количество, Цена, Сумма.
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088399
dvim
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Игорь1973,
Полно онлайн сервисов pdf2text - проверьте свой Pdf
если сможете по тексту восстановить таблицу - то вперед.

Если нет - tabula
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088401
Игорь1973
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
А, понял pdf2text выдает TXT файл с голым текстом.
Табличные данные вперемешку. Но попробовать написать алгоритм вполне можно.
Спасибо за наводку.
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088424
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Так Word умеет открывать pdf, и даже таблички там будут. Не в исходном виде, естественно, но я успешно писал парсер. Там проблема была только в том, что нужно было склеить разрывы страниц. Если разрыв страницы проходил через середину ячейки или даже через середину слова, то это оказывалось в разных ячейках разных таблиц. Но если дальнейшая задача извлечь данные, наплевав на форматирование, это вполне удобно, потому что будешь иметь дело вполне себе с объектами table/row/cell, а не с голым текстом
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088446
Игорь1973
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо дорогой Shocker.Pro
А начиная с какой версии Word стал это уметь?
...
Рейтинг: 0 / 0
Выдернуть из PDF-документа таблицу и импортировать
    #40088451
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Не помню, я для 2016 вроде делал
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / Visual Basic [игнор отключен] [закрыт для гостей] / Выдернуть из PDF-документа таблицу и импортировать
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]