powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / pdf и doc фаилы
5 сообщений из 5, страница 1 из 1
pdf и doc фаилы
    #33497806
dr_Nemo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Мне нужно найти метод открывания pdf и doc фаилоф и считывания всей текстовой информации для поиска.

Помогите срочно нужно.
...
Рейтинг: 0 / 0
pdf и doc фаилы
    #33498135
Gradient
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Про doc:
Есть COM-объекты Word.Application / Word.Document (и еще кучка), в сети много примеров.

Про pdf:
Был такой Дмитрий Скляров... Хе-хе. Не знаю. Но ведь как-то работает Foxit Reader... В любом случае, есть утилита PDF2HTM (название неточное, но сам подобной пользовался недавно), можно ее попробовать и парсить потом html. Тут, может, более сведущие посоветуют...
...
Рейтинг: 0 / 0
pdf и doc фаилы
    #33498212
dr_Nemo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Мне надо под Unix
...
Рейтинг: 0 / 0
pdf и doc фаилы
    #33498224
White Owl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Самое надежное: Распечатать, отсканировать, распознать.

Для pdf можешь поискать GhostScript.
Для doc... вроде что-то было....
...
Рейтинг: 0 / 0
pdf и doc фаилы
    #33498275
BlackStar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Для MS Word (.doc) wv , а внем конкретно
wvText converts word documents into plain text
Для PDF man pdftotext из xpdf .
--
There Ain't No Such Thing As A Free Lunch
...
Рейтинг: 0 / 0
5 сообщений из 5, страница 1 из 1
Форумы / C++ [игнор отключен] [закрыт для гостей] / pdf и doc фаилы
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]