Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / C++ [игнор отключен] [закрыт для гостей] / pdf и doc фаилы / 5 сообщений из 5, страница 1 из 1
23.01.2006, 16:20
    #33497806
dr_Nemo
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
pdf и doc фаилы
Мне нужно найти метод открывания pdf и doc фаилоф и считывания всей текстовой информации для поиска.

Помогите срочно нужно.
...
Рейтинг: 0 / 0
23.01.2006, 18:22
    #33498135
Gradient
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
pdf и doc фаилы
Про doc:
Есть COM-объекты Word.Application / Word.Document (и еще кучка), в сети много примеров.

Про pdf:
Был такой Дмитрий Скляров... Хе-хе. Не знаю. Но ведь как-то работает Foxit Reader... В любом случае, есть утилита PDF2HTM (название неточное, но сам подобной пользовался недавно), можно ее попробовать и парсить потом html. Тут, может, более сведущие посоветуют...
...
Рейтинг: 0 / 0
23.01.2006, 18:53
    #33498212
dr_Nemo
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
pdf и doc фаилы
Мне надо под Unix
...
Рейтинг: 0 / 0
23.01.2006, 18:58
    #33498224
White Owl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
pdf и doc фаилы
Самое надежное: Распечатать, отсканировать, распознать.

Для pdf можешь поискать GhostScript.
Для doc... вроде что-то было....
...
Рейтинг: 0 / 0
23.01.2006, 19:33
    #33498275
BlackStar
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
pdf и doc фаилы
Для MS Word (.doc) wv , а внем конкретно
wvText converts word documents into plain text
Для PDF man pdftotext из xpdf .
--
There Ain't No Such Thing As A Free Lunch
...
Рейтинг: 0 / 0
Форумы / C++ [игнор отключен] [закрыт для гостей] / pdf и doc фаилы / 5 сообщений из 5, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]