powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / как осуществить поиск по pdf файлу
14 сообщений из 14, страница 1 из 1
как осуществить поиск по pdf файлу
    #34617491
random13
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
собственно сабж

возможно ли это средствами php если нет, то подскажите как возможно
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34617642
amge
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Извлечь текст и искать нем. Извлечь текст можно, например, с помощью pdftotext из состава Xpdf . Наверное, и для PHP что-то есть.
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34618873
RUSYA
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
на php.net были какие-то фции для pdf, но я сам не пользовался...
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34618901
Фотография Roman V Tchemisov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
RUSYAна php.net были какие-то фции для pdf, но я сам не пользовался...
Там скорее всего только создание и получение мета-информации.
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34619762
random13
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
вот в том то и дело что я хочу собрать определенную базу pdf, которая и будет индексировать и осуществлять поиск по pdf, возможно на ее основе генерить новые пдфники, но это уже далее и это мне ясно как делать...
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34620127
sergkarpenko
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34620338
amge
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
random13вот в том то и дело что я хочу собрать определенную базу pdf, которая и будет индексировать и осуществлять поиск по pdf...У меня была аналогичная задача - индексирование и поиск по базе pdf-ок сложной структуры (статьи из научных журналов). Воспользовался ht://Dig . Там как раз pdftotext используется. Потом попробовал еще несколько программок для извлечения текста из pdf-ок (перловские модули есть, на яве что-то) - pdftotext все же наиболее вменяемым показался. Если что, он и под Windows есть.
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34621684
Фотография Roman V Tchemisov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
С pdftotext одна проблема -- он иногда странно себя ведёт с кодировками. У меня был случай, когда он переводил в текст примерно половину документа (в KOI8-U).
=======================
Роман Чемисов
Тел.: +79149052257
ICQ: 157070721
Skype: gangabass
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34624062
random13
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
объясните хоть что это, библиотека такая или что, как хоть примерно этим пользоваться
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34624986
Фотография Roman V Tchemisov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Это небольшая утилита. Она входит в состав xpdf .
=======================
Роман Чемисов
Тел.: +79149052257
ICQ: 157070721
Skype: gangabass
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34625374
random13
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
а что бы с ней работать что нужно сделать, на сервер чтоли залить или что
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34625580
Фотография Robert Tappan Moris
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
pdftotext - исполняемый файл, которые необходимо загрузить на сервер, при работе сценария должен происходить её вызов с нужными параметарми (типа system('pdftotext <параметры>'); ).
-------------------
В жизни невозможно появление чего-то невозможного...
...
Рейтинг: 0 / 0
как осуществить поиск по pdf файлу
    #34625648
amge
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Если *nix сервер, то, может быть, pdftotext на нем уже есть: Xpdf распространенный пакет.

Вызов pdftotext file.pdf создаст file.txt, который можно парсить. Вызов pdftotext file.pdf - направит текст на stdout (напечатает в консоль), его можно перехватить скриптом и обойтись без создания дополнительного файла. Можно поробовать опции -raw и -layout, они влияют на вид текста. pdftotext -h печатает подсказку.
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
как осуществить поиск по pdf файлу
    #37792133
3544
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Недавно опробовал офигенно вкусную возможность переходить из базы данных по гиперссылкам не только на html-страницы, но и к помеченному фрагменту документа MS Word. Точно так же можно переходить не только между записями в БД, но и к записи в другой базе (имя формы тоже задаётся в «гиперссылке»).
В общем, на основе систем управления базами данных можно строить сложные оглавления, одно – сразу для нескольких документов.

В связи с чем возник закономерный вопрос: а можно ли такой переход из базы сделать в pdf-документ?

Понятно, что эта задача как-то связана с поиском в pdf-нике.
Я вообще не пытался в Интернете что-то откопать по этой теме. Просто сейчас случайно наткнулся здесь на похожие вопросы, и решил испытать удачу найти всё сразу, и без лишних усилий. Вдруг кому-то нечем заняться?

В любом случае, этот пост прочтёте с интересом.
...
Рейтинг: 0 / 0
14 сообщений из 14, страница 1 из 1
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / как осуществить поиск по pdf файлу
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]