|
|
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
собственно сабж возможно ли это средствами php если нет, то подскажите как возможно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.06.2007, 14:33:29 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
Извлечь текст и искать нем. Извлечь текст можно, например, с помощью pdftotext из состава Xpdf . Наверное, и для PHP что-то есть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.06.2007, 15:07:31 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
на php.net были какие-то фции для pdf, но я сам не пользовался... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2007, 01:34:47 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
RUSYAна php.net были какие-то фции для pdf, но я сам не пользовался... Там скорее всего только создание и получение мета-информации. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2007, 04:35:39 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
вот в том то и дело что я хочу собрать определенную базу pdf, которая и будет индексировать и осуществлять поиск по pdf, возможно на ее основе генерить новые пдфники, но это уже далее и это мне ясно как делать... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2007, 12:38:21 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
http://framework.zend.com/manual/en/zend.pdf.html не подойдет? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2007, 14:10:46 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
random13вот в том то и дело что я хочу собрать определенную базу pdf, которая и будет индексировать и осуществлять поиск по pdf...У меня была аналогичная задача - индексирование и поиск по базе pdf-ок сложной структуры (статьи из научных журналов). Воспользовался ht://Dig . Там как раз pdftotext используется. Потом попробовал еще несколько программок для извлечения текста из pdf-ок (перловские модули есть, на яве что-то) - pdftotext все же наиболее вменяемым показался. Если что, он и под Windows есть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2007, 15:03:10 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
С pdftotext одна проблема -- он иногда странно себя ведёт с кодировками. У меня был случай, когда он переводил в текст примерно половину документа (в KOI8-U). ======================= Роман Чемисов Тел.: +79149052257 ICQ: 157070721 Skype: gangabass ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.06.2007, 04:54:55 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
объясните хоть что это, библиотека такая или что, как хоть примерно этим пользоваться ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.06.2007, 16:50:43 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
Это небольшая утилита. Она входит в состав xpdf . ======================= Роман Чемисов Тел.: +79149052257 ICQ: 157070721 Skype: gangabass ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2007, 04:03:35 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
а что бы с ней работать что нужно сделать, на сервер чтоли залить или что ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2007, 10:31:41 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
pdftotext - исполняемый файл, которые необходимо загрузить на сервер, при работе сценария должен происходить её вызов с нужными параметарми (типа system('pdftotext <параметры>'); ). ------------------- В жизни невозможно появление чего-то невозможного... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2007, 11:28:07 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
Если *nix сервер, то, может быть, pdftotext на нем уже есть: Xpdf распространенный пакет. Вызов pdftotext file.pdf создаст file.txt, который можно парсить. Вызов pdftotext file.pdf - направит текст на stdout (напечатает в консоль), его можно перехватить скриптом и обойтись без создания дополнительного файла. Можно поробовать опции -raw и -layout, они влияют на вид текста. pdftotext -h печатает подсказку. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2007, 11:49:26 |
|
||
|
как осуществить поиск по pdf файлу
|
|||
|---|---|---|---|
|
#18+
Недавно опробовал офигенно вкусную возможность переходить из базы данных по гиперссылкам не только на html-страницы, но и к помеченному фрагменту документа MS Word. Точно так же можно переходить не только между записями в БД, но и к записи в другой базе (имя формы тоже задаётся в «гиперссылке»). В общем, на основе систем управления базами данных можно строить сложные оглавления, одно – сразу для нескольких документов. В связи с чем возник закономерный вопрос: а можно ли такой переход из базы сделать в pdf-документ? Понятно, что эта задача как-то связана с поиском в pdf-нике. Я вообще не пытался в Интернете что-то откопать по этой теме. Просто сейчас случайно наткнулся здесь на похожие вопросы, и решил испытать удачу найти всё сразу, и без лишних усилий. Вдруг кому-то нечем заняться? В любом случае, этот пост прочтёте с интересом. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2012, 15:51:10 |
|
||
|
|

start [/forum/topic.php?fid=23&msg=34620127&tid=1465166]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
80ms |
get topic data: |
14ms |
get forum data: |
3ms |
get page messages: |
66ms |
get tp. blocked users: |
2ms |
| others: | 222ms |
| total: | 419ms |

| 0 / 0 |
