|
|
|
индексирование данных в документах doc/xls/odt/pdf
|
|||
|---|---|---|---|
|
#18+
кто-нибудь реализовывал индексирование данных в документах doc/xls/odt/pdf ? чтобы можно было как в yandex - искать по завалам документов, хотя бы приблизительно, по ключевым словам алгоритм индексации и БД для неё - дело второе главное - как выдрать текст из большого числа разнородных документов ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.07.2011, 13:16 |
|
||
|
индексирование данных в документах doc/xls/odt/pdf
|
|||
|---|---|---|---|
|
#18+
тверскойкак выдрать текст из большого числа разнородных документов что в этом сложного-то ? на все указанные типы есть куча готовых либ, в яве например. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.07.2011, 15:55 |
|
||
|
индексирование данных в документах doc/xls/odt/pdf
|
|||
|---|---|---|---|
|
#18+
Насчёт odt - не знаю. Всё остальное умеет делать Windows. Изучайте хелп. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.07.2011, 16:19 |
|
||
|
индексирование данных в документах doc/xls/odt/pdf
|
|||
|---|---|---|---|
|
#18+
mayton, файлов много, индексировать их надо оперативно и своеобразно... стандартный механизм не подходит ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.08.2011, 18:44 |
|
||
|
|

start [/forum/topic.php?fid=16&fpage=81&tid=1342804]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
47ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
31ms |
get tp. blocked users: |
1ms |
| others: | 259ms |
| total: | 376ms |

| 0 / 0 |
