|
|
|
парсер / обработчик документов ms word
|
|||
|---|---|---|---|
|
#18+
проблема: есть множество отчетов в формате .doc, строго структурированных, необходимо вытащить из них данные и поместить в бд или xml. на титульной странице название объекта, по которому отчет, всегда в одном и том же месте, иногда в виде заголовка первого уровня иногда в виде обычного текста, и так же с остальными данными. Вопрос: с чего начать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2007, 07:28:46 |
|
||
|
парсер / обработчик документов ms word
|
|||
|---|---|---|---|
|
#18+
slrпроблема: есть множество отчетов в формате .doc, строго структурированных, необходимо вытащить из них данные и поместить в бд или xml. на титульной странице название объекта, по которому отчет, всегда в одном и том же месте, иногда в виде заголовка первого уровня иногда в виде обычного текста, и так же с остальными данными. Вопрос: с чего начать? У меня было такое правда разово! я кинул всё в эксель. Оказалось, что где то всё таки не строго структурирована информация быстро сделал проверки, поправил что нужно. А там уж всё просто дальше! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2007, 08:05:49 |
|
||
|
парсер / обработчик документов ms word
|
|||
|---|---|---|---|
|
#18+
слишком много документов.... а как в ворде шагать по строчкам и узнавать свойства форматирования? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2007, 08:15:37 |
|
||
|
парсер / обработчик документов ms word
|
|||
|---|---|---|---|
|
#18+
а как тогда скопировать всё содержимое на лист экселя? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2007, 08:27:17 |
|
||
|
|

start [/forum/topic.php?fid=61&msg=34522237&tid=2182978]: |
0ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
59ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
47ms |
get tp. blocked users: |
1ms |
| others: | 207ms |
| total: | 360ms |

| 0 / 0 |
