Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / парсер / обработчик документов ms word / 5 сообщений из 5, страница 1 из 1
14.05.2007, 07:28:46
    #34522199
slr
slr
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
парсер / обработчик документов ms word
проблема:
есть множество отчетов в формате .doc, строго структурированных, необходимо вытащить из них данные и поместить в бд или xml.

на титульной странице название объекта, по которому отчет, всегда в одном и том же месте, иногда в виде заголовка первого уровня иногда в виде обычного текста, и так же с остальными данными.

Вопрос: с чего начать?
...
Рейтинг: 0 / 0
14.05.2007, 08:05:49
    #34522228
Deggasad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
парсер / обработчик документов ms word
slrпроблема:
есть множество отчетов в формате .doc, строго структурированных, необходимо вытащить из них данные и поместить в бд или xml.

на титульной странице название объекта, по которому отчет, всегда в одном и том же месте, иногда в виде заголовка первого уровня иногда в виде обычного текста, и так же с остальными данными.

Вопрос: с чего начать?


У меня было такое правда разово! я кинул всё в эксель. Оказалось, что где то всё таки не строго структурирована информация быстро сделал проверки, поправил что нужно. А там уж всё просто дальше!
...
Рейтинг: 0 / 0
14.05.2007, 08:15:37
    #34522237
slr
slr
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
парсер / обработчик документов ms word
слишком много документов....
а как в ворде шагать по строчкам и узнавать свойства форматирования?
...
Рейтинг: 0 / 0
14.05.2007, 08:27:17
    #34522246
slr
slr
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
парсер / обработчик документов ms word
а как тогда скопировать всё содержимое на лист экселя?
...
Рейтинг: 0 / 0
14.05.2007, 11:38:42
    #34522789
Nosorog
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
парсер / обработчик документов ms word
WORD может сохранить doc файл как XML документ.
...
Рейтинг: 0 / 0
Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / парсер / обработчик документов ms word / 5 сообщений из 5, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]