Гость
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Разбор .doc файла ??? / 14 сообщений из 14, страница 1 из 1
06.06.2003, 15:28
    #32178552
jazz
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Суть проблемы в следуйщем:
В базу данных аплоадятся доковские файлы-резюме одинаковой структуры.
Необходимо провести разбор файла и разнести инфу по разным таблицам
базы данных.

Я навычитывал кучу всяких свойств документов, но каким образом
вытянуть инфу так и не понял...
Но чувствую что как-то можно...

Подскажите плиз если кто сталкивался


Заранее большое спасибо.
...
Рейтинг: 0 / 0
06.06.2003, 18:39
    #32178806
greenapple
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Это весьма нетривиальная задача, простая только на первый взгляд, наверняка есть возможность обойтись без этого.
...
Рейтинг: 0 / 0
10.06.2003, 13:42
    #32180503
Роман Дынник
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
В новой версии MSSQL обещают встроить поддержку работы с документами office (в смысле не через OLE-всякие).

В Вашем случае нужно поработать со структурой документа в плане определения полей, закладок и прочего к которым обращаться за данными (это через OLE Automation).

Говорят есть неофициальная публикация формата word, но я так ее и не нашел.
...
Рейтинг: 0 / 0
10.06.2003, 15:05
    #32180625
maratic_net
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Привет ! Некоторое время назад сам сталкивался с такой задачей. Правда у меня была простая таблица (около 2000 строк) а не резюме, но и В Вашем случае можно попробовать.
Копируешь док, потом все вставляешь в файл Excel, дополнительно ручками структурируешь информацию( надеюсь что это не потребуется), а потом используя макрос на бейсике содзаю хорошую структурированную таблицу, которую потом не стыдно напрямую экспортировать например в SQLServer2000 (import/export manager).

Вообще не стоить пугаться макросов Excel - при желании и необходимости в них можно разобраться за день !

Удачи ! (И привет с GotDotNet !)
...
Рейтинг: 0 / 0
10.06.2003, 22:33
    #32180896
jazz
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Приступаю к этой нетривиальной задаче...
...
Рейтинг: 0 / 0
11.06.2003, 09:43
    #32180983
hDrummer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Интересно, а в XML нельзя их конвертнуть и попробовать разобрать? Может так проще будет?
...
Рейтинг: 0 / 0
11.06.2003, 17:47
    #32181625
greenapple
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
А xml формат с какой версии ворда не с ХР ли? Может быть через смарт-теги как-то можно? А что там внутри творится? там не то что программист, там черт ногу сломит: вложенные друг в друга пустые теги <span>, например, это только одна неприятная мелочь, вообще ворд относится к тем редакторам, которые взяв нативный документ в стандартном (если такой есть, конечно :)) формате, при сохранении портят его безвозвратно. Делать файл таким образом можно, а вот обратный процесс без большой кровопотери невозможен. InfoPath они делают в т.ч. для улучшения этой обратной связи сейчас.
...
Рейтинг: 0 / 0
15.06.2003, 15:18
    #32182697
maratic_net
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Привет, Word XP вроде не конвертирует в XML. Только Excell !
...
Рейтинг: 0 / 0
15.06.2003, 18:50
    #32182724
EvAlex
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Stop!
da luboy VBA programist eto za paru dney sdelaet.
Prostav' postoyanie "styles" Worde na kajdoe pole
t.e. god rojdenie style god_rojdenie
Zatem vozmi office inteprops vskrivay Word i style za stylem vitaskivay dannie -dalshe delo tehniki.

Vopros 4to delat' so starimi CV? -posadi kakuyu-nibud' sekretarshu pust' copy-paste delaet - dobavlyaet style.

Ya delay proekt po document management:
Vna4ale sozdal v worde template (.dot) so stylyami - zatem priu4il vseh immi pol'zovatsya i gotovie .doc files kiat' v folder na setke
na kotorom zapustil FolderWatcher i kak tol'ko poyavlyasya noviy file - vskrival ego i v DB!
...
Рейтинг: 0 / 0
16.06.2003, 11:50
    #32183013
jazz
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
если бы была такая добрая секретарша то я бы её
лучше посадил делать копи-паст всей инфы сразу в базу ))
но ленивые ща пошли эти секретарши!!!

тока сегодня смог в ворд ч-з интероп этот залезть.. - задача тож нетривиальная ))
...
Рейтинг: 0 / 0
19.06.2003, 11:21
    #32186249
hDrummer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
вот набрёл на статью - может ещё интересно:
Understanding the Word Object Model from a .NET Developer’s Perspective
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/odc_vsto2003_ta/html/WordObject.asp
...
Рейтинг: 0 / 0
19.06.2003, 12:39
    #32186335
jazz
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
да ещё интерено так как проблема ещё не решена
...
Рейтинг: 0 / 0
20.06.2003, 19:00
    #32187771
Sirios
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Не знаю в чем проблема, а я doc-файл по полочкам разобрал (хоть в доль, хоть поперек) и раскидал по базе как захотел всю инфу из доков одинаковой структуры. А вчем-то собственно проблема?
...
Рейтинг: 0 / 0
20.06.2003, 19:07
    #32187778
Sirios
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Разбор .doc файла ???
Да, кстати. Полазал я по той ссылочке, что hDrummer давал. Сдается мне, что вся петрушка писяная там - для оффиса 2003.
Тогда как даже оффис ХР - 2002.
...
Рейтинг: 0 / 0
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Разбор .doc файла ??? / 14 сообщений из 14, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]