|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Суть проблемы в следуйщем: В базу данных аплоадятся доковские файлы-резюме одинаковой структуры. Необходимо провести разбор файла и разнести инфу по разным таблицам базы данных. Я навычитывал кучу всяких свойств документов, но каким образом вытянуть инфу так и не понял... Но чувствую что как-то можно... Подскажите плиз если кто сталкивался Заранее большое спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.06.2003, 15:28 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Это весьма нетривиальная задача, простая только на первый взгляд, наверняка есть возможность обойтись без этого. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.06.2003, 18:39 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
В новой версии MSSQL обещают встроить поддержку работы с документами office (в смысле не через OLE-всякие). В Вашем случае нужно поработать со структурой документа в плане определения полей, закладок и прочего к которым обращаться за данными (это через OLE Automation). Говорят есть неофициальная публикация формата word, но я так ее и не нашел. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.06.2003, 13:42 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Привет ! Некоторое время назад сам сталкивался с такой задачей. Правда у меня была простая таблица (около 2000 строк) а не резюме, но и В Вашем случае можно попробовать. Копируешь док, потом все вставляешь в файл Excel, дополнительно ручками структурируешь информацию( надеюсь что это не потребуется), а потом используя макрос на бейсике содзаю хорошую структурированную таблицу, которую потом не стыдно напрямую экспортировать например в SQLServer2000 (import/export manager). Вообще не стоить пугаться макросов Excel - при желании и необходимости в них можно разобраться за день ! Удачи ! (И привет с GotDotNet !) ... |
|||
:
Нравится:
Не нравится:
|
|||
10.06.2003, 15:05 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Приступаю к этой нетривиальной задаче... ... |
|||
:
Нравится:
Не нравится:
|
|||
10.06.2003, 22:33 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Интересно, а в XML нельзя их конвертнуть и попробовать разобрать? Может так проще будет? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.06.2003, 09:43 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
А xml формат с какой версии ворда не с ХР ли? Может быть через смарт-теги как-то можно? А что там внутри творится? там не то что программист, там черт ногу сломит: вложенные друг в друга пустые теги <span>, например, это только одна неприятная мелочь, вообще ворд относится к тем редакторам, которые взяв нативный документ в стандартном (если такой есть, конечно :)) формате, при сохранении портят его безвозвратно. Делать файл таким образом можно, а вот обратный процесс без большой кровопотери невозможен. InfoPath они делают в т.ч. для улучшения этой обратной связи сейчас. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.06.2003, 17:47 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Привет, Word XP вроде не конвертирует в XML. Только Excell ! ... |
|||
:
Нравится:
Не нравится:
|
|||
15.06.2003, 15:18 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Stop! da luboy VBA programist eto za paru dney sdelaet. Prostav' postoyanie "styles" Worde na kajdoe pole t.e. god rojdenie style god_rojdenie Zatem vozmi office inteprops vskrivay Word i style za stylem vitaskivay dannie -dalshe delo tehniki. Vopros 4to delat' so starimi CV? -posadi kakuyu-nibud' sekretarshu pust' copy-paste delaet - dobavlyaet style. Ya delay proekt po document management: Vna4ale sozdal v worde template (.dot) so stylyami - zatem priu4il vseh immi pol'zovatsya i gotovie .doc files kiat' v folder na setke na kotorom zapustil FolderWatcher i kak tol'ko poyavlyasya noviy file - vskrival ego i v DB! ... |
|||
:
Нравится:
Не нравится:
|
|||
15.06.2003, 18:50 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
если бы была такая добрая секретарша то я бы её лучше посадил делать копи-паст всей инфы сразу в базу )) но ленивые ща пошли эти секретарши!!! тока сегодня смог в ворд ч-з интероп этот залезть.. - задача тож нетривиальная )) ... |
|||
:
Нравится:
Не нравится:
|
|||
16.06.2003, 11:50 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
вот набрёл на статью - может ещё интересно: Understanding the Word Object Model from a .NET Developer’s Perspective http://msdn.microsoft.com/library/default.asp?url=/library/en-us/odc_vsto2003_ta/html/WordObject.asp ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2003, 11:21 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
да ещё интерено так как проблема ещё не решена ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2003, 12:39 |
|
Разбор .doc файла ???
|
|||
---|---|---|---|
#18+
Не знаю в чем проблема, а я doc-файл по полочкам разобрал (хоть в доль, хоть поперек) и раскидал по базе как захотел всю инфу из доков одинаковой структуры. А вчем-то собственно проблема? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.06.2003, 19:00 |
|
|
start [/forum/topic.php?fid=18&msg=32187771&tid=1396407]: |
0ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
38ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
52ms |
get tp. blocked users: |
1ms |
others: | 14ms |
total: | 147ms |
0 / 0 |