|
|
|
Решение задачи идентификации фрагментов документа (word) на основе примеров
|
|||
|---|---|---|---|
|
#18+
Добрый день. Мне нужно решить такую задачу. Есть коллекция документов Word в которых содержится описание технологического объекта. Структура документов похожа, но может немного отличаться. Например: есть таблица со значениями параметров работы объекта по датам. Количество записей в таблице отличается в зависимости от времени работы объекта. Если объект останавливался, то в документе присутствует текст с описанием причины остановки, а после этого опять стандартная таблица с параметрами работы по времени. Есть исходные примеры (паттерны) с выделенными фрагментами информации в документе. Например, с помощью цвета. Мне нужно аналогично раскрасить остальные документы. Т.е. по аналогии идентифицировать фрагменты в остальных документах. Тут напрашивается использование нейросетей или чего-нибудь еще. Мне нужно наиболее простое, но работающее решение, которое должно быть как бы универсальным, т.е. его можно было адаптировать для решения такой же задачи с другими видами документов. Проблема в том, что выделяемые фрагменты в документе могут быть вложены в друг друга. Например: Код: plaintext О условиях решения данной задачи договоримся. Пишите на: Youra_Polishuk@bk.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.09.2011, 11:41 |
|
||
|
Решение задачи идентификации фрагментов документа (word) на основе примеров
|
|||
|---|---|---|---|
|
#18+
я бы регэкспы использовал ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.09.2011, 14:13 |
|
||
|
Решение задачи идентификации фрагментов документа (word) на основе примеров
|
|||
|---|---|---|---|
|
#18+
JoFan, Можно подробнее. Что это такое. Ссылку. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.09.2011, 14:21 |
|
||
|
Решение задачи идентификации фрагментов документа (word) на основе примеров
|
|||
|---|---|---|---|
|
#18+
Youra PolishukJoFan, Можно подробнее. Что это такое. Ссылку. в гугле первая ссылка ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.09.2011, 15:05 |
|
||
|
Решение задачи идентификации фрагментов документа (word) на основе примеров
|
|||
|---|---|---|---|
|
#18+
Youra Polishuk, Что то я не понял это документ Word - или эксемелина какая то? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.09.2011, 17:52 |
|
||
|
|

start [/forum/topic.php?fid=16&fpage=80&tid=1342754]: |
0ms |
get settings: |
8ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
61ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
43ms |
get tp. blocked users: |
1ms |
| others: | 210ms |
| total: | 360ms |

| 0 / 0 |
