powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Решение задачи идентификации фрагментов документа (word) на основе примеров
6 сообщений из 6, страница 1 из 1
Решение задачи идентификации фрагментов документа (word) на основе примеров
    #37423778
Youra Polishuk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добрый день.

Мне нужно решить такую задачу.
Есть коллекция документов Word в которых содержится описание технологического объекта.
Структура документов похожа, но может немного отличаться. Например: есть таблица со значениями
параметров работы объекта по датам. Количество записей в таблице отличается в зависимости
от времени работы объекта. Если объект останавливался, то в документе присутствует
текст с описанием причины остановки, а после этого опять стандартная таблица с параметрами
работы по времени.
Есть исходные примеры (паттерны) с выделенными фрагментами информации в документе. Например, с помощью
цвета. Мне нужно аналогично раскрасить остальные документы. Т.е. по аналогии идентифицировать фрагменты
в остальных документах.

Тут напрашивается использование нейросетей или чего-нибудь еще.
Мне нужно наиболее простое, но работающее решение, которое должно быть как бы универсальным, т.е. его
можно было адаптировать для решения такой же задачи с другими видами документов.

Проблема в том, что выделяемые фрагменты в документе могут быть вложены в друг друга.
Например:
Код: plaintext
<работа>.....<дебит>1000</дебит> ..... <дебит>980</дебит></работа>.

О условиях решения данной задачи договоримся.
Пишите на: Youra_Polishuk@bk.ru
...
Рейтинг: 0 / 0
Решение задачи идентификации фрагментов документа (word) на основе примеров
    #37423848
JoFan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
я бы регэкспы использовал
...
Рейтинг: 0 / 0
Решение задачи идентификации фрагментов документа (word) на основе примеров
    #37423854
Youra Polishuk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JoFan,

Можно подробнее. Что это такое. Ссылку.
...
Рейтинг: 0 / 0
Решение задачи идентификации фрагментов документа (word) на основе примеров
    #37423893
JoFan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Youra PolishukJoFan,
Можно подробнее. Что это такое. Ссылку.

в гугле первая ссылка
...
Рейтинг: 0 / 0
Решение задачи идентификации фрагментов документа (word) на основе примеров
    #37425860
majestic-mike
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Youra Polishuk,

Что то я не понял это документ Word - или эксемелина какая то?
...
Рейтинг: 0 / 0
Решение задачи идентификации фрагментов документа (word) на основе примеров
    #37427932
Youra Polishuk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
majestic-mike,

Документ ворд. Я некрасивый пример привел. Похожий на XML.
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Решение задачи идентификации фрагментов документа (word) на основе примеров
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]