powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / потоковое сканирование документов
25 сообщений из 54, страница 1 из 3
потоковое сканирование документов
    #39733184
Lunx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добрый день.
Есть задача - сканируем документы, распознаем, например, торг-12, выдергиваем номер документа и создаем pdf с таким именем. Весь контент пишем в этот pdf до следующего Торг-12 или окончания потока.

Кто посоветует решение, может, кто -то спрограммировать хочет.
Обсуждаемо.

МК,
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733354
vill_ager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Lunx,

сканируй пачку документов в многостраничный PDF, потом разбивай его на отдельные страницы (они внутри лежат как JPG), распознавай и сохраняй назад.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733585
vill_ager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
у меня распознаванием отсканированных страниц занимается неискусственный :) интеллект, который пишет аннотацию (ключевые слова) на каждую страницу.
Потом все сохраняется в БД (MySQL), и по ключевым словам можно выдергивать сканы.
Например, при отгрузке товара к накладной можно сформировать PDF с приходными документами (ттн, сертификаты и т.п.)
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733597
Lunx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Спасибо за советы.
тоже мысль - иметь общий pdf а затем запустит обработчик который из одного файла наделает много.
Кто подскажет такого программиста ?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733618
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LunxСпасибо за советы.
тоже мысль - иметь общий pdf а затем запустит обработчик который из одного файла наделает много.
Кто подскажет такого программиста ?есть ветка - Работа
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733633
vill_ager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Lunx,

тут одна проблема - распознавание

все остальное - просто
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733905
Lunx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Может у кого есть опыт работы с FineReader ?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39733936
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LunxМожет у кого есть опыт работы с FineReader ?к студентам.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734192
Lunx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
профессионалы не потянут?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734198
vill_ager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Petro123,

не так все просто
я (правда давно) искал возможность пакетного распознавания - не было ничего.
Может плохо искал.
Есть tesseract-ocr - посмотрите, ее можно натравить на файл из командной строки и получить текст.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734234
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Lunxпрофессионалы не потянут?часовая ставка дорого.
vill_agerне так все просто
я (правда давно)вот именно, давно!
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734247
Lunx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нашел контору Элар, но они скорее для очень крупных предприятий. elar.ru
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734361
vill_ager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Petro123,

а как оно сейчас?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734408
вадя
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Lunx,
какое рабочее место предпологается?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734470
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vill_agerPetro123,

а как оно сейчас?fineReader должна быть кнопка - распознать пакетно все из папки такой то.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734475
вадя
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Petro123fineReader должна быть кнопка - распознать пакетно все из папки такой то.проблема в том что накладные могут быть многостраничными и важно не спутать связь.
можно конечно объединять по имени файлов, но тоже не очень.
вопрос какой сканер используется ? пакетный? - как обрабатываются двухстороннии доки, как нумеруются сканы.
самое оптимальное - посадить оператора и вручную вставлять листы
есть вариант как это всё сделать
но нужны более точные условия
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734482
vill_ager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Petro123,

Должна. А есть?

И даже если есть - решение не идеальное,
еще надо проанализировать сканы и тексты,
склеить длинные документы в один файл.

Я бы еще и текст распознанный сохранил,
для организации поиска.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734524
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vill_agerсклеить длинные документы в один файл.в pdf счас работает любая табуретка.
А уже с ним работает любой студент.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734526
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вадяпроблема в том что накладные могут быть многостраничными и важно не спутать связь.каую связь? На выходе столько же страниц.
Что означает вместо принтера МФУ знаете?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734548
вадя
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Petro123каую связь? На выходе столько же страниц.для экономии бумаги используют печать на 2 сторонах. эти мфу могут сканировать с двух сторон?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734571
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вадяPetro123каую связь? На выходе столько же страниц.для экономии бумаги используют печать на 2 сторонах. эти мфу могут сканировать с двух сторон?ну и вопрос, LOL.
Для экономии бумаги вообще не надо печатать.
А двухсторонний скан на выходе это анекдот.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734576
вадя
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Petro123Для экономии бумаги вообще не надо печатать.принтеры вполне справляются с печатью на обеих сторонах.
если ты их засунешь в пакетный сканер - что у тебя получится? будешь наугад группировать?
или мфу как принтеры умеют переворачивать бумагу?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734608
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вадя,
Не врубился?
Прочти первый ответ в топике. Где там принтер?
Первый ответ в топике это решение задачи.
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734618
вадя
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Petro123Прочти первый ответ в топике. Где там принтер?
Первый ответ в топике это решение задачи.я о том что есть накладные напечатанные на обеих сторонах листа( а может и не на одном листе, тоже двухсторонних)
как автоматизировать сканирование таких доков?
...
Рейтинг: 0 / 0
потоковое сканирование документов
    #39734626
Фотография Petro123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вадякак автоматизироватьникак. Это не наш вопрос и не вопрос автора топика.
...
Рейтинг: 0 / 0
25 сообщений из 54, страница 1 из 3
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / потоковое сканирование документов
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]