Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / потоковое сканирование документов / 25 сообщений из 54, страница 1 из 3
14.11.2018, 18:48
    #39733184
Lunx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Добрый день.
Есть задача - сканируем документы, распознаем, например, торг-12, выдергиваем номер документа и создаем pdf с таким именем. Весь контент пишем в этот pdf до следующего Торг-12 или окончания потока.

Кто посоветует решение, может, кто -то спрограммировать хочет.
Обсуждаемо.

МК,
...
Рейтинг: 0 / 0
15.11.2018, 10:45
    #39733354
vill_ager
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Lunx,

сканируй пачку документов в многостраничный PDF, потом разбивай его на отдельные страницы (они внутри лежат как JPG), распознавай и сохраняй назад.
...
Рейтинг: 0 / 0
15.11.2018, 15:10
    #39733585
vill_ager
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
у меня распознаванием отсканированных страниц занимается неискусственный :) интеллект, который пишет аннотацию (ключевые слова) на каждую страницу.
Потом все сохраняется в БД (MySQL), и по ключевым словам можно выдергивать сканы.
Например, при отгрузке товара к накладной можно сформировать PDF с приходными документами (ттн, сертификаты и т.п.)
...
Рейтинг: 0 / 0
15.11.2018, 15:24
    #39733597
Lunx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Спасибо за советы.
тоже мысль - иметь общий pdf а затем запустит обработчик который из одного файла наделает много.
Кто подскажет такого программиста ?
...
Рейтинг: 0 / 0
15.11.2018, 15:49
    #39733618
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
LunxСпасибо за советы.
тоже мысль - иметь общий pdf а затем запустит обработчик который из одного файла наделает много.
Кто подскажет такого программиста ?есть ветка - Работа
...
Рейтинг: 0 / 0
15.11.2018, 16:10
    #39733633
vill_ager
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Lunx,

тут одна проблема - распознавание

все остальное - просто
...
Рейтинг: 0 / 0
16.11.2018, 10:16
    #39733905
Lunx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Может у кого есть опыт работы с FineReader ?
...
Рейтинг: 0 / 0
16.11.2018, 10:53
    #39733936
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
LunxМожет у кого есть опыт работы с FineReader ?к студентам.
...
Рейтинг: 0 / 0
16.11.2018, 15:27
    #39734192
Lunx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
профессионалы не потянут?
...
Рейтинг: 0 / 0
16.11.2018, 15:35
    #39734198
vill_ager
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123,

не так все просто
я (правда давно) искал возможность пакетного распознавания - не было ничего.
Может плохо искал.
Есть tesseract-ocr - посмотрите, ее можно натравить на файл из командной строки и получить текст.
...
Рейтинг: 0 / 0
16.11.2018, 16:12
    #39734234
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Lunxпрофессионалы не потянут?часовая ставка дорого.
vill_agerне так все просто
я (правда давно)вот именно, давно!
...
Рейтинг: 0 / 0
16.11.2018, 16:22
    #39734247
Lunx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Нашел контору Элар, но они скорее для очень крупных предприятий. elar.ru
...
Рейтинг: 0 / 0
16.11.2018, 20:31
    #39734361
vill_ager
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123,

а как оно сейчас?
...
Рейтинг: 0 / 0
16.11.2018, 23:02
    #39734408
вадя
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Lunx,
какое рабочее место предпологается?
...
Рейтинг: 0 / 0
17.11.2018, 10:37
    #39734470
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
vill_agerPetro123,

а как оно сейчас?fineReader должна быть кнопка - распознать пакетно все из папки такой то.
...
Рейтинг: 0 / 0
17.11.2018, 11:20
    #39734475
вадя
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123fineReader должна быть кнопка - распознать пакетно все из папки такой то.проблема в том что накладные могут быть многостраничными и важно не спутать связь.
можно конечно объединять по имени файлов, но тоже не очень.
вопрос какой сканер используется ? пакетный? - как обрабатываются двухстороннии доки, как нумеруются сканы.
самое оптимальное - посадить оператора и вручную вставлять листы
есть вариант как это всё сделать
но нужны более точные условия
...
Рейтинг: 0 / 0
17.11.2018, 12:02
    #39734482
vill_ager
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123,

Должна. А есть?

И даже если есть - решение не идеальное,
еще надо проанализировать сканы и тексты,
склеить длинные документы в один файл.

Я бы еще и текст распознанный сохранил,
для организации поиска.
...
Рейтинг: 0 / 0
17.11.2018, 13:45
    #39734524
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
vill_agerсклеить длинные документы в один файл.в pdf счас работает любая табуретка.
А уже с ним работает любой студент.
...
Рейтинг: 0 / 0
17.11.2018, 13:48
    #39734526
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
вадяпроблема в том что накладные могут быть многостраничными и важно не спутать связь.каую связь? На выходе столько же страниц.
Что означает вместо принтера МФУ знаете?
...
Рейтинг: 0 / 0
17.11.2018, 15:11
    #39734548
вадя
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123каую связь? На выходе столько же страниц.для экономии бумаги используют печать на 2 сторонах. эти мфу могут сканировать с двух сторон?
...
Рейтинг: 0 / 0
17.11.2018, 16:30
    #39734571
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
вадяPetro123каую связь? На выходе столько же страниц.для экономии бумаги используют печать на 2 сторонах. эти мфу могут сканировать с двух сторон?ну и вопрос, LOL.
Для экономии бумаги вообще не надо печатать.
А двухсторонний скан на выходе это анекдот.
...
Рейтинг: 0 / 0
17.11.2018, 16:39
    #39734576
вадя
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123Для экономии бумаги вообще не надо печатать.принтеры вполне справляются с печатью на обеих сторонах.
если ты их засунешь в пакетный сканер - что у тебя получится? будешь наугад группировать?
или мфу как принтеры умеют переворачивать бумагу?
...
Рейтинг: 0 / 0
17.11.2018, 18:55
    #39734608
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
вадя,
Не врубился?
Прочти первый ответ в топике. Где там принтер?
Первый ответ в топике это решение задачи.
...
Рейтинг: 0 / 0
17.11.2018, 19:13
    #39734618
вадя
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
Petro123Прочти первый ответ в топике. Где там принтер?
Первый ответ в топике это решение задачи.я о том что есть накладные напечатанные на обеих сторонах листа( а может и не на одном листе, тоже двухсторонних)
как автоматизировать сканирование таких доков?
...
Рейтинг: 0 / 0
17.11.2018, 20:06
    #39734626
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
потоковое сканирование документов
вадякак автоматизироватьникак. Это не наш вопрос и не вопрос автора топика.
...
Рейтинг: 0 / 0
Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / потоковое сканирование документов / 25 сообщений из 54, страница 1 из 3
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]