powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / Microsoft Access [игнор отключен] [закрыт для гостей] / сканированный документ
25 сообщений из 162, страница 2 из 7
сканированный документ
    #34581379
Фотография BULK INSERT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
%?*?%поигнайтесь

велик могучим Русским языка
...
Рейтинг: 0 / 0
сканированный документ
    #34581394
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
да, документ стандартный, постоянно идин и тот же... сначала заголовок, далее в виде таблице.
и мне надо, чтобы вытаскивалось - 5-ая строка (не считая пустых). как это правильно указать? и имеет ли существенное значение, что документ содержит таблицу?
...
Рейтинг: 0 / 0
сканированный документ
    #34581406
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
BULK INSERT
я не совсем поняла..
это так распознается текст?
у меня поля два: первое - название фирмы, а второе- сумма перевода. цифры тоже так же **** будут?
...
Рейтинг: 0 / 0
сканированный документ
    #34581422
Фотография mds_world
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Да, это возможная картинка при распознавании. ИМХО, для вас лучший выбор - кодировка нужных реквизитов документа в названии отсканированного файла.
...
Рейтинг: 0 / 0
сканированный документ
    #34581456
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mds_world
хорошо, если переходить на это...как это делается ?
Знаю, что уже всех достала, просто нигде не могу найти подобной информации. тема поднималась, но быстро закрывалась не решившись :) а хочется все это добить до конца. должен же быть какой-то выход...
...
Рейтинг: 0 / 0
сканированный документ
    #34581472
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BULK INSERT %?*?%поигнайтесь

велик могучим Русским языка

Клавиатура без русской раскладки - уж не серчайте, дяденька, промахиваюсь иногда...

Проверить установленый язык можно так:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
Sub TestLayoutProperties()

  Dim miDoc As MODI.Document
  Dim miLayout As MODI.Layout
  Dim strLayoutInfo As String
  
  Set miDoc = New MODI.Document
  miDoc.Create "C:\document1.tif"
  
  miDoc.Images( 0 ).OCR
  
  Set miLayout = miDoc.Images( 0 ).Layout
  strLayoutInfo = _
    "Language: " & miLayout.Language & vbCrLf & _
    "Number of characters: " & miLayout.NumChars & vbCrLf & _
    "Number of fonts: " & miLayout.NumFonts & vbCrLf & _
    "Number of words: " & miLayout.NumWords & vbCrLf & _
    "Beginning of text: " & Left(miLayout.Text,  50 ) & vbCrLf & _
    "First word of text: " & miLayout.Words( 0 ).Text
  MsgBox strLayoutInfo, vbInformation + vbOKOnly, _
    "Layout Information"
  
  Set miLayout = Nothing
  Set miDoc = Nothing

End Sub

Могу кинуть полный хелп по MODI.
...
Рейтинг: 0 / 0
сканированный документ
    #34581489
Фотография mds_world
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kobramds_world
хорошо, если переходить на это...как это делается ?
Знаю, что уже всех достала, просто нигде не могу найти подобной информации. тема поднималась, но быстро закрывалась не решившись :) а хочется все это добить до конца. должен же быть какой-то выход...Какие реквизиты документа важны для вас? Что находится на 5-ой строке?
...
Рейтинг: 0 / 0
сканированный документ
    #34581491
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
help было бы замечательно.
а эту проверку куда...???
...
Рейтинг: 0 / 0
сканированный документ
    #34581502
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mds_world

Идея хороша - своей простотой, прежде всего... Но люди слишком часто ошибаются - одна неверная буква - и документ не будет найден. В результате - скандал на фирме. Кто будет крайний? Разработчик, конечно - плохую систему сделал - потому как секретарша, конечно, дура, но программа-то - умная. Я это уже имел (или меня этим имели...)
...
Рейтинг: 0 / 0
сканированный документ
    #34581520
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kobrahelp было бы замечательно.
а эту проверку куда...???

Да просто - запустите один раз, чтоб убедиться, что стоит нужный язык.

Давайте почту - хелп весит 356 кило.
...
Рейтинг: 0 / 0
сканированный документ
    #34581556
Фотография BULK INSERT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kobraя не совсем поняла

да, так в MODI распознается текст таможенной декларации на русском языке на компьютере где установлен не локализованный офис.

идея предложенная 57875 хороша, но ИМХО не достаточно хорошо реализована в инструменте к которому предлагается прибегнуть.
...
Рейтинг: 0 / 0
сканированный документ
    #34581576
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Хелп тут:

http://]http://www.microsoft.com/downloads/details.aspx?familyid=7B6D9193-A1C8-4934-8007-47089FDE37DE&displaylang=en
...
Рейтинг: 0 / 0
сканированный документ
    #34581577
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
eivchenkoСОБАЧКАbankТОЧКАrsТОЧКАru
...
Рейтинг: 0 / 0
сканированный документ
    #34581586
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mds_world
в 5-й строке находится название фирмы.
мне хотя бы это вытащить :)
...
Рейтинг: 0 / 0
сканированный документ
    #34581597
Фотография BULK INSERT
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
%?*?%Кто будет крайний? Разработчик, конечно...

не знаю каков ваш опыт разработчика, но если вы не в курсе позволю себе внести уточнение - крайним разработчик будет ВСЕГДА.

готов вам позавидовать если у вас еще не было повода вынести это досадное стойкое и безапелляционное убеждение самому.

самый простой способ - использовать специальные программы типа ФайнРидера для трассировки и распознавания текста еще на этапе сканирования - пусть оператор сам сканирует документ и сразу его распознает (и проверяет)

если сканируются типовые документы задача еще более упрощается - можно использовать "заточенные" пакеты например ФормРидер

на этапе сканирования документ уже будет проанализирован распознан и разнесен по полям таблиц...

париться с этой задачей из под Access от луквого ИМХО
...
Рейтинг: 0 / 0
сканированный документ
    #34581608
Фотография mds_world
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kobramds_world
в 5-й строке находится название фирмы.
мне хотя бы это вытащить :)Я ничего не предлагал вытаскивать. Я предложил набивать название документа при сканировании по специально разработанной схеме, в которой бы учитывались нужные реквизиты документа. Например "ООО Рога и копыта-07-06-2007.jpg"
...
Рейтинг: 0 / 0
сканированный документ
    #34581616
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Отправил - MSPAUTO.chm называется.
...
Рейтинг: 0 / 0
сканированный документ
    #34581629
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
набивать как? ручками? если да то это не пойдет.
...
Рейтинг: 0 / 0
сканированный документ
    #34581653
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BULK INSERT %?*?%Кто будет крайний? Разработчик, конечно...

не знаю каков ваш опыт разработчика, но если вы не в курсе позволю себе внести уточнение - крайним разработчик будет ВСЕГДА.

готов вам позавидовать если у вас еще не было повода вынести это досадное стойкое и безапелляционное убеждение самому.

самый простой способ - использовать специальные программы типа ФайнРидера для трассировки и распознавания текста еще на этапе сканирования - пусть оператор сам сканирует документ и сразу его распознает (и проверяет)

если сканируются типовые документы задача еще более упрощается - можно использовать "заточенные" пакеты например ФормРидер

на этапе сканирования документ уже будет проанализирован распознан и разнесен по полям таблиц...

париться с этой задачей из под Access от луквого ИМХО

Не знаю, каков ваш опыт разработчика - но предложение купить и поставить программу - дело системного аналитика. Дело разработчика - раз его уже пригласили, получить техзадание и реализовать по написанному. Что я и делаю. И у меня это работает, заказчик доволен.

Все остальное - от луквого ИМХО

Ну а по поводу страшной опасности нелокализованного офиса - спасибо, улыбнулся...
...
Рейтинг: 0 / 0
сканированный документ
    #34581668
Фотография mds_world
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kobraнабивать как? ручками? если да то это не пойдет.Да, ручками. Почти уверен, что именно так и будет.
...
Рейтинг: 0 / 0
сканированный документ
    #34581709
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
это не решит проблем, тогда вообще программа не нужна. хочется автоматизировать документооборот внутри подразделения, а если ручками, то то будет еще дольше :)
...
Рейтинг: 0 / 0
сканированный документ
    #34581857
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По поводу распознавания языков:

OCR Method


Performs optical character recognition (OCR) on the specified document or image.

expression.OCR(LangId, OCROrientImage, OCRStraightenImage)
expression Required. An expression that returns a Document object or an Image object.

LangId Optional MiLANGUAGES. The language to use when performing OCR. Default is miLANG_SYSDEFAULT .

LangId can be one of the following MiLANGUAGES constants.
miLANG_CHINESE_SIMPLIFIED (2052, &H804)
miLANG_CHINESE_TRADITIONAL (1028, &H404)
miLANG_CZECH (5)
miLANG_DANISH (6)
miLANG_DUTCH (19, &H13)
miLANG_ENGLISH (9)
miLANG_FINNISH (11)
miLANG_FRENCH (12)
miLANG_GERMAN (7)
miLANG_GREEK (8)
miLANG_HUNGARIAN (14)
miLANG_ITALIAN (16, &H10)
miLANG_JAPANESE (17, &H11)
miLANG_KOREAN (18, &H12)
miLANG_NORWEGIAN (20, &H14)
miLANG_POLISH (21, &H15)
miLANG_PORTUGUESE (22, &H16)
miLANG_RUSSIAN (25, &H19)
miLANG_SPANISH (10)
miLANG_SWEDISH (29, &H1D)
miLANG_SYSDEFAULT (2048, &H800)
miLANG_TURKISH (31, &H1F)


OCROrientImage Optional Boolean. Specifies whether the OCR engine attempts to determine the orientation of the page. Default is true.

OCRStraightenImage Optional Boolean. Specifies whether the OCR engine attempts to "de-skew" the page to correct for small angles of misalignment from the vertical. Default is true.



Remarks
The OCR engine always defaults to the user's regional settings for the LangID argument, unless you specify the language explicitly when calling the OCR method; it does not retain the previously used setting. In a mixed-language environment, it is a good practice to specify the LangID argument explicitly in every call to the OCR method.
...
Рейтинг: 0 / 0
сканированный документ
    #34581897
kobra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
Function txtOCR(fName as string) as String

  Dim miDoc As MODI.Document
  Dim miLayout As MODI.Layout
  Dim strText As String
  Dim strWord as String

  Set miDoc = New MODI.Document
  miDoc.Create fName
  miDoc.Images( 0 ).OCR
  Set miLayout = miDoc.Images( 0 ).Layout
  txtOCR = miLayout.Text
  
  Set miLayout = Nothing
  Set miDoc = Nothing

End Function


Private Sub Кнопка2_Click()
On Error Resume Next
Me!f1 = OpenDialogFileName
fdate = Date
ftime = Time
Dim rst As Recordset

Set rst = CurrentDb.OpenRecordset("Doc")

With rst
.AddNew
![Login] = fOSUserName
![FIO] = DLookup("[FIO]", "Login", "[Login] = '" & fOSUserName & "' ")
![Doc] = Me!f1
![DateDoc] = CDate(fdate + ftime)
![TextDoc] = txtOCR(Me!f1)
.Update
End With

rst.Close

MsgBox "Ссылка на документ загружена в программу !"
Me.f1 = Null
End Sub
это я вписала. %?*?% что дальше делать, что должно получиться?
...
Рейтинг: 0 / 0
сканированный документ
    #34581970
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Код: plaintext
miDoc.Images( 0 ).OCR ( 25 )

Это чтоб точно распознал русский.

После этого у вас в поле txtDoc таблицы Doc будет загружен весь текст из отсканированного имиджа. Если нужен не весь, а определенная строка, то можно сделать

Код: plaintext
txtOCR = miLayout.Words( 37 ) & Space( 1 ) & miLayout.Words( 38 )

Крнкретные числа нужно подобрать опытным путем - отсканировав документ и посмотрев, что вернет txtOCR. Можно написать отдельную функцию для поиска определенного текста - например через vbScript.RegExp (VBScript Regular Expressions 5.5) - по маске - если речь идет о коде документа.
...
Рейтинг: 0 / 0
сканированный документ
    #34582000
Фотография %?*?%
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
точнее:

Код: plaintext
miDoc.Images( 0 ).OCR ( miLANG_RUSSIAN,  0 ,  0  )
...
Рейтинг: 0 / 0
25 сообщений из 162, страница 2 из 7
Форумы / Microsoft Access [игнор отключен] [закрыт для гостей] / сканированный документ
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]