|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Всем, привет. Помогите написать Pattern, чтобы вытащить ФИО из назначения платежа Пример: txt="(ИНН 00000000000; КПП 111111111), Перечисление по и/л N не указан от 01.01.2019 c Иванов Иван Иванович Россия, Московская обл., , г. Москва, , ул. Комарова, д. 00, , кв. 00. Без НДС." ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 11:15 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
antonkashinПример:Маловато примеров. Дата и предлог "с" всегда присутствует, годится для детектирования начала? "Россия" всегда присутствует, годится для детектирования окончания? ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 11:20 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Shocker.Pro, Нет назначение платежа может быть написано как угодно, но всегда присутствует ФИО(может не быть адреса или даты, даже предлога с) ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 11:40 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Практически нереально. С достаточно большой вероятностью можно решить задачу, имея достаточно полный справочник имён, фамилий и отчеств - но и то без гарантии, ибо многозначности, экзотики и опечаток никто не отменял. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 11:59 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
antonkashinназначение платежа может быть написано как угодноА как ты тогда планируешь отличить "Иванов Иван Иванович" от "Перечисление по счету"? Тут два варианта просматриваются: 1) Можно попробовать найти три подряд русских слова, начинающихся с заглавной буквы, разделенные только пробелами (прокатит для единственного приведенного примера). Однако, у человека может не быть отчества или может быть составная фамилия (Оглы) 2) Взять как можно больше вариантов назначения, проанализировать, составит десяток-другой паттернов для анализа. Оба варианта дадут, наверное, процентов 90, но не 100. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 12:15 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Shocker.ProantonkashinПример:Маловато примеров. "Россия" всегда присутствует, годится для детектирования окончания? А если это имя? ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 13:51 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
AkinaПрактически нереально. С достаточно большой вероятностью можно решить задачу, имея достаточно полный справочник имён, фамилий и отчеств - но и то без гарантии, ибо многозначности, экзотики и опечаток никто не отменял. Справочники, конечно, должны быть. Там же где распознавание не прошло автоматом - на ручную обработку, с пополнением справочников при необходимости. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 13:54 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Анри Луи Огюст Рикар де Монферран - тоже ФИО, только мало распространенная ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 16:45 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Роберто Фабио Монда Карденас Владимирович - а этот внештатный единорос, не только ФИО имеет, но даже деньги посылает ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 16:47 |
|
Вытащить ФИО текста регулярными выражениями
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, можете звать меня просто Монда ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2019, 18:11 |
|
|
start [/forum/topic.php?fid=60&fpage=5&tid=2154867]: |
0ms |
get settings: |
11ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
28ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
49ms |
get tp. blocked users: |
1ms |
others: | 287ms |
total: | 411ms |
0 / 0 |