|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Добрый день! Может быть уважаемые смогут натолкнуть на правильное направление движения, Исходные данные есть 2 таблицы: TASK (задача) ~ 200 строк ID (number) - PK FULLNAME (varchar2 (2000)) - наименование задачи Organization (Организации) ~ 900 строк ID (number) - PK FULLNAME (наименование организации полное) В таблице TASK в наименованиях задач внутри текста задачи встречаются наименования организаций. Пример: Выполнение работ по поставке "Рогов и копыт", АО "Гринпис". Но поскольку в таблице "Организации" данные актуализируются существенно чаще таблицы - "Задача", то наименования организаций (в TASK) иногда устаревают. Заранее предвосхищая вопрос - почему нельзя вставить наименование организаций в таблицу TASK - т.к. в TASK-e наименования могут быть в другом падеже, где то с точкой и пр. и пр. Задача - помочь пользователям БД в ловле таких блох и поиску таких "невязок в названиях организаций" Итого - нужен скрипт (запрос) который бы бежал по таблице организации и находил "похожие - т.е. нечеткое совпадение" (например в таблице TASK - Организация: ЗАО "Рога и копыта", в реальности в таблице Организации оно уже АО "Рога и копыта" Подтолкните к мысли как корректно решить задачку... ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 14:18 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Kostya555, Код: plaintext
... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 14:32 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Kostya555Заранее предвосхищая вопрос - почему нельзя вставить наименование организаций в таблицу TASKТолько дурак может предвосхищаться дуростью.Kostya555ID (number) - PKЧто такое "PK"?Kostya555TASK (задача) ~ 200 строкПри скорочтении одна строка в 7 минут за сутки можно все перепроверить и еще останется время кофе попить. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 14:33 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
-2-, при всем к вам уважении, ваш ответ попахивает снобизмом а не реальной помощью по вопросу.... Про 7 минут понятно я про автоматизацию и возможность свести к минимуму человеческий фактор... PK - primary key (хотя не знаю зачем я это вставил.. так...для задачки это не нужно) ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 14:54 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Kostya555Подтолкните к мысли как корректно решить задачку... добавить ссылку на организацию в таблицу задач, чтобы больше никогда так не париться. существующие задачи просмотреть глазами и, если необходимо, вбить организацию руками. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 15:17 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
проходил мимо... - проблема в том, что наименование организации может встречаться внутри текста задачи с разными падежами, склонениями и пр.., тогда как справочник организация - всегда как в уставе организации.. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 15:46 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Как разгрести не знаю. А на будущее лучше добавить еще одно поле в таблицу задач, где будет фиксироваться код организации исполнителя сразу при заполнении. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 18:19 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Тут обсуждалось похожая тема https://www.sql.ru/forum/447639/opredelit-pohozhest-strok-chastichnoe-sovpadenie ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 18:25 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Еще вариант, в виду ограниченного объема, загрузить 2 таблицы в Exel и сравнить единоразово там. Для экселя есть скрипты сравнения строк на схожесть. Или на Python-е сделать. Ну а в дальнейшем вести базу корректно, добавляя код фирмы в строку задачи. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.10.2019, 18:33 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
Kostya555наименование организации может встречаться внутри текста задач не наименование внутри текста, а внешний ключ в таблице задач на таблицу организаций. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.11.2019, 09:59 |
|
Поиск (нечеткий) в колонке по содержимому
|
|||
---|---|---|---|
#18+
проходил мимо..., почитайте сначала про "Расстояние Левенштейна" и другие сравнения строк , а потом про их имплементации в Oracle. Но по хорошему это должна быть только разовая акция по поиску такой фигни, а сначала нужно навести порядок в архитектуре приложения. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.11.2019, 11:27 |
|
|
start [/forum/topic.php?fid=52&msg=39883624&tid=1881911]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
54ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
others: | 288ms |
total: | 436ms |
0 / 0 |