Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Поиск частичных совпадений help / 8 сообщений из 8, страница 1 из 1
14.10.2018, 12:40
    #39717233
Владимир09
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Всем доброго дня)
Столкнулся с проблемой выборки частичных совпадений в разных таблицах.
А именно: есть две таблицы
В первой есть столбец "фио" и столбец с "дата рождения1" назовем эту таблицу table1
Во второй столбцы "фамлия" и "имя отчество" и "дата рождения2" назовем table2
Надо сравнить наиболее близкие совпадения.
Я беру соединяю
select *
from table1 a full join table2 b on a."дата рождения1"=b."дата рождения2"
where "фио"+"дата рождения1"="фамлия"+"имя отчество"+"дата рождения2"

Но при таком запросе выдаются только полные совпадения, а как сделать, чтобы выдавал также те совпадения, в которых различия в 2,3 или 5 символов
...
Рейтинг: 0 / 0
14.10.2018, 13:06
    #39717238
aleks222
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
"еще" и "ишо" - скока символов различается?
...
Рейтинг: 0 / 0
14.10.2018, 13:16
    #39717239
Владимир09
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Два символа
...
Рейтинг: 0 / 0
14.10.2018, 13:16
    #39717241
Владимир09
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Три даже
...
Рейтинг: 0 / 0
14.10.2018, 14:49
    #39717255
Владислав Колосов
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Владимир09,

в таких ситуациях принято рекомендовать использование алгоритма Левенштейна, но это не таблетка от всех болезней, т.к. тут дело в семантическом анализе. А это не чихнуть задача.
...
Рейтинг: 0 / 0
15.10.2018, 11:39
    #39717466
Владимир Затуливетер
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Делали такое на базе алгоритма Левенштейна.
Для этого сделали сборку clr с функциями которые использовали при сравнеии, tsql реализация была тормознутей значительно.
Но имейте в виду, что такие запросы практически не оптимизируются, придется сканить таблицы.
И результат не 100% как понимаете, всегда будут записи которые не будут обработаны таким подходом.
...
Рейтинг: 0 / 0
15.10.2018, 13:12
    #39717568
Alexander Us
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Владимир09,

А сколько примерно строк в каждой из таблиц?
...
Рейтинг: 0 / 0
15.10.2018, 19:58
    #39717828
PizzaPizza
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Поиск частичных совпадений help
Владимир09,

Правильно ли я понимаю, что "различия в 2,3 или 5 символов" в вашем случае не применимы к датам, и, если мы говорим про русский язык, к именам и частично к отчествам, и, по сути, вам нужно искать сочетание даты рождения + ИО и некая фуззи лождик на фамилию?
...
Рейтинг: 0 / 0
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Поиск частичных совпадений help / 8 сообщений из 8, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]