|
как найти дубликаты в таблице
|
|||
---|---|---|---|
#18+
Привет, форумчане. Я не блондинка, но вопрос и правда глупый. Есть таблица на N записей: users часть записей при интеграции с внешними сервисами задвоилась, причем весьма паскудно: все поля разные, разница только в яхыке записей id | name | Last_name 1 |Ivan | Ivanov 2 |Иван | Иванов нужно все такие дубли найти, и объединить под наименьшим ID Help!!! ... |
|||
:
Нравится:
Не нравится:
|
|||
28.05.2019, 15:21 |
|
как найти дубликаты в таблице
|
|||
---|---|---|---|
#18+
IMHO сперва надо каким-то образом привести имена к одному виду. Возможно, для этой цели подойдет вспомогательная таблица с соответствием вида "Ivanov" -> "Иванов". С этим вопросом, вроде, понятно. Только следует иметь в виду, что транслитерация штука весьма неоднозначная и есть смысл сперва собрать уникальные значения. Вот с остальной частью задачи не понятно вообще ничего. oksana1ruчасть записей при интеграции с внешними сервисами задвоиласьВозможно ли по какому-то признаку определить, какие записи задвоились, а какие нет? oksana1ruвсе поля разные, разница только в яхыке записейoksana1ruнужно все такие дубли найти, и объединить под наименьшим ID Вероятно, есть смысл привести примеры записей с разными полями, приоритеты и/или алгоритм использования значений полей при объединении и желаемый результат. Так понимаю, на выходе должна получиться новая таблица. PS: Очень сильно подозреваю, что вручную перелопатить пару-тройку сотен записей будет проще и быстрее, чем составить надежный алгоритм. ... |
|||
:
Нравится:
Не нравится:
|
|||
28.05.2019, 20:51 |
|
|
start [/forum/topic.php?fid=47&fpage=35&tid=1829126]: |
0ms |
get settings: |
7ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
40ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
39ms |
get tp. blocked users: |
2ms |
others: | 303ms |
total: | 425ms |
0 / 0 |