|
|
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
Добрый день всем! Уважаемые пользователи, подскажите пожалуйста, возможно ли решить такую задачу: Есть три базы данных (на разных серваках), с полностью одинаковой структурой, только отличаются данными. Данные могут быть неправдоподобными и неполными на разных БД Вопрос: Как система поймет что пришли данные объекта из другого сервера Пример: Условие: на обеих БД имеются данные На сервере №1 данные: Название компании: ОАО "КШМ" Месторасположение: Россия Филиалы: ООО "РУсь", ООО "Защита" На сервере №2 данные: Название компании: ОАО "КШМ" Месторасположение: Россия Филиал: На сервере №3 данные: Название компании: "не знаю" Месторасположение: Россия Филиал: ООО "Эльбрус", ООО "Защита" Пользователь (сервер №1) передал данные на сервак №2 и 3 Как система на сервере №2, и/или №3 ПО КАКОМУ КЛЮЧУ? поймет что эти данные о ОАО "КШМ" Условие: Система ведет учет компаний-конкурентов и их дочек. Данные из одного сервера на другой отправляются пользователем вручную. Автоматически нельзя. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 16:22 |
|
||
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
kirumitkaКак система на сервере №2, и/или №3 ПО КАКОМУ КЛЮЧУ? А в чём проблема использовать стандартную конкатенацию "Id источника || локальный Id записи"? Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 16:34 |
|
||
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
kirumitka, Сопоставление неполной информации - это непростая задача, и к БД она имеет слабое отношение. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 16:47 |
|
||
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
kirumitkaпоймет что эти данные о ОАО "КШМ" Впрочем, для такой постановки задачи, ответ "никак, обломись". Такое сопоставление производится исключительно вручную. Лучшее, что можно сделать это подбор вариантов по разным идентификаторам типа ИНН и нечёткому поиску. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 16:49 |
|
||
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
Как вариант - ГУИД. Вероятность совпадения весьма низка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 16:58 |
|
||
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
kirumitkaПользователь (сервер №1) передал данные на сервак №2 и 3 Как система на сервере №2, и/или №3 ПО КАКОМУ КЛЮЧУ? поймет что эти данные о ОАО "КШМ" Вопрос неправильный. Система на серверах 2 и 3 не должна ничего понимать, по одной простой причине: если каждый сервер будет заниматься самодеятельностью, данные гарантированно разъедутся. Скажем, данные приедут по маршруту 1 -> 2, и второй сервер сочтёт их совпадающими; одновременно приедут по маршруту 1 -> 3, и третий сервер сочтёт их различающимися, зато сольёт одну из них с другой записью, здесь не упомянутой. Потом третий сервер отправит что-нибудь на второй, и наступит пипец. Сведение должно осуществляться в одном месте, где есть полные данные. То есть, грубо говоря, сервера 2 и 3 должны отправить свои записи на сервер №1, а оттуда, если прошло отождествление, на сервера 2-3 отправится команда "считать записи #128 и #256 одной записью за #512". kirumitkaпоймет что эти данные о ОАО "КШМ" Система ведет учет компаний-конкурентов и их дочек. Пусть в обязательном порядке вводят ИНН. Узнать его для компании-конкурента вполне несложно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 21:45 |
|
||
|
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
|
|||
|---|---|---|---|
|
#18+
softwarerПусть в обязательном порядке вводят ИНН. + без этого вообще никак. что ИП, что ООО, что других форм юрлиц с одинаковым названием море и даже в одном городе... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 23:00 |
|
||
|
|

start [/forum/topic.php?fid=32&fpage=15&tid=1540329]: |
0ms |
get settings: |
8ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
51ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
43ms |
get tp. blocked users: |
2ms |
| others: | 243ms |
| total: | 378ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...