powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
8 сообщений из 8, страница 1 из 1
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237570
kirumitka
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Добрый день всем!

Уважаемые пользователи, подскажите пожалуйста, возможно ли решить такую задачу:

Есть три базы данных (на разных серваках), с полностью одинаковой структурой, только отличаются данными.
Данные могут быть неправдоподобными и неполными на разных БД

Вопрос: Как система поймет что пришли данные объекта из другого сервера

Пример:

Условие: на обеих БД имеются данные

На сервере №1 данные:
Название компании: ОАО "КШМ"
Месторасположение: Россия
Филиалы: ООО "РУсь", ООО "Защита"

На сервере №2 данные:
Название компании: ОАО "КШМ"
Месторасположение: Россия
Филиал:

На сервере №3 данные:
Название компании: "не знаю"
Месторасположение: Россия
Филиал: ООО "Эльбрус", ООО "Защита"

Пользователь (сервер №1) передал данные на сервак №2 и 3

Как система на сервере №2, и/или №3 ПО КАКОМУ КЛЮЧУ? поймет что эти данные о ОАО "КШМ"





Условие:

Система ведет учет компаний-конкурентов и их дочек.
Данные из одного сервера на другой отправляются пользователем вручную. Автоматически нельзя.
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237579
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kirumitkaКак система на сервере №2, и/или №3 ПО КАКОМУ КЛЮЧУ?
А в чём проблема использовать стандартную конкатенацию "Id источника || локальный Id записи"?
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237591
Кот Матроскин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kirumitka,

Сопоставление неполной информации - это непростая задача, и к БД она имеет слабое отношение.
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237592
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kirumitkaпоймет что эти данные о ОАО "КШМ"
Впрочем, для такой постановки задачи, ответ "никак, обломись". Такое сопоставление
производится исключительно вручную. Лучшее, что можно сделать это подбор вариантов по
разным идентификаторам типа ИНН и нечёткому поиску.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237603
LSV
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как вариант - ГУИД. Вероятность совпадения весьма низка.
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237777
Фотография softwarer
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kirumitkaПользователь (сервер №1) передал данные на сервак №2 и 3
Как система на сервере №2, и/или №3 ПО КАКОМУ КЛЮЧУ? поймет что эти данные о ОАО "КШМ"
Вопрос неправильный. Система на серверах 2 и 3 не должна ничего понимать, по одной простой причине: если каждый сервер будет заниматься самодеятельностью, данные гарантированно разъедутся. Скажем, данные приедут по маршруту 1 -> 2, и второй сервер сочтёт их совпадающими; одновременно приедут по маршруту 1 -> 3, и третий сервер сочтёт их различающимися, зато сольёт одну из них с другой записью, здесь не упомянутой. Потом третий сервер отправит что-нибудь на второй, и наступит пипец.

Сведение должно осуществляться в одном месте, где есть полные данные. То есть, грубо говоря, сервера 2 и 3 должны отправить свои записи на сервер №1, а оттуда, если прошло отождествление, на сервера 2-3 отправится команда "считать записи #128 и #256 одной записью за #512".

kirumitkaпоймет что эти данные о ОАО "КШМ"
Система ведет учет компаний-конкурентов и их дочек.
Пусть в обязательном порядке вводят ИНН. Узнать его для компании-конкурента вполне несложно.
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39237791
Фотография vmag
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
softwarerПусть в обязательном порядке вводят ИНН.

+

без этого вообще никак. что ИП, что ООО, что других форм юрлиц с одинаковым названием море и даже в одном городе...
...
Рейтинг: 0 / 0
По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
    #39250138
Vakrill
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
предлагаю вам исмользовать Id источника || локальный Id записи
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / По какому ключу идентифицировать объекты полученные из разных источников? (слияние данных)
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]