|
MDM match records
|
|||
---|---|---|---|
#18+
Здравствуйте! В интернете много материалов по теме Master Data Management (MDM). Однако при их изучении лично у меня не складывается цельная картина об алгоритме работы MDM-системы. Например, одной из задач MDM является Идентификация дубликатов объектов мастер-данных . Вот что я понял о решении этой задачи в MDM. Пож-та, покритикуйте, укажите замечания, дополните: Идентификация дубликатов объектов мастер-данных* - процесс выявления дублирующихся объектов мастер-данных путем сопоставления значений их атрибутов по заданным правилам. Перед сопоставлением может осуществляться приведение значений атрибутов к унифицированному и сопоставимому виду (например, обрезка пробелов, спец. символов, знаков препинания, исправление орфографических ошибок, приведение к единому формату, верификация и т.д.). Идентификация дубликатов может выполняться при сохранении объектов в базе с целью проверки, не является ли сохраняемый объект дублем какой-нибудь содержащейся в базе золотой записи ** . Если сохраняемый объект является дублем, то при выполнении определенных условий соответствующая золотая запись обогащается данными сохраняемого объекта. Иначе из сохраняемого объекта создаётся новая золотая запись. * - Мастер-данные: содержат ключевую информацию об объектах предметной области, а также взаимосвязей между ними ** - Золотая запись: единственная, наиболее достоверная, актуальная, целостная, проверенная и непротиворечивая версия каждого объекта мастер-данных в информационной системе («единая версия правды»). Как правило, создание одной золотой записи осуществляется по данным из нескольких источников информации ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2020, 00:48 |
|
MDM match records
|
|||
---|---|---|---|
#18+
Adis Как правило, создание одной золотой записи осуществляется по данным из нескольких источников информации Чаще всего выделяют одно приложение, которое и становится источником правильных данных "по умолчанию". Самый распространенный пример - бухгалтерский софт и CRM. Бухгалтера больше следят о том, чтобы данные контрагентов были корректными - ин инвойсы печатать надо с корректными названиями, НДС номерами и т.д. А продажники в срмке ведут базу "менее аккуратно". Поэтому обычно бухгалтерия объявляется основным источником, а срм - вспомогательным. Разумеется, у бухгалтеров тоже могут быть дубли и прочие проблемы. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2020, 11:47 |
|
MDM match records
|
|||
---|---|---|---|
#18+
Adis Однако при их изучении лично у меня не складывается цельная картина об алгоритме работы MDM-системы. В отрыве от реальных задач, она у вас и не сложится никогда. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2020, 13:43 |
|
MDM match records
|
|||
---|---|---|---|
#18+
Adis Идентификация дубликатов может выполняться при сохранении объектов в базе с целью проверки, не является ли сохраняемый объект дублем какой-нибудь содержащейся в базе золотой записи** . Если сохраняемый объект является дублем, то при выполнении определенных условий соответствующая золотая запись обогащается данными сохраняемого объекта. Иначе из сохраняемого объекта создаётся новая золотая запись. основная задача MDM это для разных автоматизированных систем компании получать оттуда правильную золотую запись сущности. Ну и обогощать/обновлять/исправлять эту золотую запись. Непонятно почему вы это назвали "идентификацией дубликатов". ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2020, 22:49 |
|
MDM match records
|
|||
---|---|---|---|
#18+
hVostt Adis Однако при их изучении лично у меня не складывается цельная картина об алгоритме работы MDM-системы. В отрыве от реальных задач, она у вас и не сложится никогда. Здравствуйте! Не могли бы порекомендовать бесплатную мдм-систему, простую с точки зрения установки на домашний ПК и настройки, на которой можно было бы протестировать примеры данных? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2020, 22:59 |
|
|
start [/forum/topic.php?fid=33&tid=1547097]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
40ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
41ms |
get tp. blocked users: |
1ms |
others: | 291ms |
total: | 418ms |
0 / 0 |