
Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
08.06.2011, 18:54
|
|||
|---|---|---|---|
|
|||
Задача: поиск записей одинаковых по смыслу, но разных по форме записи. |
|||
|
#18+
Добрый день. Мне нужно найти область науки о базах данных занимающююся этой проблематикой (описание проблемы ниже). Как данная проблема правильно называется в академических кругах, под каким названием она упоминается в литературе. О конкретных публикациях\книгах\алгоритмах я даже не мечтаю ибо область оч спецефическая. Проблема формулируется так: Есть несколько БД информация в которых (в следствии разных её источников) записана по-разному т.е. в другом формате или просто с ошибкой, а может быть даже и на транслите или с частичной заменой букв цифрами. Нужно эти базы данных свести воедино т.е. уствновить соответсвие между инфой записанной по-разному. Например: есть три БД - в одной БД предприятие числится как "ОАО Укртелеком", приобрело "5" едениц продукции. - во второй числится как "Отркрытое Акционерное Общество Укрт3лек0м", приобрело "3" ед. продукции - в третей числится как "OAO Ukrtelekom", приобрело "2" ед. прод. А после анализа в новой БД должно быть "ОАО Укртелеком", приобрело "10" (5+2+3) ед. прод. Пожалуйста, дорогие друзья, помогите понять где искать инфу. Пишу диплом, это одна из проблемных областей, сроки горят, а я даже не представляю куда копать... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
08.06.2011, 19:10
|
|||
|---|---|---|---|
|
|||
Задача: поиск записей одинаковых по смыслу, но разных по форме записи. |
|||
|
#18+
Mental_ForceДобрый день. Мне нужно найти область науки о базах данных занимающююся этой проблематикой (описание проблемы ниже). Как данная проблема правильно называется в академических кругах, под каким названием она упоминается в литературе. О конкретных публикациях\книгах\алгоритмах я даже не мечтаю ибо область оч спецефическая. ... Mental_Force, тута в основном - практики :) но "отталкнутся", можно отсюда - поиск в частности - Нечеткое сравнение зы aleks2Хе-хе... тута не в реалиазации проблемы - тута ИДЕЯ алгоритма нужна. А идеи - нема. Как придумаете - шейте кошелек под нобелевку. +1 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
08.06.2011, 22:06
|
|||
|---|---|---|---|
|
|||
Задача: поиск записей одинаковых по смыслу, но разных по форме записи. |
|||
|
#18+
Спасибо большое за ответ друг, я посмотрю может что-то окажется полезным. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
08.06.2011, 23:34
|
|||
|---|---|---|---|
|
|||
Задача: поиск записей одинаковых по смыслу, но разных по форме записи. |
|||
|
#18+
В сторону BI (Business Intelligence) продуктов, а более конкретно ETL, Data Mining, Алгоритмы Fuzzy Logic. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
09.06.2011, 10:56
|
|||
|---|---|---|---|
Задача: поиск записей одинаковых по смыслу, но разных по форме записи. |
|||
|
#18+
Так как написано у ТС, без мастер-справочника и таблиц маппинга не обойтись. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
16.06.2011, 13:12
|
|||
|---|---|---|---|
|
|||
Задача: поиск записей одинаковых по смыслу, но разных по форме записи. |
|||
|
#18+
Фух, сдал. Хочу от души поблагодарить всех неравнодушных людей, кто не прошел мимо и указал мне верный путь. Знаю, это выглядит не очень серьезно что я не знал даже с чего начать, просто как типичный идиот откладывал до последнего, и фактически за 7 дней сделал то что надо было делать несколько месяцев... Итого, что мы имеем? Оценку - отлично и начальные расстройства личности по причине полного отсутствия сна. Плохо это или хорошо решу когда проснусь... Большое спасибо за консультацию, вы чудесные, отзывчивые люди! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=32&tablet=1&tid=1542118]: |
0ms |
get settings: |
5ms |
get forum list: |
11ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
145ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
28ms |
get tp. blocked users: |
1ms |
| others: | 237ms |
| total: | 440ms |

| 0 / 0 |
