|
|
|
подскажите, способ сравнения строк, по неточному совпадению.
|
|||
|---|---|---|---|
|
#18+
Здравствуйте! Хотелось бы услышать мнения туташних ученых профессоров. Суть задачи, определение записи в базе, по частичному совпадению строки, например по 3-4 словам. Пример: предположим есть некая таблица Код: sql 1. 2. 3. 4. 5. 6. 7. Вот. И в этой таблице примерно 300тыс записей такой ахинеи (на реальных данных она другая но суть таже). Понадобилось, сувать в нее похожий бред (из другой таблицы), но беда в том, что вот этого some_code в другой таблице нет =(( и его нужно как-то отыскивать в уже имеющихся вариантах кодов. Вопрос, если мне нужно вставить строчку - "черный лучше чем любой другой оттенок серого" как сделать так, чтоб по этой строке, в базе нашлось - "черный лучше чем синий". Левинштайн не подходит(очень уж медленно). Пробовал через SphinxSE но очень уж много мусора. Нужно, что-то наподобие гибрида IN и LIKE. Как показал ручной подбор 3-4 совпадения достаточно точно идентифицируют строчку с нужным кодом. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.02.2020, 08:56 |
|
||
|
подскажите, способ сравнения строк, по неточному совпадению.
|
|||
|---|---|---|---|
|
#18+
Левенштейн тут неприменим. In и Like - тоже. Делишь фразы на слова. Составляешь таблицу уникальных слов. Формируешь таблицу соответствия фраза-слово. Делаешь то же с таблицей для вставки. А затем просто связываешь, считаешь количество совпадений, и оставляешь пары фраз, где это количество совпадений выше требуемого порога. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.02.2020, 10:14 |
|
||
|
подскажите, способ сравнения строк, по неточному совпадению.
|
|||
|---|---|---|---|
|
#18+
Akina, Формируешь таблицу соответствия фраза-слово. А это как? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.02.2020, 13:44 |
|
||
|
подскажите, способ сравнения строк, по неточному совпадению.
|
|||
|---|---|---|---|
|
#18+
Nick-name Формируешь таблицу соответствия фраза-слово. А это как? ИД Слово1винни 2пух 3латентный 4гомосексуалист5мама 6мыла 7раму8черный 9лучше 10чем 11синий12и 13ленин 14такой 15молодой 16юный 17октябрь 18впереди ФразаИДСловоИД111213142526273839310311412413414415416417418 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.02.2020, 14:57 |
|
||
|
|

start [/forum/topic.php?fid=47&msg=39923926&tid=1828752]: |
0ms |
get settings: |
11ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
144ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
48ms |
get tp. blocked users: |
2ms |
| others: | 13ms |
| total: | 251ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...