powered by simpleCommunicator - 2.0.50     © 2025 Programmizd 02
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Сравнение текстов
14 сообщений из 14, страница 1 из 1
Сравнение текстов
    #39865015
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как решать задачу, для простоты типа такой:

В базе есть таблица с текстовыми полями, хотелсь бы вытащив запись в клиентское приложение дать возможность
"Найти похожие" и найти скажем 10 похожих(?) от самого похожего до менее.

Вопрос:
как сравнивать тексты, в предположении, что они на одном языке?

Пробовал SQL Server Semanitc statistics, как-то похоже на то,что надо, но это статистика, скажем сделал две записи с абсолютно одинаковыми текстами, так оно нашло другие "похожие", а 1=1 не нашло.
Возможно есть методы лучше.
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865028
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
"Похожие" - понятие относительное - приведи примеры похожих.
У меня есть один алгоритм, но смущает то, что ты упомянул язык.
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865037
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
- Товарищи курсанты, ваши фамилии?
- Иванов, Петров, Сидоров!
- Братья что ли?
- Никак нет, однофамильцы!
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865041
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Shocker.Pro"Похожие" - понятие относительное - приведи примеры похожих.
У меня есть один алгоритм, но смущает то, что ты упомянул язык.

Я так понимаю, что без языка никак, с точки зрения юзера.
Точнее, похожими могут быть тексты в одном языке. Майкрософт реализовал свой Semantic Search тоже указывая для каких языков.

Вот здесь мэйл.ру рассказывает о своем подходе

Применение сиамских нейросетей в поиске
https://habr.com/ru/company/mailru/blog/468075/

Но мне надо без кликов и т.д. просто находить похожие тексты по каким-о критериям. Читал, что конвертируют текст(слова) в векторы и далее сравнивают, когда надо найти. Расстояние между векторами и будет степень похожести.

Вот и пытаюсь найти алгоритм, идею, на чем остановиться.
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865047
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Повторяю - приведи примеры похожих текстов по твоему мнению
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865049
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Shocker.ProПовторяю - приведи примеры похожих текстов по твоему мнению

В общей формулировке так, как MS пишет:

Returns a table of zero, one, or more rows of key phrases that are common across two documents (a source document and a matched document) whose content is semantically similar .
https://docs.microsoft.com/en-us/sql/relational-databases/system-functions/semanticsimilaritydetailstable-transact-sql?view=sql-server-2017

Но, я писал выше, у них сделано не совсем ясно как, странно.
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865060
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Странно, я, как будто бы плохо пишу по-русски


Я делал алгоритм для таких вещей

Колесные диски 6x15 4/100/45/54,1 NEXT NX-015 Silver штамп.
Штампованный диск NEXT NX-015 6x15 4x100 ET45.0 D54.1 Silver
Диск Next NX-015 6x15/4x100 ЕТ45 D54,1 Sil
Колесный диск Next NX-015 6 \R15 4x100 ET45.0 D54.1 S

Но что тебе нужно сравнивать ты упорно скрываешь. Ну как хочешь.
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865067
Roman Mejtes
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SoundEx
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865068
982183
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тут спроси

https://www.dissernet.org/
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865069
982183
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865073
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Roman MejtesSoundEx

Не, что-то типа семантической схожести
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865074
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Shocker.ProСтранно, я, как будто бы плохо пишу по-русски


Я делал алгоритм для таких вещей

Колесные диски 6x15 4/100/45/54,1 NEXT NX-015 Silver штамп.
Штампованный диск NEXT NX-015 6x15 4x100 ET45.0 D54.1 Silver
Диск Next NX-015 6x15/4x100 ЕТ45 D54,1 Sil
Колесный диск Next NX-015 6 \R15 4x100 ET45.0 D54.1 S

Но что тебе нужно сравнивать ты упорно скрываешь. Ну как хочешь.

Вот, да, ближе к такому сравнению.Т.е. по смыслу, может с синонимами.
Не скрываю, "что": тексты разные могут быть, например:

1. в базу в таблицу пишутся новости с разных источников
2. база где-то собранных книг, краткое описание
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865155
Сон Веры Павловны
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Расстояние Левенштейна, не?
...
Рейтинг: 0 / 0
Сравнение текстов
    #39865159
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сон Веры ПавловныРасстояние Левенштейна, не?

Между строками еще куда ни шло, но между текстами вряд ли.
Что-то типа word2vec для набора слов
Конечно, возможны коллизии, но это понятно, типа
"маша мыла раму"
"гурам без мыла машу"
...
Рейтинг: 0 / 0
14 сообщений из 14, страница 1 из 1
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Сравнение текстов
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]