Гость
Форумы / Delphi [игнор отключен] [закрыт для гостей] / Найти совпадения в строках / 11 сообщений из 11, страница 1 из 1
04.12.2021, 10:46
    #40117316
LMag
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
Добрый день, у меня такой вопрос

Как найти в строке , похожие слова, ну например

I'm dixon
I am dixon
Im dixon

чтоб выводилась, строка dixon

У меня есть фиксированный список представлений: (I'm, I am, my name is)

Спасибо
...
Рейтинг: 0 / 0
04.12.2021, 12:44
    #40117326
DarkMaster
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
LMag,

Ну и ищи свои i'm, вырезай, а все остальное выводи.
...
Рейтинг: 0 / 0
04.12.2021, 12:48
    #40117327
LMag
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
DarkMaster
LMag,

Ну и ищи свои i'm, вырезай, а все остальное выводи.



В смысле вырезай и ищи, там получается нужно искать похожие слова , допустим тот же самый, [ I'm, Im, I am ] они похожие, а в массиве фраз у меня нет Im
...
Рейтинг: 0 / 0
04.12.2021, 13:10
    #40117331
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
LMagКак найти в строке , похожие слова

Рубишь строку на слова, сравниваешь дистанцию Левенштейна между ними.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
04.12.2021, 13:21
    #40117334
LMag
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
Dimitry Sibiryakov

LMagКак найти в строке , похожие слова

Рубишь строку на слова, сравниваешь дистанцию Левенштейна между ними.


Я не понял "сравниваешь дистанцию Левенштейна", как это?
Если не трудно кусочек кода...
Спасибо
...
Рейтинг: 0 / 0
04.12.2021, 13:45
    #40117342
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
LMagЯ не понял "сравниваешь дистанцию Левенштейна", как это?

https://ru.wikipedia.org/wiki/Расстояние_Левенштейна
и для неспособных дочитать до конца страницы:
https://ru.wikibooks.org/wiki/Реализации_алгоритмов/Расстояние_Левенштейна
...
Рейтинг: 0 / 0
05.12.2021, 00:26
    #40117401
white_nigger
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
Непонятно, нужно ли ему точное совпадение или симилярити. Возможно левенштейн ему излишен будет. Возможно больше подойдут алгоритмы lcs группы совместно с вырезанием найденного
...
Рейтинг: 0 / 0
06.12.2021, 13:47
    #40117754
LMag
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
Вообще смысл задачи, следующий.

Например даны строки:

- Hi, I'm Carter => Carter
- My name is Rod Stewart => Rod Stewart
-Nice to meet you, im dixon => dixon
-im Carter Stewart Smith, how are you? => Carter Stewart Smith

Даны так же
Списки возможных имен {Rod, Stewart, Carter, Dixon, Marshall, Smith. Walker}
Список фраз представлений {I'm, I am, my name is}

Нужно вытащить из строк только имена.

Хочу понять какой алгоритм использовать, пока вырезаю фразы представлений из строки
...
Рейтинг: 0 / 0
06.12.2021, 13:49
    #40117757
LMag
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
LMag,

Вот код программы.

Код: pascal
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
program ParseMessages;

{$APPTYPE CONSOLE}

{$R *.res}

uses
  System.SysUtils, System.AnsiStrings, System.StrUtils;

const
  // Исходный перечень сообщений
  C_MESSAGE_STRINGS: array [0..11] of string = (
    'Hi, I''m Carter',
    'My name is rod Stewart',
    'Nice to meet you, im dixon...',
    'I am smith walker it''s nice to meet you',
    'im Carter Stewart Smith, how are you doing?',
    'There''s no name here',
    'Hi I''m late for an interview',
    'I am a retail manager',
    'I''m Dixon marshall and I have a question.',
    'Where is Rod Stewart and his dog?',
    'Hi my name is Dixon Walker, where can I buy these shoes?',
    'I am hungry but I want to see Marshall first.'
  );

const S_NAME : array [0..6] of string = (
      'Rod',
      'Stewart',
      'Carter',
      'Dixon',
      'Marshall',
      'Smith',
      'Walker'
 );

const S_FRAZA : array [0..2] of string = ('I''m', 'I am', 'my name is');


function GetName(a_str:string):string;
 var I:Integer;
     tmp:String;
     d:boolean;
 begin
  //провыеряем совпадение по фразам
  d := false;
  for I:= Low(S_FRAZA) to High(S_FRAZA) do begin
      tmp := S_FRAZA[I];
      if pos(#39, tmp) > 0 then begin
          delete(tmp, pos(#39, tmp), 1 );
          if ( pos( AnsiLowerCase(tmp), AnsiLowerCase(a_str)) > 0 ) then begin
              delete(a_str, 1, pos( AnsiLowerCase(tmp), AnsiLowerCase(a_str))+Length(tmp) );
              d:=true;
          end;
      end;
      if (pos( AnsiLowerCase(S_FRAZA[I]), AnsiLowerCase(a_str)) > 0) then begin
         if not d then delete(a_str, 1, pos( AnsiLowerCase(S_FRAZA[I]), AnsiLowerCase(a_str))+Length(S_FRAZA[I]) );
      end;
   end;

   //проверяем имена, из словаря


   result := a_str;
 end;

var
  messageStr: string;
begin
  // Обходим сообщения из исходного перечня и выводим результат их разбора
  for messageStr in C_MESSAGE_STRINGS do
  begin
    Writeln(Format('%0:s => %1:s', [messageStr, GetName(messageStr)]));
  end;
  Readln;
end.
...
Рейтинг: 0 / 0
06.12.2021, 14:20
    #40117781
white_nigger
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
Если это реальная задача, то лучшие результаты дала бы нейросеть, обученная на реальных примерах (например электронной корреспонденции). Хотя в ней имя чаще фигурирует в подписи. Ну или всё ручками ручками, примерно как сейчас. Выделяешь все возможные паттерны представления и ищешь. Со временем пополняя базу паттернов)) (в роли нейросети - программист)
...
Рейтинг: 0 / 0
06.12.2021, 14:47
    #40117793
Мимопроходящий
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Найти совпадения в строках
06.12.2021 14:20, white_nigger пишет:
> (в роли нейросети - программист)

индус!
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Форумы / Delphi [игнор отключен] [закрыт для гостей] / Найти совпадения в строках / 11 сообщений из 11, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]