Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Интересная задача по анализу строк / 11 сообщений из 11, страница 1 из 1
07.02.2006, 13:35
    #33528564
Турист
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
Помогите, люди добрые.
Мне нужно сравнивать строки и находить между ними логическое соответствие.
Например:
дана строка
"Моторная лодка АШ-51"
нужно определить, что строка
"Лодка мотор. - аш51"
является аналогом первой строки.

Это же "искуственный интелект" какой-то!

Может быть кто-то сталкивался с подобными задачами? Может, есть какие-нибудь специальные алгоритмы?

Заранее благодарен за полезную информацию.
...
Рейтинг: 0 / 0
07.02.2006, 14:05
    #33528644
DocAl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
Для английского языка есть soundex, должен быть у Кнута описан. Есть более усовершенствованые варианты, metaphone, например. Ссылки можно найти тут: http://en.wikipedia.org/wiki/Soundex
...
Рейтинг: 0 / 0
17.02.2006, 00:49
    #33550683
Интересная задача по анализу строк
ТуристПомогите, люди добрые.
Мне нужно сравнивать строки и находить между ними логическое соответствие.
Например:
дана строка
"Моторная лодка АШ-51"
нужно определить, что строка
"Лодка мотор. - аш51"
является аналогом первой строки.

Это же "искуственный интелект" какой-то!

Может быть кто-то сталкивался с подобными задачами? Может, есть какие-нибудь специальные алгоритмы?

Заранее благодарен за полезную информацию.

Regular expressions - и будет тебе счастье !
...
Рейтинг: 0 / 0
17.02.2006, 03:28
    #33550713
DocAl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
Хм? Поделитесь алгоритмом использования тут регэкспа?
...
Рейтинг: 0 / 0
17.02.2006, 17:58
    #33553119
softwarer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
DocAlХм? Поделитесь алгоритмом использования тут регэкспа?
Очень просто. Некто умный пишет регэксп, предназначенный для поиска моторных лодок. Повторить для каждой из 30.000 позиций классификатора. Неопознанное обработать вручную
...
Рейтинг: 0 / 0
17.02.2006, 20:20
    #33553447
DocAl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
Если прайс на английском -- можно просто посадить толпу индусов искать соответствия...
...
Рейтинг: 0 / 0
17.02.2006, 21:16
    #33553476
Tov. Drujba
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
softwarer, ну что Вы неофитов пугаете? :)
Достаточно словаря.
...
Рейтинг: 0 / 0
17.02.2006, 21:23
    #33553479
madgol
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
Можно попробовать нейронные сети, у Base Group Labs был пример по разбору строки адреса(типа улица - дом)
...
Рейтинг: 0 / 0
22.02.2006, 06:16
    #33559690
Mihail R.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
делали подобное:
разбивали обе строки на пары рядом стоящих букв, затем считали количество совпавших пар. в качестве показателя похожести можно полученное число поделить на количество пар в меньшей строке (еще домножить на 100%).

алгоритм несколько раз усовершенствовался, как точно не помню.
но если все пары посчитать и сохранить в отдельной таблице и проиндексировать как надо, то потом можно для заданной строки искать похожие строки за приемлемое время.
все это работало на справочнике контрагентов в 30тыс записей (0.5 - 5 сек.).
...
Рейтинг: 0 / 0
28.02.2006, 13:01
    #33570499
m9
m9
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
ТуристПомогите, люди добрые.
Это же "искуственный интелект" какой-то!
Может быть кто-то сталкивался с подобными задачами? Может, есть какие-нибудь специальные алгоритмы?.

Нейронные сети. Только, как говорится, стоит ли овчинка выделки? Можно поискать готовые движки - например, от Яндекса. А проще всего искать по ключевым словам.

В крайнем случае можно поговорить с начальником и вежливо намекнуть что в случае постановки подобных задач придется увеличить работнику з/п примерно на 2-3 порядка.
...
Рейтинг: 0 / 0
28.02.2006, 13:22
    #33570575
note...
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Интересная задача по анализу строк
возможно проще нанять десяток операторш, которые это все поисправляют за пару недель
...
Рейтинг: 0 / 0
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Интересная задача по анализу строк / 11 сообщений из 11, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]