powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Алгоритм SOUNDEX
13 сообщений из 13, страница 1 из 1
Алгоритм SOUNDEX
    #32074738
Rus000
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Помнится был такой алгоритм в Fox'е который умел строить т.н. soundex-индекс, т.е. сходные по звучанию слова, например фамилии, имели один и тот же индекс, однако, насколько я помню он был реализован для английского языка. Хочется найти описание алгоритма построения такого индекса применительно к русскому. На мой взгляд вещь незаменимая при нечетком задании условий поиска.
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32075852
Фотография tchingiz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
а именно звучание тебе критично?
я порылся по сусекам и нашел алгоритм похожий на оператор like
там мне удалось построить нечто вроде расстояния между цепочками
символов (за сколько изменений из одной цепочки можно получить другую)
----
звучание там было до лампочки
а так он делает тоже самое при нечетких условиях можно выбирать слова
длину цепочки можно задавать
получится очень похожие - не очень похожие и т.д.
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32075976
Фотография Jimmy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 tchingiz

Тоже хочу взглянуть на этот алгоритм. Особенно, если он формальный (т.е. не реализация на каком-то языке программирования).
Пожалуйста.
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32075995
Фотография NNN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Блин, да он же в гугле ищется с пол-пинка. Например, тут вот ценная информация the soundex algorithm as described by Donald Knuth in Volume 3 of The Art of Computer Programming. . Книга переведена на русский и ее можно купить или скачать . Что касается варианта для русского языка, то гляньте здесь .
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076207
Фотография Jimmy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 NNN

Супер! Спасибо.
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076468
Фотография tchingiz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 all
а Rus000 нас бросил

2 NNN - голова

2 Jimmy - сори пысано клятою мовою скрыптив парадокса -

в основном все делается почти перебором (по мотивам алгоритма ветвей и границ)- насколько я помню (это был 95 год)

я пытаюсь из одной цепочки символов построить другую за минимальное число
некоторых атомарных изменений - это и есть (я не проверял аксиомы,
которым функция расстояния должна удовлетворять) нечто вроде функции расстояния.
то есть это нечто вроде like с параметром удалености.
заворачивать? (в смысле слать?)
----------
TBB очень милостливо нарисовал схему #1

(то есть ту, которая нарисована
тобой - из двух вещей первой всегда находится ненужная)
, пошел просить его дальше рисовать схему #2.
может ее похе@ить вообще?


за стандарты спасибо
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076469
Фотография tchingiz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 NNN
по аналогии с ДДТ
"мы ведь тоже немножко Россия"

--

а я ведь тоже немножко интернет
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076485
Фотография tchingiz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Jimmy
а что у тебя за странная тяга к формальным описаниям алгоритмов?
хочешь подсуну чего почитать? для себя 10 лет искал
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076495
Фотография NNN
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Всем - пожалуйста, заходите еще :)

> 2 NNN - голова

А что голова? Ну болит голова.. Дык пятница :)
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076560
Фотография Jimmy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 tchingiz
Языков программирования слишком много, в каждом из них допустима множественность решений для одного и того-же алгоритма. А формальный алгоритм - вещь непреходящая.
Кинь ссылку, пожалуйста на "что-нибудь почитать"
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32076619
Фотография tchingiz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
чтение нижеследующего вызывает крепкий и здоровый сон на протяжении
9 часов
--------
1
i.com.ua/~agp1/LIKE.SC - обещанная пародия на like, в этом долбаном парадоксе
вызываемые функции имеют доступ к переменным вызывающих функций
а так относительно понятно (даже мне через 8 лет)
2
i.com.ua/~agp1/arts/rslintro.tar.qz - (RAISE Specification Language)конструктивная математика с потенциальной
бесконечностью, которую можно конвертить в с++ и аду.
3

The RAISE Method Group.
The RAISE DEVELOPMENT METHOD.
BCS Practitioner Series. Prentice Hall, 1995. Available by ftp
from ftp://ftp.iist.unu.edu/pub/RAISE/method_book;
4
i.com.ua/~agp1/peano.tar.gz -
как любителю непреходящих ценностей аксиомы пеано для арифметики -
на RAISE

----------------------
NNN> а что голова
я бы ему пальца в рот не положил бы
----------------------
а вообще меня это борьба за подбор похоже звучащих фамилий умиляет.
три месяца назад звоню в бритиш аирвейз поменять дату вылета.
эта д... ах какая девушка через 25 минут разговора не может найти меня
в списках пассажиров, три раза ей читал фамилию по буквам.
оказалась она сделала в ней 5 ошибок. это я не к тому что у меня во рту
бананы, это я к тому что этот алгоритм подбора якобы по звучанию отбросит ошибки оператора.

а на ангийском вообще написание имеет свое произношение -
кнут должен в алгоритм вставить БД из 4 миллиардов фамилий.
----------------

> "После вручения наград обычно подходят с полдесятка человек, чтобы

>исправить фамилию в грамоте или похвальном листе. Этому вряд ли можно

>помочь,"

-а меня бритиш аирвейз не наградил :(((((((((((((((((((((
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32078051
Rus000
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
2 NNN - списибо, на первый взгляд как раз то что надо :)
относительно алгоритма для английского - их действительно много, а вот про адаптацию к русскому до сих пор не находил, может потому, что плохо искал. tnx.

2 tchingiz - не бросил я, работы много, некогда голову поднять :(
...
Рейтинг: 0 / 0
Алгоритм SOUNDEX
    #32078227
Фотография tchingiz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Rus000
повезло тебе
успехов в труде
...
Рейтинг: 0 / 0
13 сообщений из 13, страница 1 из 1
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Алгоритм SOUNDEX
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]