|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
Помнится был такой алгоритм в Fox'е который умел строить т.н. soundex-индекс, т.е. сходные по звучанию слова, например фамилии, имели один и тот же индекс, однако, насколько я помню он был реализован для английского языка. Хочется найти описание алгоритма построения такого индекса применительно к русскому. На мой взгляд вещь незаменимая при нечетком задании условий поиска. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2002, 16:36 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
а именно звучание тебе критично? я порылся по сусекам и нашел алгоритм похожий на оператор like там мне удалось построить нечто вроде расстояния между цепочками символов (за сколько изменений из одной цепочки можно получить другую) ---- звучание там было до лампочки а так он делает тоже самое при нечетких условиях можно выбирать слова длину цепочки можно задавать получится очень похожие - не очень похожие и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.12.2002, 04:03 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 tchingiz Тоже хочу взглянуть на этот алгоритм. Особенно, если он формальный (т.е. не реализация на каком-то языке программирования). Пожалуйста. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.12.2002, 11:27 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
Блин, да он же в гугле ищется с пол-пинка. Например, тут вот ценная информация the soundex algorithm as described by Donald Knuth in Volume 3 of The Art of Computer Programming. . Книга переведена на русский и ее можно купить или скачать . Что касается варианта для русского языка, то гляньте здесь . ... |
|||
:
Нравится:
Не нравится:
|
|||
05.12.2002, 11:46 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 NNN Супер! Спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.12.2002, 15:42 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 all а Rus000 нас бросил 2 NNN - голова 2 Jimmy - сори пысано клятою мовою скрыптив парадокса - в основном все делается почти перебором (по мотивам алгоритма ветвей и границ)- насколько я помню (это был 95 год) я пытаюсь из одной цепочки символов построить другую за минимальное число некоторых атомарных изменений - это и есть (я не проверял аксиомы, которым функция расстояния должна удовлетворять) нечто вроде функции расстояния. то есть это нечто вроде like с параметром удалености. заворачивать? (в смысле слать?) ---------- TBB очень милостливо нарисовал схему #1 (то есть ту, которая нарисована тобой - из двух вещей первой всегда находится ненужная) , пошел просить его дальше рисовать схему #2. может ее похе@ить вообще? за стандарты спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2002, 04:41 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 NNN по аналогии с ДДТ "мы ведь тоже немножко Россия" -- а я ведь тоже немножко интернет ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2002, 04:47 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 Jimmy а что у тебя за странная тяга к формальным описаниям алгоритмов? хочешь подсуну чего почитать? для себя 10 лет искал ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2002, 07:47 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
Всем - пожалуйста, заходите еще :) > 2 NNN - голова А что голова? Ну болит голова.. Дык пятница :) ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2002, 08:49 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 tchingiz Языков программирования слишком много, в каждом из них допустима множественность решений для одного и того-же алгоритма. А формальный алгоритм - вещь непреходящая. Кинь ссылку, пожалуйста на "что-нибудь почитать" ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2002, 10:32 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
чтение нижеследующего вызывает крепкий и здоровый сон на протяжении 9 часов -------- 1 i.com.ua/~agp1/LIKE.SC - обещанная пародия на like, в этом долбаном парадоксе вызываемые функции имеют доступ к переменным вызывающих функций а так относительно понятно (даже мне через 8 лет) 2 i.com.ua/~agp1/arts/rslintro.tar.qz - (RAISE Specification Language)конструктивная математика с потенциальной бесконечностью, которую можно конвертить в с++ и аду. 3 The RAISE Method Group. The RAISE DEVELOPMENT METHOD. BCS Practitioner Series. Prentice Hall, 1995. Available by ftp from ftp://ftp.iist.unu.edu/pub/RAISE/method_book; 4 i.com.ua/~agp1/peano.tar.gz - как любителю непреходящих ценностей аксиомы пеано для арифметики - на RAISE ---------------------- NNN> а что голова я бы ему пальца в рот не положил бы ---------------------- а вообще меня это борьба за подбор похоже звучащих фамилий умиляет. три месяца назад звоню в бритиш аирвейз поменять дату вылета. эта д... ах какая девушка через 25 минут разговора не может найти меня в списках пассажиров, три раза ей читал фамилию по буквам. оказалась она сделала в ней 5 ошибок. это я не к тому что у меня во рту бананы, это я к тому что этот алгоритм подбора якобы по звучанию отбросит ошибки оператора. а на ангийском вообще написание имеет свое произношение - кнут должен в алгоритм вставить БД из 4 миллиардов фамилий. ---------------- > "После вручения наград обычно подходят с полдесятка человек, чтобы >исправить фамилию в грамоте или похвальном листе. Этому вряд ли можно >помочь," -а меня бритиш аирвейз не наградил :((((((((((((((((((((( ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2002, 11:53 |
|
Алгоритм SOUNDEX
|
|||
---|---|---|---|
#18+
2 NNN - списибо, на первый взгляд как раз то что надо :) относительно алгоритма для английского - их действительно много, а вот про адаптацию к русскому до сих пор не находил, может потому, что плохо искал. tnx. 2 tchingiz - не бросил я, работы много, некогда голову поднять :( ... |
|||
:
Нравится:
Не нравится:
|
|||
10.12.2002, 16:58 |
|
|
start [/forum/topic.php?fid=56&msg=32076207&tid=2017045]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
183ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
53ms |
get tp. blocked users: |
2ms |
others: | 14ms |
total: | 298ms |
0 / 0 |