|
|
|
Формула для utl_match.edit_distance_similarity
|
|||
|---|---|---|---|
|
#18+
Всем привет! На входе в java-метод есть 2 слова и уже посчитанное расстояние Левенштейна. По этим данным надо посчитать похожесть в процентах ( как в utl_match.edit_distance_similarity ). Не могу подобрать формулу, может кто сталкивался? Или таких входных данных недостаточно? Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. Заранее благодарен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.10.2017, 13:31 |
|
||
|
Формула для utl_match.edit_distance_similarity
|
|||
|---|---|---|---|
|
#18+
Да ну, не? Код: plsql 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.10.2017, 14:04 |
|
||
|
Формула для utl_match.edit_distance_similarity
|
|||
|---|---|---|---|
|
#18+
K790не? Код: plsql 1. Не. Код: plsql 1. 2. 3. 4. 5. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.10.2017, 14:43 |
|
||
|
Формула для utl_match.edit_distance_similarity
|
|||
|---|---|---|---|
|
#18+
Для мультибайта часть байтов неявно совпадает. В utf-8 сравнение одинаковых букв даст 2 единицы совпадения, большинства разных букв даст совпадение одного из двух байтов по первому байту. В случае "Б" и "ё" по только второму. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.10.2017, 16:40 |
|
||
|
Формула для utl_match.edit_distance_similarity
|
|||
|---|---|---|---|
|
#18+
В общем дело было в юникоде. Как удалось выяснить экпериментальным путем, в родной формуле берутся длины строк в байтах: Код: plsql 1. Как следствие - отличие в 4 русских буквы весит в % столько же, сколько в 2 английских при равной длине слов, что не радует. Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.10.2017, 16:55 |
|
||
|
|

start [/forum/topic.php?fid=52&msg=39534856&tid=1885126]: |
0ms |
get settings: |
8ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
158ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
43ms |
get tp. blocked users: |
1ms |
| others: | 229ms |
| total: | 472ms |

| 0 / 0 |
