|
проверка не по символьно а по "словам"
|
|||
---|---|---|---|
#18+
У кого найдётся идея чтоб этот алгоритм на джава сделать так чтоб он проверял не по символам а по словам? Как это реализовать в этом классе: Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56.
... |
|||
:
Нравится:
Не нравится:
|
|||
22.11.2019, 15:09 |
|
проверка не по символьно а по "словам"
|
|||
---|---|---|---|
#18+
Если я правильно понял задачу, надо строки преобразовать в массив строк, например, используя split. А потом сверять размеры массивов ... |
|||
:
Нравится:
Не нравится:
|
|||
22.11.2019, 15:12 |
|
проверка не по символьно а по "словам"
|
|||
---|---|---|---|
#18+
Павел Гужанов, абсолютно верно поняли! ... |
|||
:
Нравится:
Не нравится:
|
|||
22.11.2019, 15:16 |
|
проверка не по символьно а по "словам"
|
|||
---|---|---|---|
#18+
Павел Гужанов, Сори, нет не правильно поняли, надо алгоритм переделать так чтобы строки сверялись не по символам а по словам ... |
|||
:
Нравится:
Не нравится:
|
|||
22.11.2019, 15:20 |
|
проверка не по символьно а по "словам"
|
|||
---|---|---|---|
#18+
Если это алгоритм Левеншнтейна тогда он должен мерять расстояние между словами. Типа Код: java 1.
Должен вернуть 1 т.к. ровно 1 буква поменялась. Но чтобы Левин работал для предложений то надо соотв. побить предложение на слова и каждое из них подавать на вход отдельно. И тогда функция должна иметь примерно такой вид. Код: java 1.
И вернет вектор параметров Код: java 1.
который в свою очередь надо уже как-то по другому сравнивать. Среднее квадратическое например. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.11.2019, 15:50 |
|
проверка не по символьно а по "словам"
|
|||
---|---|---|---|
#18+
Каждое слово в алгоритме левенштейна это вектор со значениями. В данном случае нужно пронумеровать все слова из строк складывая их в hashmap назначая по increment значение (по сути значение вектора) Из каждой строки строим вектор (по сути то же слово) а накидываем на алгоритм левенштейна тот же apache commons Можно по сути сэмулировать и вместо int value значения вектора выдавать как char, благо их там много(надеюсь уникальных слов в датасете сильно меньше чем чем вариантов char). ... |
|||
:
Нравится:
Не нравится:
|
|||
22.11.2019, 16:04 |
|
|
start [/forum/topic.php?fid=59&fpage=20&tid=2121015]: |
0ms |
get settings: |
11ms |
get forum list: |
6ms |
check forum access: |
1ms |
check topic access: |
1ms |
track hit: |
146ms |
get topic data: |
7ms |
get forum data: |
1ms |
get page messages: |
168ms |
get tp. blocked users: |
2ms |
others: | 317ms |
total: | 660ms |
0 / 0 |