|
|
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Существует следующая проблема. Есть 2 текстовых файла. В первом файле находится большой по объему текст, а во втором файле перечислены предлоги, союзы, союзные слова и местоимения, которые могут встречаться (а могут и не встречаться) в тексте первого файла. Нужно удалить все совпадающие слова из текста (т.е. все предлоги, союзы, союзные слова и местоимения). Я пытался реализовать это следующим образом: Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 17:52 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Непонятно что на выходе то должно быть? Ваш код крайне неэффективный, я бы делал как-то так - 1) вычитываем файл текста 2) разбиваем его на строки 3) каждую строку разбиваем на слова по пробелу 4) проверяем каждое слово, содержится ли в stop words или нет, если содержится - фильтруем 5) объелиняем все слова обратно в текст ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 20:07 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
забыл никвычитываем файл текстакуда? :) Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 23:30 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
забыл ник, спасибо за ваш ответ! Но мне не совсем понятны некоторые моменты. забыл никНепонятно что на выходе то должно быть? На выходе должен быть текст без предлогов, союзов, союзных слов и местоимений. забыл ник 4) проверяем каждое слово, содержится ли в stop words или нет, если содержится - фильтруем Каким образом их фильтровать? забыл ник 5) объелиняем все слова обратно в текст Как это реализовать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 23:39 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Su-27, grasoff.net привел довольно понятный псевдокод, разбирайтесь. Судя по всему вы в java новичок, поэтому вот пару советов 1) вычитывать файл вам надо через BuferredReader, смотреть здесь - https://www.mkyong.com/java/java-read-a-text-file-line-by-line/ (2 раздел). Если хочется разобраться как это лучше и эффективнее сделать на java 8 то смотреть здесь - https://www.mkyong.com/java8/java-8-stream-read-a-file-line-by-line/ но это более продвинутый левел 2) Чтобы фильтрануть слово вам надо будет реализовать нечто вроде if stopWords.contains(word) skip else add В общем смотрите метод contains у Set 3) Объединять слова можно либо через конкатенацию(лучше так не делать в цикле) либо через объект StringBuilder, нагуглите сами о нем ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 01:28 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
забыл ник, спасибо за ваш ответ! забыл ник 1) вычитывать файл вам надо через BuferredReader, смотреть здесь - https://www.mkyong.com/java/java-read-a-text-file-line-by-line/ (2 раздел). Сделал считывание файла через BuferredReader, как вы и советовали, но возникла следующая проблема: считывается только первое слово в тексте(его заголовок), а как сделать чтобы считывался весь текст? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 16:34 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. не проверял, но должно работать с "полпинка". словарь - "dic.txt", текст для правки - "txt.txt", кодировка UTF-8 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 17:04 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Vurnне проверял, но должно работать с "полпинка". словарь - "dic.txt", текст для правки - "txt.txt", кодировка UTF-8 Жуть какая. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 17:09 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Vurn Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. не проверял, но должно работать с "полпинка". словарь - "dic.txt", текст для правки - "txt.txt", кодировка UTF-8 Vurn, спасибо за ваш ответ! Я проверил, но код работает не так как нужно. Ваша программа удаляет некоторую часть слов. Вот первое предложение из текста: "In the corner of a first-class smoking carriage, Mr. Justice Wargrave, lately retired from the bench, puffed at a cigar and ran an interested eye through the political news in the Times." А вот что выводит программа: "In corner a -cls smokg carriage, Mr. Jtice Wargrave, lely retired bench, puffed a cigar d r terested eye polical s Tis." ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 18:30 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Su-27 Код: java 1. Это как вообще? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 19:16 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
BlazkowiczЭто как вообще?Тип аргумента object . Все ок. Всегда будет false (: ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 19:48 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
UsmanТип аргумента object . Все ок. Всегда будет false (: Спасибо, кэп. Просто не понятно чего этим студент хотел добиться. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 19:57 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Su-27Vurn, спасибо за ваш ответ! Я проверил, но код работает не так как нужно. Ваша программа удаляет некоторую часть слов. Вот первое предложение из текста: "In the corner of a first-class smoking carriage, Mr. Justice Wargrave, lately retired from the bench, puffed at a cigar and ran an interested eye through the political news in the Times." А вот что выводит программа: "In corner a -cls smokg carriage, Mr. Jtice Wargrave, lely retired bench, puffed a cigar d r terested eye polical s Tis." Ошибся в паттерне. Вот правильный паттерн: Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 20:02 |
|
||
|
Как удалить совпадающие слова?
|
|||
|---|---|---|---|
|
#18+
Хехе! Вот еще более правильный паттерн: Код: java 1. 2. 3. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.05.2017, 22:45 |
|
||
|
|

start [/forum/topic.php?fid=59&msg=39448131&tid=2122935]: |
0ms |
get settings: |
9ms |
get forum list: |
19ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
71ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
65ms |
get tp. blocked users: |
2ms |
| others: | 229ms |
| total: | 419ms |

| 0 / 0 |
