|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Уважаемые форумчане, здравствуйте. Нужна ваша помощь. Необходимо получить n-ое количество текстовых файлов, сохранить их в папке. И произвести поиск по всем загруженным файлам: выбирается каждая строчка из каждого документа, в котором встречается искомая фраза и формируется итоговый документ, в котором: все найденные строки с указанием документа, в котором они найдены. Как это сделать используя инструментарий java 8, пожалуйста, подскажите ... |
|||
:
Нравится:
Не нравится:
|
|||
17.12.2019, 21:33 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
загнать в lucene или elasticsearch и вызвать поиск ... |
|||
:
Нравится:
Не нравится:
|
|||
17.12.2019, 21:50 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
забыл ник, надо сделать с помощью, будем говорить, стандартных средств Java. Это учебная задача. Files, Path, или как-то так ... |
|||
:
Нравится:
Не нравится:
|
|||
17.12.2019, 22:10 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
GrossmasteR, Делай. В чем вопрос то? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.12.2019, 23:37 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
GrossmasteR Уважаемые форумчане, здравствуйте. Нужна ваша помощь. Необходимо получить n-ое количество текстовых файлов, сохранить их в папке. И произвести поиск по всем загруженным файлам: выбирается каждая строчка из каждого документа, в котором встречается искомая фраза и формируется итоговый документ, в котором: все найденные строки с указанием документа, в котором они найдены. Как это сделать используя инструментарий java 8, пожалуйста, подскажите Скорее всего от тебя хотят увидеть демонстрацию знаний Java Streams. Поищи в интернетах по ключевым словам #Java #Streams #CountWords Если ты сам ничего не хочешь писать или хочешь сыграть в хитрца чтоб за тебя написали - то добро пожаловать в Работу . Там за твои деньги тебе помогут. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 11:51 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
mayton, В принципе наверно можно по старинке циклом перебрать. Как говорят прогеры - "в лоб“. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 12:21 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
На самом деле оно так и будет. Просто глубокое развитие этой идеи - это ForkJoin, MapReduce e.t.c. Можно начать с тупого цикла и закончить Fuzzy Text Search и текстовыми индексами. В целом это на 80% задаче на на сделать а "на поговорить". ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 12:24 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
mayton, Да. Трудолюбивым - делать. Остальным, в работа. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 12:37 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
сначала нужо понять что автор понимает под строчкой - в его задании нужно выделить в отдельный файл все строки с искомой фразой что такое строчка- это может быть и набор символов межу двумя точками и строка в документе напрмер А4 от этого сначала нужно отталкиваться . задание не очень понятное одно дело найти количество повторений искомой фразы в документе и вывести док 1 - совпадений 20 или же к искмой фразе нужно приклеить еще что то -в данном случае строку в которой она лежит а чего не абзац? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:09 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
apb12 что такое строчка- это может быть и набор символов межу двумя точками и строка в документе напрмер А4 У прогеров это символы между \n ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:18 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Еще два варианта. Код: java 1.
Код: java 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:30 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
mayton Еще два варианта. Код: java 1.
Код: java 1.
))) LOL ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:45 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
При чем тут С++? Я говорю просто о стандартах на текстовые файлы. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:46 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
GrossmasteR забыл ник, надо сделать с помощью, будем говорить, стандартных средств Java. Это учебная задача. Files, Path, или как-то так Вам нужно открыть файл, построчно его прочитать проверяя каждую строку на вхождение в нее искомой строки и если есть вхождение, то записать в результирующий файл имя файла и саму строку. Берите документацию, ищите примеры и делайте, задача на работу с файлами и строками. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:47 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
PetroNotC Sharp тут вам не С++ ))) LOL В разных операционных системах кодировка конца строки и перевода на следующую строку отличаются и язык здесь не при чем. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 13:49 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
iOracleDev, Мы о своём. Он знает. Там до сих пор проблема с этим. И топики есть. Тута нет обсуждений по поводу мак это или intel. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 14:00 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
В самом задании уже было противоречие. Текстовый файл и "документ" это очень разные вещи. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 15:12 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
GrossmasteR, 1)Откуда ,как и куда поступают документы для переборки?(Или уже лежат в папке определенной) 2)Список документов в каком формате? (txt,csv,docx) 3) в каком итоговом документе /формате выводится фраза? Дело пахнет парой циклов и Scanner) ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 16:12 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Сергей Лалов, Аффтар уже убежал. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 16:16 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Предлагаю подобные абстрактные темы игнорить в следующий раз. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 16:18 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Сергей Лалов, дело пахнет фишингом. Автор закинул один вопрос в 20 форумов и сидит ловит рыбку. Вряд-ли от него будет диалог. Студенты.... Уже наверное и на тостере и на ответах отметился. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.12.2019, 16:44 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
mayton, Есть один вариант - \n. Всё остальное - старые костыли для матричников и их место в помойке. Срач объявляю закрытым открытым! ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 06:13 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Nixic, Предлагаю не терять время и сразу переходить к холивару \n vs \n\r (\r\n) ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 06:15 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster Есть один вариант - \n. Всё остальное - старые костыли для матричников и их место в помойке. На будущее рекомендую ознакомиться с "каноническим завершением строки" в прикладных интернет-протоколах. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 09:03 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Basil A. Sidorov каноническим завершением строки И что, что там /n/r? /r не нужен. Он лишний. Он избыточен. Это архоизм. Если его убрать выкинуть суть не поменяется. Да и сам http - не очень хорошо спроектированный протокол. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 09:13 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster, "Будьте педантичны в том вы отправляете и толерантны к тому, что вы получаете". Этот несложный принцип обеспечивает более-менее устойчивую работу избыточного "архОизма". P.S. "Плохо спроектирован" - отдельная и уже совсем не смешная тенденция. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 09:18 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Basil A. Sidorov "Будьте педантичны в том вы отправляете и толерантны к тому, что вы получаете". Этот несложный принцип обеспечивает более-менее устойчивую работу избыточного "архОизма". Да с этим проблем нет. Просто страдает чувство прекрасного же! ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 09:20 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster Просто страдает чувство прекрасного же! Эталонный символ завершения строки - ASCII-ZERO. Стандартная библиотека C и сам язык меня поддержат. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 10:30 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Basil A. Sidorov Эталонный символ завершения строки - ASCII-ZERO Это другое. После ascii-zero уже ничего не вставишь и портянку на n строк никуда не передашь. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 10:43 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster, Сумел таки ты зацепить сишников)) ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 11:26 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster После ascii-zero уже ничего не вставишь и портянку на n строк никуда не передашь. P.S. Портянка на n-строк должна читаться до EOF. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 11:27 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Basil A. Sidorov Нет, это именно архаика времён телетайпов. Ты не можешь всунуть в char* кучу \0. Так всё поломается и придётся везде за ним таскать длину. А без \r можно легко обойтись. Basil A. Sidorov Портянка на n-строк должна читаться до EOF. И как её потом обрабатывать? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 12:10 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster И как её потом обрабатывать? Что именно будет разделителем внутри полезной нагрузки - дело десятое. Именно поэтому выбор разделителя не имеет такой важности, которую вы пытаетесь ему приписать. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.12.2019, 13:03 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Basil A. Sidorov Точно так же, как и сейчас обрабатываются буферы: есть массив байт, есть информация о том, где в этом массиве начинаются и заканчиваются полезные данные. Так заканчиваются они на /0 авторЧто именно будет разделителем внутри полезной нагрузки - дело десятое. Ну понятно, что можно сделать /r или вообще /t вместо /n, но не /0. Basil A. Sidorov Именно поэтому выбор разделителя не имеет такой важности, которую вы пытаетесь ему приписать. Имеет хотя бы смысл делать его однобайтовым для начала. такой важности Это вопрос чрезвычайной важности! Я бы даже сказал фундаментальный вопрос! ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2019, 06:59 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster Basil A. Sidorov Точно так же, как и сейчас обрабатываются буферы: есть массив байт, есть информация о том, где в этом массиве начинаются и заканчиваются полезные данные. Как (большой) поток данных будет "разложен" по буферу - зависит от разных факторов. При создании надёжного ПО всё эти факторы следует учесть. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2019, 07:59 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
Basil A. Sidorov Как (большой) поток данных будет "разложен" по буферу - зависит от разных факторов. Вот. А после разбора как это всё будет выглядеть? Для char* \n не важен. В контексте си весь текст - это одна строка. А если там будет куча \0 - это проблемы. Разгребать текст в char**? А кому это надо? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2019, 09:43 |
|
Поиск по текстовым документам на Java
|
|||
---|---|---|---|
#18+
crutchmaster Вот. А после разбора как это всё будет выглядеть? Дополнительные проблемы возникнут тогда, когда размер строки (кратно) превысит размер буфера. Вид маркера конца строки - самая маленькая из всех бед, которые могут возникнуть при работе с (байтовым) буфером. Это вообще не проблема. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2019, 11:32 |
|
|
start [/forum/topic.php?all=1&fid=59&tid=2120976]: |
0ms |
get settings: |
22ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
180ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
624ms |
get tp. blocked users: |
2ms |
others: | 351ms |
total: | 1210ms |
0 / 0 |