powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Java [игнор отключен] [закрыт для гостей] / java se работа с большими строками - как делать правильно?
2 сообщений из 2, страница 1 из 1
java se работа с большими строками - как делать правильно?
    #39362334
azsx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть такая задача, написанная для себя на fpc которая качает сайты, обрабатывает их, складывает результаты обработки в БД.
Таким образом я:
1. в переменную получаю до 2 гб, тут же обнуляю переменные, начинаю цикл сначала;
2. в переменную получаю до 100 мб, начинаю обрабатывать и результаты обработки иногда до нескольких сотен мб (не считал, так как нет нужды);
3. могу получить ноль в переменную или кодировку отличную от utf 8 (азиаты, исламисты).
В паскале я не мучался с многозадачностью, просто запускаю 30 программ. В день обрабатываю 100+ тысяч сайтов. В java вроде очень рекламируют многозадачность, хочу разделить по потокам.
Как работать с такой обработкой строк (более 100 тысяч, разный размер, куча дополнительных переменных и массивов)? Что учесть заранее? Как работать с кодировками не утф 8?
...
Рейтинг: 0 / 0
java se работа с большими строками - как делать правильно?
    #39362411
Фотография Blazkowicz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Используйте потоки данных вместо строк. Текстовые потоки данных называются Reader и Writer.
Кодировку сайта нужно определять из HTTP заголовков.
Распараллеливать можно через Executors, так как у вас сайты, судя по всему не зависимы.
...
Рейтинг: 0 / 0
2 сообщений из 2, страница 1 из 1
Форумы / Java [игнор отключен] [закрыт для гостей] / java se работа с большими строками - как делать правильно?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]