powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Java [игнор отключен] [закрыт для гостей] / Вопрос по ORM
9 сообщений из 59, страница 3 из 3
Вопрос по ORM
    #39185301
Фотография Blazkowicz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lor2Blazkowicz,
я конечно не профессионал а так, любитель, можно вопрос? как часто вам на практике в реале приходилось сортировать листы размером в 4 гига?
Ну, именно сортировать не приходилось. Но была задача чтобы несколько десятков гиг текстовых данных обработать в разумное время (2-4 часа). До реализации дела не дошло, но в теории, главное векторизировать решение. А там, арендовал себе в облаке десяток компов, запулил туда этот файл, запустил обработку, и забирай результат. Решений готовых - масса, нужно только подобрать подходящее под задачу.
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39185304
lor2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Blazkowiczlor2Blazkowicz,
я конечно не профессионал а так, любитель, можно вопрос? как часто вам на практике в реале приходилось сортировать листы размером в 4 гига?
Ну, именно сортировать не приходилось. Но была задача чтобы несколько десятков гиг текстовых данных обработать в разумное время (2-4 часа). До реализации дела не дошло, но в теории, главное векторизировать решение. А там, арендовал себе в облаке десяток компов, запулил туда этот файл, запустил обработку, и забирай результат. Решений готовых - масса, нужно только подобрать подходящее под задачу.
я не совсем понимаю что такое векторизация но насколько я понимаю это способ как то разбить одну большую задачу на несколько мелких?
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39185310
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lor2я конечно не профессионал а так, любитель, можно вопрос? как часто вам на практике в реале приходилось сортировать листы размером в 4 гига?
Сейчас на практике: нужно "коннектить" миллионы различных вариантов и отобрать из всех лучшие (по каким-то критериям).

Первый вариант программы так и работал: тупо сконнектить, сохранить миллион в ArraList, отсортировать. На миллионе нормально, при 3-4 память кончалось и тормозить, при > 10 виснет ))).

Сейчас алгоритм переписал )))

В БД отсортировать Гигабайты - обычное дело. В 1999-2000 г. делал сайт, приходилось сортировать десятки мил. записей для ускорения полнотекстового поиска. На компе с 16 Mb RAM ))). В том году, переливал реальные БД где под 200 Gb информации. Видел БД где под 1.5 Тб информации (текстовая, не картинки, основная рабочая табличка >45 Gb )

Понятно, что если есть данные, то и желание их отсортировать вполне естественное

IMHO & AFAIK
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39185317
lor2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
не знаю.. мне как то кажется что если у тебя стоит задача отсортировать аррайлист в 4 гига - то что то здесь не так. ты верно сказал, нафига сортировать явой если ты можешь лист уже отсортированный выдрать из бд. и следом второй вопрос - нафига вытаскивать 4 гига - может стоит подумать о критерии для начала?
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39185322
Фотография Изопропил
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lor2мне как то кажется что если у тебя стоит задача отсортировать аррайлист в 4 гига - то что то здесь не так. ты верно сказал, нафига сортировать явой если ты можешь лист уже отсортированный выдрать из бд.
а кто сказал, что лист из DB?
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39185336
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вот у меня сейчас не из БД

В БД граф: всего 3 000 узлов, около 50 000 соединений. Из точки в точку может быть сотня тысяч разных маршрутов (в среднем от 2 до 25 тыс)

При наложении конкретики - кол-во вариантов "легким движением руки" уходит за десятки миллионов на одном маршруте. Комбинаторика, что б ее )))
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39186005
pand
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вадяавтор1) В общем случае, когда вы делаете select * в БД, то в момент его выполнения и даже в процессе выгрузки вам данных,
БД может не знает конечный размер данных, его размер будет известен только после окончания выгрузке (это на стороне БД)
И на клиенте, вы точно ни как это не сделаете (одним запросом)
смотря как организован запрос.
можно прочитав первую строку результата запроса узнать количество строк в запросе. и без count

Простите что воскрешаю , но можно пример , так для общей эрудиции
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39186022
xifr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
pandвадяпропущено...

смотря как организован запрос.
можно прочитав первую строку результата запроса узнать количество строк в запросе. и без count

Простите что воскрешаю , но можно пример , так для общей эрудиции

Я думаю тут имелось введу что-то типа "sql window function / Analytic Functions"
Но в реальности делать два запроса или одним с "sql window function" разница не большая.
А с точки зрения производительности, тут еще вопрос кто выиграет.
Хотя иногда бывает удобно :)
...
Рейтинг: 0 / 0
Вопрос по ORM
    #39186025
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
хочется оригинального ответа. Может, что-то новое узнаем. Я и другие варианты могу себе представит ))), фантазия у меня богатая ))).
...
Рейтинг: 0 / 0
9 сообщений из 59, страница 3 из 3
Форумы / Java [игнор отключен] [закрыт для гостей] / Вопрос по ORM
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]