vector на триллион объектов / C++

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / C++ [игнор отключен] [закрыт для гостей] / vector на триллион объектов

25 сообщений из 332, страница 1 из 14

все

vector на триллион объектов

#39972424

Алексей Роза

Гость

есть какие-то ограничения в практическом применении векторов?
если вектор вырастет до триллиона структур и будет постоянно висеть в памяти, есть ли какие-то риски?

...

Рейтинг:

0 / 0

23.06.2020, 14:46

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972426

Basil A. Sidorov

Участник

Сообщения: 11 633

Рейтинг: 0 / 0

Хочу выделить не менее терабайта памяти. Не идиот ли я???

...

Рейтинг:

0 / 0

23.06.2020, 14:48

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972427

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Алексей Роза

есть какие-то ограничения в практическом применении векторов?

Для x64 нет. В x86 примерно 1.7 Гб потолок.

Алексей Роза

если вектор вырастет до триллиона структур и будет постоянно висеть в памяти, есть ли какие-то риски?

Память кончится - ОС закроет прогу.

...

Рейтинг:

0 / 0

23.06.2020, 14:52

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972435

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

Алексей Роза,

Самое время вторым постом написать
for.... Триллион.
И посмотреть

...

Рейтинг:

0 / 0

23.06.2020, 15:05

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972444

mini.weblab

Участник

Сообщения: 988

Рейтинг: 0 / 0

Алексей Роза,

а что в вектор будете складывать, просто из любопытства ?

...

Рейтинг:

0 / 0

23.06.2020, 15:23

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972452

Алексей Роза

Гость

Dima T

Для x64 нет. В x86 примерно 1.7 Гб потолок.

не ну это понятно. Конечно про x64 речь.
вопрос в сохранности, констистенции и скорости обработки...

mini.weblab

Алексей Роза,

а что в вектор будете складывать, просто из любопытства ?

инты, строки.

...

Рейтинг:

0 / 0

23.06.2020, 15:39

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972455

Anatoly Moskovsky

Участник

Откуда: Odessa

Сообщения: 6 713

Рейтинг: 0 / 0

Алексей Роза

инты, строки.

Практически исключено что такой объем данных нужен одновременно.
Поэтому вам нужна СУБД, postgresql там какой-нибудь, которая умеет хорошо работать с выборками данных из набора не помещающегося в памяти.

...

Рейтинг:

0 / 0

23.06.2020, 15:43

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972469

Алексей Роза

Гость

ни одна СУБД не умеет хорошо работать с данными, которые лежат на диске
да и когда в памяти миллиард строк, тоже тупит.

...

Рейтинг:

0 / 0

23.06.2020, 16:09

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972470

petrav

Участник

Сообщения: 3 045

Рейтинг: 0 / 0

Алексей Роза

Реализовывайте свой алгоритм кеширования и подгрузки с диска.

...

Рейтинг:

0 / 0

23.06.2020, 16:13

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972473

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

Алексей Роза

голословно.
Это основное назначение субд.
А вы говорите не умеют)))

...

Рейтинг:

0 / 0

23.06.2020, 16:18

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972475

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

Алексей Роза

в какой памяти? Мы про бд?

...

Рейтинг:

0 / 0

23.06.2020, 16:19

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972488

Anatoly Moskovsky

Участник

Откуда: Odessa

Сообщения: 6 713

Рейтинг: 0 / 0

Алексей Роза

ни одна СУБД не умеет хорошо работать с данными, которые лежат на диске

Стебелек умеет.

...

Рейтинг:

0 / 0

23.06.2020, 16:34

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972496

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

Anatoly Moskovsky,

Файл на диске умеет. Он же ничего не сказал о запросах к данным))))) о целостности данных, о транзакционности...

...

Рейтинг:

0 / 0

23.06.2020, 16:57

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972509

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Алексей Роза

Что такое триллион?

10^6 - это миллион
10^9 - это миллард
10^12 - это триллион

Если грубо - то это приставка тера-*. Тоесть если-бы структура была байтом - то мы-бы грубо выделили 1 терабайт.

Мне кажется вопрос упирается в действия ОС во время операции malloc(). Что она будет делать?
Тут наверное Windows/Linux будут идти по разной стратегии. И какие будут ограничения на фактическую
оперативку.

Возможно при таком объеме стоит посмотреть в memory-mapped API. Consern такой. Даже если
ты аллоцируешь 1 теребайт оперативы то вряд-ли ты в единый миг сможешь ее использовать.

Технически - я думаю это возможно.

...

Рейтинг:

0 / 0

23.06.2020, 17:33

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972510

Anatoly Moskovsky

Участник

Откуда: Odessa

Сообщения: 6 713

Рейтинг: 0 / 0

PetroNotC Sharp

Файл на диске умеет.

Я всерьез не собирался обсуждать его заявление.

...

Рейтинг:

0 / 0

23.06.2020, 17:39

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972514

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

По поводу того что у нас не malloc а vector.

Здесь есть нюансы. Я думаю имеет смысл делать
предварительное резервирование структур в штуках в конструкторе

https://en.cppreference.com/w/cpp/container/vector/vector

Потому-что динамический resize может быть расточительным в нашем кейсе.
Возможно в какой-то момент мы затребуем даже больше чем 1 Тера-количество
элементов. Сколько там он? В 1.5 или 1.2 или 2 раза? Я не помню.

...

Рейтинг:

0 / 0

23.06.2020, 17:49

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972518

Алексей Роза

Гость

PetroNotC Sharp

Алексей Роза

голословно.
Это основное назначение субд.
А вы говорите не умеют)))

основное назначение СУБД - сохранность и поиск данных.
скорость - НЕ основное. Вот транзакции - да.
Чтобы найти рандомную, незакешированную строчку среди миллиардов, уйдёт несколько секунд.

Anatoly Moskovsky

Алексей Роза

ни одна СУБД не умеет хорошо работать с данными, которые лежат на диске

Стебелек умеет.

чего он умеет? Все они одинаковые.
Даже редиска под нагрузкой сдувается. Да и без нагрузки херня неэффективная.

mayton

Я думаю имеет смысл делать предварительное резервирование структур в штуках в конструкторе

ну это само собой.

...

Рейтинг:

0 / 0

23.06.2020, 18:03

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972523

Anatoly Moskovsky

Участник

Откуда: Odessa

Сообщения: 6 713

Рейтинг: 0 / 0

Алексей Роза

Чтобы найти рандомную, незакешированную строчку среди миллиардов, уйдёт несколько секунд.

При кривых руках админа, вполне возможно ))

...

Рейтинг:

0 / 0

23.06.2020, 18:27

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972529

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Алексей Роза

Расскажи что у тебя лежит внутри этих структур. И может тебе надо не vector
а какую-то другую структуру данных для поиска.

...

Рейтинг:

0 / 0

23.06.2020, 19:05

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972530

petrav

Участник

Сообщения: 3 045

Рейтинг: 0 / 0

Интересно для чего может понадобиться такая задача?

...

Рейтинг:

0 / 0

23.06.2020, 19:12

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972532

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

petrav

Алексей Роза

Реализовывайте свой алгоритм кеширования и подгрузки с диска.

Давайте эксперимент. Возьмем бесплатную DBMS (PG/MySQL).
Создатим табличку. С 1 полем типа Int.
Проиндексируем ее по этому полю. Загрузим миллиард чисел.
Последовательность. Имеем предварительно знание что любой индекс
баз данных класса B+Tree имее 3-4 уровня блоков. Тоесть максимум
за 4 дисковых операции он находит нужный ключ. Для старого магнитного
диска типа HDD время поиска любого сектора занимает в среднем 6 милисекунд.
(я промерял аж 5 своих SATA дисков и эти цифры правда такие. Я гарантирую.).

Тоесть любой ключ в этой таблице мы найдем за 6 * 4 = 24 милисекунды.
Это на старом жлобском магнином диске. Ну для твердотельных там будут
цифры получше.

И этот весь эксперимент не требует тера-штучного вектора. Обычная
база типа Postgres/MySQL.

...

Рейтинг:

0 / 0

23.06.2020, 19:17

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972542

petrav

Участник

Сообщения: 3 045

Рейтинг: 0 / 0

mayton

petrav

пропущено...

Реализовывайте свой алгоритм кеширования и подгрузки с диска.

Давайте эксперимент. Возьмем бесплатную DBMS (PG/MySQL).
Создатим табличку. С 1 полем типа Int.
Проиндексируем ее по этому полю. Загрузим миллиард чисел.

Мы не знаем какие у автора требования. Чисто теоретически, написав узкоспециализированный алгоритм, своё кеширование (обойдя кеширование ОС), наверное, можно обогнать универсальную БД. Особенно если у нас очень "необычный" алгоритм работы с данными. Но чисто практически, свой алгоритм кеширования, я думаю, может по сложности неожиданно потянуть на докторскую диссертацию из какой-нибудь аля теории множеств. :)

...

Рейтинг:

0 / 0

23.06.2020, 20:00

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972543

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Я так всегда делаю. В спорных технических вопросах даю готовое коробочное решение с цифрами.
Пускай даже прямое и деревянное. И дальше уже автор пускай обосновывает почему ему это
решение не подходит. И уже с цифрами.

На самом деле кеши поверх БД тоже строят. Вот сбербанк не просто построил а разработал
целый программный продукт в виде грида кешей и уже продает его отдельно. Но там - тоже
свои сложности. С invalidation.

...

Рейтинг:

0 / 0

23.06.2020, 20:07

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972554

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

Алексей Роза,
>Чтобы найти рандомную, незакешированную строчку среди миллиардов, уйдёт несколько секунд.

По ключу? МИКРОсекунд.

...

Рейтинг:

0 / 0

23.06.2020, 21:18

| Ответить | Цитировать | Написать

vector на триллион объектов

#39972561

bk0010

Участник

Сообщения: 4 619

Рейтинг: 0 / 0

Посмотрите про In memory database (Exasol, MemSql). Может это то, что вам надо?

...

Рейтинг:

0 / 0

23.06.2020, 22:18

| Ответить | Цитировать | Написать

25 сообщений из 332, страница 1 из 14

все

Форумы / C++ [игнор отключен] [закрыт для гостей] / vector на триллион объектов

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=57&msg=39972530&tid=2017354]:	0ms
get settings:	6ms
get forum list:	16ms
check forum access:	4ms
check topic access:	4ms
track hit:	207ms
get topic data:	8ms
get forum data:	2ms
get page messages:	65ms
get tp. blocked users:	1ms
others:	203ms

total:	516ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы