очень большие объёмы данных - несколько миллионов строк и скорость обработки / Caché, Ensemble, DeepSee, MiniM, IRIS, GT.M

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Caché, Ensemble, DeepSee, MiniM, IRIS, GT.M [игнор отключен] [закрыт для гостей] / очень большие объёмы данных - несколько миллионов строк и скорость обработки

6 сообщений из 6, страница 1 из 1

очень большие объёмы данных - несколько миллионов строк и скорость обработки

#36826283

u78

Участник

Откуда: Москва

Сообщения: 487

Рейтинг: 0 / 0

Нормально будет если оформить обычным persistent классом?
Кто нибудь работает с такими объёмами? Скажем если средняя строка примерно на 20 полей, в сумме ну пара килобайт данных (это на одну строчку). Как оно шевелится?

В связи с требованием к скорости и сложной выборке имею вопрос:
С какой версии Cache в таблицах появился bitmap индекс? Кто нибудь с ним работал? какие ограничения? Намного быстрее обычных индексов? Какие вообще ощущения ?

...

Рейтинг:

0 / 0

02.09.2010, 15:59

| Ответить | Цитировать | Написать

очень большие объёмы данных - несколько миллионов строк и скорость обработки

#36826522

Блок А.Н.

Участник

Откуда: Новосибирск

Сообщения: 3 916

Рейтинг: 0 / 0

Тут скорее зависит от индексов и запросов.
Пусть из нескольких миллионов нужно выбрать сотню записей - при правильных индексах данные индекса будут лежать в одном-двух блоках, чтение индекса не займет много времени.

Теперь данные: в один 8кб блок будет входить только 4 записи, так что чтение каждой записи - это скорее всего обращение к своему отдельному блоку, чтобы добраться до блока данных, нужно прочитать порядка 5ти блоков включая заголовочные.
С учетом кэширования, я думаю, можно считать, что для чтение записи нужно прочитать два блока данных - сам блок данных и вышестоящий блок указателей, остальное будет кэшироваться.
Примем время физического чтения блока за 3 мс, итого на чтение 100 записей в ОЧЕНЬ большой таблице уйдет
0.003*100*2=0.6 сек, причем будет очень слабо зависеть от размера таблицы (как только выйдет за тот размер, который можно закэшировать)

Если это много, то нужно подумать, как хранить данные ближе друг к другу, например в полях данных индекса.

...

Рейтинг:

0 / 0

02.09.2010, 17:09

| Ответить | Цитировать | Написать

очень большие объёмы данных - несколько миллионов строк и скорость обработки

#36826891

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

u78С какой версии Cache в таблицах появился bitmap индекс? Кто нибудь с ним работал? какие ограничения? Намного быстрее обычных индексов? Какие вообще ощущения ?
Так вроде с 5.0 они уже были... Но "работают" они если ИДшники целые числа и "ускоряют" не всезапросы, а например типа

Код: plaintext

select count(...)

Но судя по отзывам ускоряют хорошо.

...

Рейтинг:

0 / 0

02.09.2010, 21:17

| Ответить | Цитировать | Написать

очень большие объёмы данных - несколько миллионов строк и скорость обработки

#36826893

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

u78Нормально будет если оформить обычным persistent классом?
А каким ты еще его сможешь "оформить"?

...

Рейтинг:

0 / 0

02.09.2010, 21:18

| Ответить | Цитировать | Написать

очень большие объёмы данных - несколько миллионов строк и скорость обработки

#36827152

Блок А.Н.

Участник

Откуда: Новосибирск

Сообщения: 3 916

Рейтинг: 0 / 0

Я так понимаю, битмап индексы ускоряют только работу с самим индексом, а если придется лезть в данные - то тут на порядок дольше придеться ползти до блоков с данными.

...

Рейтинг:

0 / 0

03.09.2010, 07:31

| Ответить | Цитировать | Написать

очень большие объёмы данных - несколько миллионов строк и скорость обработки

#36827236

krvsa

Участник

Откуда: г Волжский

Сообщения: 13 823

Рейтинг: 1 / 0

Блок А.Н. , если запрос можно свести к операциям над битовыми строками - тут появляется ускорение "битмап".
Просто "перебрать" записи по такому индексу боле проблематично...

...

Рейтинг:

0 / 0

03.09.2010, 09:22

| Ответить | Цитировать | Написать

6 сообщений из 6, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=39&gotonew=1&tid=1557977]:	0ms
get settings:	8ms
get forum list:	19ms
check forum access:	3ms
check topic access:	3ms
track hit:	130ms
get topic data:	11ms
get first new msg:	6ms
get forum data:	2ms
get page messages:	59ms
get tp. blocked users:	1ms
others:	227ms

total:	469ms