Плюсы против голого Си, холивар #9 / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Плюсы против голого Си, холивар #9

25 сообщений из 228, страница 3 из 10

все

Плюсы против голого Си, холивар #9

#37930312

Проясним ситуац

Гость

MIN/MAXПроясним ситуацпропущено...

Ты опять решил рассказать, что понятия не имеешь про денормализацию данных? Ну так поясним еще раз. Все группировки делаются заранее, считаются и сохряняются в базу. Данные хранятся в уже сортированном виде, готовом для отдачи клиенту без какой-либо обработки.
Имеете ввиду MatView с QueryRwerite?
А как мне апдейтнуть такую MatView содержащую агрегаты MIN/MAX , когда в исходных таблицах возможнен (UPDATE ... STATUS = 0), их размер несколько ТБ, если по бизнес требованиям отставание данных в ней (агрегированной MatView) должно не превышать 2 минут для любого запроса?
Надеюсь понятно, что частичное обновление именно таких MatView невозможно и не реализовано ни в одной СУБД.
Это реальная задача из банковской сферы.
То, что я расписывал - это задача из OLTP сферы - обслуживание тысяч клиентов в режиме приближенном к real-time.

А ты пришел ко мне с противным DWH/DSS - мы не решаем это и не собираемся решать - для этих задач базы данных дампятся из шард, с предварительной агрегацией, а потом уже заливаются в специализированные хранилища данных, вроде netezza, и там уже аналитики резвятся как хотят, через SQL и не только. В той области масса годных готовых решений (ну, наверное, я не в курсе всех тенденций).

MIN/MAXПроясним ситуацПлюс вопрос компрессии - еще тот вопрос. Скомпрессировать блок на диске - это ок, много ума не надо, через btrfs или zfs. А если хранить его развернутым уже в памяти, то это уже ой.

А так как сервер у вас SQL (Oracle?), то об эффективности компрессии OLTP данных можно можно только поулыбаться.
Кстати, интересно, а в вашей системе в ОЗУ данные хранятся в сжатом виде и каким алгоритмом жмете?

Если реально - то были попытки привинтить snappy и zlib, но синтетические тесты показали противоречивые результаты.
Типовой паттерн - это рандомизированное чтение, т.е. отдельный пользовательский запрос берет всего один блок данных, и с точки зрения стоимости чтения с диска - вообще никакой разницы нет, только CPU напрасно расходуется.

В отдельных случаях было даже сильно хуже - потому что вместо хешированного чтения всего одного блока - приходилось читать сначала блок, а потом словарь - два рандомизированных чтения вместо одного.

Аналогично с записью логов - ирония в том, что получилось быстрее писать вообще без компрессии даже на диски со шпинделями, а в случае SSD и вовсе все неприлично плохо стало с компрессией, до полного безобразия.

Одним словом - сейчас осталась только компрессия на самых старых данных (time lag больше месяца), они сжимаются через btrfs lzo просто для того, чтоб места занимали поменьше, так их вообще редко кто читает по-блочно и просад производительности не критичен.

Плюс типовой паттерн OLTP баз данных - пользователь пришел, что-то там поклацал, понаделал фактов - и ушел восвояси.
Т.е. кеш нужен относительно небольшое время (час-два максимум), потом данные уже почти никогда никому не нужны, и хранить их в кеше - никакого смысла нет. Т.е. факт того, что теперь в кеш можно залить в 4-5 раз больше данных клиента - не важен, просто потому что эти данные и так будут просто неизбежно вытолкнуты из кеша, без повторного использования.

Но вот на задачах подготовки данных для DSS (предварительная агрегация и фильтрация) компрессия дает как раз строго обратные результаты - там преобладает линейное,
последовательное чтение (перебираем таблицы фактов при построении агрегатов), и тот факт, что данных приходится читать с диска в 9-10 раз меньше - дает огроменный результат - т.е. ускорение до 5-6 раз минимум. Там пока решено оставить btrfs, плюс память сразу высвобождается после чтения, потому что шанс того, что перемолоченные пару терабайт данных хоть как-то прокешируются в тех 32 гигабайтах ОЗУ на ноде и будут кем-то востребованы - ничтожно мал.

...

Рейтинг:

0 / 0

25.08.2012, 17:10

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930313

Проясним ситуац

Гость

без иронии и без намековПроясним ситуацКогда я несколько раз говорил про madvise - никто не понял тонкой иронии в виде очень прямого намека. Забавно....

Это наверное так трудно - сдалать man madvise, да?
Скажу без иронии и без намеков, сколько не давай советов и подсказок глупому алгоритму кэширования в mmap он будет далек от кэширования самим Oracle, причем на порядок.
Если сравнивать с кэшированием в MySQL, то да, наверное вы правы.

Ты думаешь в Oracle алгоритм кеширования супер-мега интеллектуален?

Впрочем, не будем разбивать мечты и надежды....

...

Рейтинг:

0 / 0

25.08.2012, 17:11

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930314

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

без иронии и без намековсколько не давай советов и подсказок глупому алгоритму кэширования в mmap он будет далек от кэширования самим Oracle, причем на порядок.Да там даже не в алгоритме проблема, а в железе. Когда я сам выделяю дисковые буферы, я уж точно позабочусь, чтобы TLB были huge. Если я попытаюсь рулить терабайтом адресов в виде 4-килобайтных страничек (т.е. аж по _два_ TLB энтри на каждую 8-килобайтную страничку), то сами посчитайте размер таблички трансляции. Ядро тупо повесится её обновлять. Кроме того, хардвёрные TLB энтри стоят как крылья от самолёта, поэтому их в масовых процах очень мало:

For instance, Nehalem has
a 4-way set associative L1 DTLB with 64 entries for 4 KiB pages and 32 entries for 2/4 MiB pages,
an L1 ITLB with 128 entries for 4 KiB pages using 4-way associativity and 14 fully associative entries for 2/4 MiB pages (both parts of the ITLB divided statically between two threads)
a unified 512-entry L2 TLB for 4 KiB pages, both 4-way associative.
и цена одного промаха мимо аппаратного TLB кэша легко достигает 80(!) циклов.

...

Рейтинг:

0 / 0

25.08.2012, 17:12

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930316

Проясним ситуац

Гость

iv_an_ruПроясним ситуацКогда я несколько раз говорил про madvise - никто не понял тонкой иронии в виде очень прямого намека. Забавно....Очень хотелось бы увидеть удовлетворительную демку с mmap без больших страниц на 256+ гигах ОЗУ и хотя бы терабайте данных, лежащих на 6 обычных HDD. Самый обычный самый дешёвый комодный ящик, без заморочек с RAID и SAN, то есть на железе, для которого ядро отполировано лучше всего. Хоть с мадвайзами хоть без.

Комодный ящик сейчас - это 32-64 гигабайт ОЗУ, выше - уже нерентабельно, намного дешевле и эффективнее купить четыре ящика по 64, чем один ящик, набитый до 256 гигов ОЗУ.

А за демками... пишите письма, вам обязательно ответят.

...

Рейтинг:

0 / 0

25.08.2012, 17:15

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930317

Проясним ситуац

Гость

iv_an_ruбез иронии и без намековсколько не давай советов и подсказок глупому алгоритму кэширования в mmap он будет далек от кэширования самим Oracle, причем на порядок.Да там даже не в алгоритме проблема, а в железе. Когда я сам выделяю дисковые буферы, я уж точно позабочусь, чтобы TLB были huge. Если я попытаюсь рулить терабайтом адресов в виде 4-килобайтных страничек (т.е. аж по _два_ TLB энтри на каждую 8-килобайтную страничку), то сами посчитайте размер таблички трансляции. Ядро тупо повесится её обновлять.
А разработчики ядра-то и не знают!

iv_an_ruи цена одного промаха мимо аппаратного TLB кэша легко достигает 80(!) циклов.

КАК СТРАШНО СТАЛО ЖИТЬ! 80 циклов супротив цены одного seek на HDD

Стивен Спилберг и Стивен Кинг продакшин. Новые, душераздирающие истории на в новой книге "Однажды, на улице 81-го цикла!"

...

Рейтинг:

0 / 0

25.08.2012, 17:20

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930323

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

Проясним ситуацiv_an_ruи цена одного промаха мимо аппаратного TLB кэша легко достигает 80(!) циклов.КАК СТРАШНО СТАЛО ЖИТЬ! 80 циклов супротив цены одного seek на HDDНе-е, вы не врубились. Эти 80 циклов будут вылезать просто на доступе к странице, которая _уже_ лежит в памяти. Причём два раза на дисковый буфер --- в его начале и в его середине. Особенно "приятно", если с этой страницы и прочитать-то надо было всего пяток слов.

...

Рейтинг:

0 / 0

25.08.2012, 17:31

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930324

Проясним ситуац

Гость

iv_an_ruПроясним ситуацпропущено...
КАК СТРАШНО СТАЛО ЖИТЬ! 80 циклов супротив цены одного seek на HDDНе-е, вы не врубились. Эти 80 циклов будут вылезать просто на доступе к странице, которая _уже_ лежит в памяти. Причём два раза на дисковый буфер --- в его начале и в его середине. Особенно "приятно", если с этой страницы и прочитать-то надо было всего пяток слов.

Только при первом чтении. Количество активных процессов в момент времени - не более 16 (по одному-два на кору), для них вот того DTLB with 64 entries for 4 KiB pages - более чем достаточно - типовой сценарий - мы долбим страницу данных, страницу результата и еще стека и кода.

Так что мимо, пишите еще ужастикофф.

...

Рейтинг:

0 / 0

25.08.2012, 17:35

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930327

Проясним ситуац

Гость

Проясним ситуацТак что мимо, пишите еще ужастикофф.

http://www.realworldtech.com/nehalem/8/

Тем более, что DTLB для каждой коры - свой, плюс еще есть L2 TLB...

Колокола, звенят колокола, почём у нас колокола? По 80 циклов, да?

авторAs a result, each Nehalem core features a combined TLB of 576 entries that sum up to 2304 total for the entire processor, enough to cover 9.2 MB – way in excess of the actual L3 cache size.

...

Рейтинг:

0 / 0

25.08.2012, 17:41

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930328

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

Проясним ситуацКомодный ящик сейчас - это 32-64 гигабайт ОЗУ, выше - уже нерентабельно, намного дешевле и эффективнее купить четыре ящика по 64, чем один ящик, набитый до 256 гигов ОЗУ.Кому как. Особенно если к четырём ящикам вместо одного понадобится вчетверо больше портов хотя бы мелланоксовского инфинибанда.

OTOH у нас "некомодный" ящик --- 6 "горизонтальных" лезвий на морде и 4 коммуникационных вертикальных лезвия на попе, к примеру. Но их только клиенты себе покупают, мы для разработки пока комодами обходимся. В Нске одна такая лезвийная гробина стоит от миллиона рублей, даже если экономить и брать его в шасси местного производства --- нафиг оно надо, такие деньги тратить без крайней нужды.

...

Рейтинг:

0 / 0

25.08.2012, 17:42

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930332

Проясним ситуац

Гость

iv_an_ruПроясним ситуацКомодный ящик сейчас - это 32-64 гигабайт ОЗУ, выше - уже нерентабельно, намного дешевле и эффективнее купить четыре ящика по 64, чем один ящик, набитый до 256 гигов ОЗУ.Кому как.
Да хоть кому. Расчет прост - стоимость железяки/сколько клиентов сможет обслужить железяка. Дальше тупо берем чуть дальше, чем где полный минимум.

Мы вот вообще ждем - когда же уже ARM появится, 64-х битный. Мощностей Xeon-ов, при переписанном движке БД и вебсервере - вообще не нужно, они на 99% в idle, только лектричество даром кушают.

iv_an_ru Особенно если к четырём ящикам вместо одного понадобится вчетверо больше портов хотя бы мелланоксовского инфинибанда.
Не понадобится, и это уже даже близко не commodity.

iv_an_ruOTOH у нас "некомодный" ящик --- 6 "горизонтальных" лезвий на морде и 4 коммуникационных вертикальных лезвия на попе, к примеру. Но их только клиенты себе покупают, мы для разработки пока комодами обходимся. В Нске одна такая лезвийная гробина стоит от миллиона рублей, даже если экономить и брать его в шасси местного производства --- нафиг оно надо, такие деньги тратить без крайней нужды.

И что с того? Какая разница, на чем вы там у себя в росейской глубинке откатушки делаете?

Откровенно не интересна эта тема, вот честно. У тебя наболело - обратись к специалистам, там посочувствуют.

...

Рейтинг:

0 / 0

25.08.2012, 17:52

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930333

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

Проясним ситуацавторAs a result, each Nehalem core features a combined TLB of 576 entries that sum up to 2304 total for the entire processor, enough to cover 9.2 MB – way in excess of the actual L3 cache size.... if the access is dense enough.

"Плохие" паттерны доступа + 4-килобайтные страницы = Большая Попа. Иначе зачем бы вообще придумывали большие страницы.
А с другой стороны, массовое тягание больших страниц туда-сюда = Вообще Мега-Попа, потому что в 64 мега внутреннего кэша диска садятся всего 16 таких 4 меговых страничек, ну и вообще мало кайфа таскать такие объёмы впустую.

...

Рейтинг:

0 / 0

25.08.2012, 17:53

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930337

Проясним ситуац

Гость

iv_an_ruПроясним ситуацпропущено...
... if the access is dense enough.

"Плохие" паттерны доступа + 4-килобайтные страницы = Большая Попа. Иначе зачем бы вообще придумывали большие страницы.
А с другой стороны, массовое тягание больших страниц туда-сюда = Вообще Мега-Попа, потому что в 64 мега внутреннего кэша диска садятся всего 16 таких 4 меговых страничек, ну и вообще мало кайфа таскать такие объёмы впустую.

Не забываем, что основной веб паттерн (RESTful)

а) получили из соката запрос в 110 байт
б) сходили в базу занных с хеш ключом в 32 байт (попадание три-четыре старницы), получили в итоге 200-300 байт данных
в) обработали 200-300 байт данных, сформировали 800-1200 байт ответа, отдали ядру на отправку в сокет.

Тут и Celeron отлично справится, с 256к L2, при 16 шардов-процессов

В общем опять мимо, опять... да что-же так!

А больше страницы нужны для вона обработки видео какого, фоточек там, подобного, как я понимаю

...

Рейтинг:

0 / 0

25.08.2012, 18:01

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930339

избытка CPU

Гость

Проясним ситуац
Если реально - то были попытки привинтить snappy и zlib, но синтетические тесты показали противоречивые результаты.
Типовой паттерн - это рандомизированное чтение, т.е. отдельный пользовательский запрос берет всего один блок данных, и с точки зрения стоимости чтения с диска - вообще никакой разницы нет, только CPU напрасно расходуется.
Тут да, в HDD все ограничено сверху количеством IOPs.

Проясним ситуацВ отдельных случаях было даже сильно хуже - потому что вместо хешированного чтения всего одного блока - приходилось читать сначала блок, а потом словарь - два рандомизированных чтения вместо одного.
Не совсем понял, что значит хэшированное чтение и про какой вы словарь?

Проясним ситуацАналогично с записью логов - ирония в том, что получилось быстрее писать вообще без компрессии даже на диски со шпинделями, а в случае SSD и вовсе все неприлично плохо стало с компрессией, до полного безобразия.
А вы это пробовали на snappy или zfs, и на каких SSD и CPU?
Потому что тут как раз может быть другая ситуация, допустим для SSD 120ГБ OCZ "RevoDrive 3"
http://www.fcenter.ru/products.shtml?eshop/act=h:a:0:186:a:a:a:1:a:1:50:r:1:1:38&oper=102100::::
Sequential max bandwidth = 975 MB/s
IOPs = 120 000 (4 KB)

При блоках 8 КБ мы уже упираемся в Sequential max bandwidth, а не IOPs. (8 КБ * 120 000 = 960 MB/s)
Т.е. если у нас размер кластера 64 КБ, то мы максимум сможем получить 975 MB/s и 15 000 IOPs = (975 000 KB / 64 KB).

А если мы сможем ужать на zfs в 2 раза, с динамическим размером кластера ФС, до 32 КБ, то мы сможем выжать уже 975 MB/s ( 1 950 MB/s в распаковке ) и 30 000 IOPs = (975 MB/s / 32 KB).

А на серверных SSD NAND SLC c IOPs ещё лучше и это ещё актуальней.

Сжатие в ZFS конечно далеко не дотягивает по скорости до snappy, а вот последний вполне может подойти.
Естественно все это справедливо если имеется большой перекос в сторону избытка CPU и недостатка СХД IO.

...

Рейтинг:

0 / 0

25.08.2012, 18:05

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930345

Проясним ситуац

Гость

избытка CPUПроясним ситуацВ отдельных случаях было даже сильно хуже - потому что вместо хешированного чтения всего одного блока - приходилось читать сначала блок, а потом словарь - два рандомизированных чтения вместо одного.
Не совсем понял, что значит хэшированное чтение и про какой вы словарь?
В базе данных чтение хешированное - клиент шлет запрос ключа (key), оно преобразуется в хеш-ключ (если уже не является ключом), и путем несложных вычислений происходит команда всего одного чтения уже известного блока на диске.

А словарь - это словарь для компрессии, словари лежат отдельно от данных, иногда разнесены довольно широко - т.е. данные в одном 512-байтном блоке, а словарь - в другом. И требуется сделать два чтения, вместо одного.

Проясним ситуацСжатие в ZFS конечно далеко не дотягивает по скорости до snappy, а вот последний вполне может подойти. Естественно все это справедливо если имеется большой перекос в сторону избытка CPU и недостатка СХД IO.

Может, но реально он оказался достаточно тормозным даже для логов, хотя тесты не я проводил, надо будет еще раз посмотреть.

Знаю точно - мы боролись за высокий response time для клиента. Соотвественно была задача - сделать sync для логированной записи (это сильно меньше, чем один килобайт). И скорее всего snappy там только вносил тормоза, тогда как простейший RAID1 с батарейкой давал практически моментальный ответ на sync, упаковывая уже несколько log записей в один физически 4-х килобайтный (а то и 128 килобайтный) блок.

...

Рейтинг:

0 / 0

25.08.2012, 18:17

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930348

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

Проясним ситуацНе забываем, что основной веб паттерн (RESTful)

а) получили из соката запрос в 110 байт
б) сходили в базу занных с хеш ключом в 32 байт (попадание три-четыре старницы), получили в итоге 200-300 байт данных
в) обработали 200-300 байт данных, сформировали 800-1200 байт ответа, отдали ядру на отправку в сокет.

Тут и Celeron отлично справится, с 256к L2, при 16 шардов-процессов...с чем я вас и поздравляю. Но вы почему-то уверены, что такое счастье --- у всех, и начинаете "учить", как будто вы один здесь POSIX смотрели и ваш метод --- универсально и единственно правильный.

У нас тоже 99% нагрузки --- RESTful сервис
а) получили из сокета запрос в 100 байт---100 килобайт.
б) сходили в базу выполнить запрос за 0.001 -- 20 секунд, получили в итоге 0--0.1--20 мегов данных.
в) сформировали 0--0.1--100 мегов ответа и по возможности начали их отдавать клиенту раньше, чем получили последние строки резалт-сета.

Только проблемы чуток другие. И методы решения соответственно.

...

Рейтинг:

0 / 0

25.08.2012, 18:26

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930350

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

избытка CPUСжатие в ZFS конечно далеко не дотягивает по скорости до snappy, а вот последний вполне может подойти.
Естественно все это справедливо если имеется большой перекос в сторону избытка CPU и недостатка СХД IO.Мы опционально собираем свой сервак со снаппи, жмём длинные наборы страниц (100--200 килобайт) перед сбросом на диск. Сказать, что с ним "у всех клиентов лучше" или "у всех клиентов хуже" не могу --- на наших задачах получается у кого как. Но лучше уж такой выбор, чем никакого. даже 5--10% разгона приятны, если нахаляву.

...

Рейтинг:

0 / 0

25.08.2012, 18:32

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930351

избытка CPU

Гость

Проясним ситуацизбытка CPUСжатие в ZFS конечно далеко не дотягивает по скорости до snappy, а вот последний вполне может подойти. Естественно все это справедливо если имеется большой перекос в сторону избытка CPU и недостатка СХД IO.

Может, но реально он оказался достаточно тормозным даже для логов, хотя тесты не я проводил, надо будет еще раз посмотреть.

Знаю точно - мы боролись за высокий response time для клиента. Соотвественно была задача - сделать sync для логированной записи (это сильно меньше, чем один килобайт). И скорее всего snappy там только вносил тормоза, тогда как простейший RAID1 с батарейкой давал практически моментальный ответ на sync, упаковывая уже несколько log записей в один физически 4-х килобайтный (а то и 128 килобайтный) блок.
Ну не знаю как вы готовили snappy, но на "сильно меньше, чем один килобайт" он и сжимать будет сильно меньше. Т.е. перед упаковкой и сохранением их надо самому объединять в 4 - 128 КБ блоки. Да, это может добавит к отклику 1мс, но сильно разгрузит СХД, что сделает возможным держать в разы большую нагрузку.

И честно говоря не совсем понимаю, как RAID1 может упаковывать "несколько log записей в один физически 4-х килобайтный (а то и 128 килобайтный) блок" ?
RAID пишет блоками, а присылают ему кластерами, которые и надо сжимать целиком хоть lzo, хоть snappy.

...

Рейтинг:

0 / 0

25.08.2012, 18:34

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930354

избытка CPU

Гость

iv_an_ruизбытка CPUСжатие в ZFS конечно далеко не дотягивает по скорости до snappy, а вот последний вполне может подойти.
Естественно все это справедливо если имеется большой перекос в сторону избытка CPU и недостатка СХД IO.Мы опционально собираем свой сервак со снаппи, жмём длинные наборы страниц (100--200 килобайт) перед сбросом на диск. Сказать, что с ним "у всех клиентов лучше" или "у всех клиентов хуже" не могу --- на наших задачах получается у кого как. Но лучше уж такой выбор, чем никакого. даже 5--10% разгона приятны, если нахаляву.
А какая корреляция прироста от задач, как и предполагалось прирост на задачах ближе к DWH/DSS и проседание на OLTP, и как вам CPU не жалко тратить?

А представьте какой разгон и какая экономия от него в масштабах google, где и задачи заранее известны и очень подходят и готовить snappy умеют близко к идеалу :)

...

Рейтинг:

0 / 0

25.08.2012, 18:37

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930362

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

избытка CPUА какая корреляция прироста от задач, как и предполагалось прирост на задачах ближе к DWH/DSS и проседание на OLTP, и как вам CPU не жалко тратить?Трудно сказать насчёт OLAP vs OLTP, потому что у нас есть и row-wise и column-wise представление, и клиенты больше любят row-wise для OLTP и column-wise для OLAP. При этом у нас и строки и колонки "начерно" пожаты и без снаппи. А теперь смотрите:

Снаппи лучше дожимает строки, чем колонки, потому что колонки и так уже пожаты хорошо.
Снаппи, как и любая такая компрессия, лучше на OLAP, чем на OLTP.

В итоге снаппи не лучше на OLAP, потому что OLAP-ные задачи клиенты держат на колонках, на которых он не очень-то полезен.
И снаппи не лучше на OLTP, потому что даже если он хорошо дожимает строки, это как ни крути OLTP с активностью на запись.

:(

...

Рейтинг:

0 / 0

25.08.2012, 19:21

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930384

избытка CPU

Гость

iv_an_ruизбытка CPUА какая корреляция прироста от задач, как и предполагалось прирост на задачах ближе к DWH/DSS и проседание на OLTP, и как вам CPU не жалко тратить?Трудно сказать насчёт OLAP vs OLTP, потому что у нас есть и row-wise и column-wise представление, и клиенты больше любят row-wise для OLTP и column-wise для OLAP. При этом у нас и строки и колонки "начерно" пожаты и без снаппи. А теперь смотрите:

Снаппи лучше дожимает строки, чем колонки, потому что колонки и так уже пожаты хорошо.
Снаппи, как и любая такая компрессия, лучше на OLAP, чем на OLTP.

В итоге снаппи не лучше на OLAP, потому что OLAP-ные задачи клиенты держат на колонках, на которых он не очень-то полезен.
И снаппи не лучше на OLTP, потому что даже если он хорошо дожимает строки, это как ни крути OLTP с активностью на запись.

:(
Нет, ну если вы уже до этого жмете, то понятно. А чем жмете в колонках, DELTA-PFOR каждой страницы БД или что-то ещё?
Ну помимо того, что поколончатое хранение уже занимает меньше, чем построчное.

А насчет OLTP, для него хорошо подходит кэширование на чтение на SSD. А как я расписал выше, для него сжатие позволяет увеличить количество IOPs, преодолев ограничение на bandwidth.

...

Рейтинг:

0 / 0

25.08.2012, 20:20

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930398

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

> Ты походу вообще выпал из струи прогресса и современных highload течений.

Смешно...
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

25.08.2012, 20:47

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930403

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

избытка CPUА чем жмете в колонках, DELTA-PFOR каждой страницы БД или что-то ещё?Жмём по-разному, но босс ещё не придумал "рекламных" названий.

...

Рейтинг:

0 / 0

25.08.2012, 20:53

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930407

относительно snappy

Гость

iv_an_ruизбытка CPUА чем жмете в колонках, DELTA-PFOR каждой страницы БД или что-то ещё?Жмём по-разному, но босс ещё не придумал "рекламных" названий.А как у вас по скорости/степени сжатия и затратам CPU относительно snappy?

...

Рейтинг:

0 / 0

25.08.2012, 20:57

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930415

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

относительно snappyiv_an_ruпропущено...
Жмём по-разному, но босс ещё не придумал "рекламных" названий.А как у вас по скорости/степени сжатия и затратам CPU относительно snappy?А как сравнить сжатие для последующего частично-произвольного доступа с сжатием "до победного конца"?

...

Рейтинг:

0 / 0

25.08.2012, 21:17

| Ответить | Цитировать | Написать

Плюсы против голого Си, холивар #9

#37930421

относительно snappy

Гость

iv_an_ruотносительно snappyпропущено...
А как у вас по скорости/степени сжатия и затратам CPU относительно snappy?А как сравнить сжатие для последующего частично-произвольного доступа с сжатием "до победного конца"?
Как обычно, степень и скорость упаковки/распаковки всей страницы БД целиком. Возможность произвольного доступа к сжатым данным - это дополнительная фича и кстати не редкая для тех же NS, PFOR, ...
Если беспокоитесь, что сравнение будет "не корректным" или мне это "ничего не даст", то поверьте, я учту все нюансы и сделаю правильные выводы :)

...

Рейтинг:

0 / 0

25.08.2012, 21:38

| Ответить | Цитировать | Написать

25 сообщений из 228, страница 3 из 10

все

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Плюсы против голого Си, холивар #9

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&msg=37930407&tid=1342110]:	0ms
get settings:	6ms
get forum list:	9ms
check forum access:	2ms
check topic access:	2ms
track hit:	138ms
get topic data:	6ms
get forum data:	2ms
get page messages:	38ms
get tp. blocked users:	1ms
others:	254ms

total:	458ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы