А оно нам надо: выравнивание данных? / C++

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / C++ [игнор отключен] [закрыт для гостей] / А оно нам надо: выравнивание данных?

21 сообщений из 46, страница 2 из 2

все

А оно нам надо: выравнивание данных?

#39603997

rdb_dev

Участник

Откуда: с болот

Сообщения: 3 797

Рейтинг: 0 / 0

AlekseySQL, ты не видел громоздких конструкций, потому что в этих программах используется выравнивание по умолчанию. Помнится, даже в древнейшем Borland C++ Builder, при создании проекта (32 разрядного, естественно), устанавливалось выравнивание по умолчанию на границу 8 байт. Особенность работы процессоров Intel с оперативной памятью такова, что эти процессоры действительно быстрее работают с выравненными данными, так как если, скажем, процессор читает невыравненное двойное слово, то ему придется дважды выполнить инструкцию чтения из памяти, даже если это двойное слово находится полностью в кэше (два раза обратится к кэшу), а уж если невыравненное двойное слово попадёт на границу линии кеша и одной из линий не окажется в кэше, то возникнет "промах", будет захвачена системная шина и произведена медленная операция чтения из оперативной памяти, при этом, также, могут быть попутно выполнены отложенные инструкции чтения/записи в оперативную память, что приведет к одномоментному резкому снижению производительности.

Для 64-разрядных приложений, естественно, выравнивание должно выполняться по адресам, кратным 8 байтам.

...

Рейтинг:

0 / 0

19.02.2018, 10:39

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39603999

rdb_dev

Участник

Откуда: с болот

Сообщения: 3 797

Рейтинг: 0 / 0

Dima TПроцессор обменивается с памятью кэш-линиями. Кэш-линия - это 64 байта выровненные по 64, т.е. адрес кратен 64-м. Если один поток (ядро) меняет хоть один байт в кэш-линии, то другой поток (точнее другое ядро) при обращении к этой же кэш-линии будет вынужден дождаться когда первое ядро скинет кэш-линию в общий кэш и перечитает ее оттуда.
Причем разные потоки могут работать с разными частями кэш-линии, но это все-равно заставит ее постоянно перечитывать.Размер линии кэша, это не константное значение, которое можно определить, если мне не изменяет память, выполнив инструкцию CPUID. На большинстве современных процессоров Intel, размер линии кэша 128 байт.

...

Рейтинг:

0 / 0

19.02.2018, 10:42

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604006

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

rdb_devНа большинстве современных процессоров Intel, размер линии кэша 128 байт.
Тут мои замеры За все процы не скажу, самый свежий из проверенных i7 6700K, там 64 байта.

...

Рейтинг:

0 / 0

19.02.2018, 10:48

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604008

AlekseySQL

Гость

Dima T1. Честно говоря, не понял при чем тут многопоточный доступ. Разве что предположить, что по выровненным данным работа идет быстрее и взаимные ожидания потоков будут меньше. Но тогда не понятно: если скорость быстрее, то почему не применить это ускорение для однопоточного доступа?
Это не ускорение, а замедление многопоточной работы.

Процессор обменивается с памятью кэш-линиями. Кэш-линия - это 64 байта выровненные по 64, т.е. адрес кратен 64-м. Если один поток (ядро) меняет хоть один байт в кэш-линии, то другой поток (точнее другое ядро) при обращении к этой же кэш-линии будет вынужден дождаться когда первое ядро скинет кэш-линию в общий кэш и перечитает ее оттуда.
Причем разные потоки могут работать с разными частями кэш-линии, но это все-равно заставит ее постоянно перечитывать.

Например: в твоей структуре один поток постоянно меняет a1, второй a2. В итоге будет тормоз, т.к. эти два потока будут мешать друг-другу.[/quot]

У меня нет многопоточной работы с общим массивом. Каждый поток имеет свой массив и работает только с ним. Но за информацию спасибо.

...

Рейтинг:

0 / 0

19.02.2018, 10:49

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604022

AlekseySQL

Гость

Вася Уткин, спасибо за инфу по SSE и AVX!

Насколько я понял современные AVX инструкции также работают с невыровненными данными, только слегка просаживаются по производительности.

...

Рейтинг:

0 / 0

19.02.2018, 11:01

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604027

rdb_dev

Участник

Откуда: с болот

Сообщения: 3 797

Рейтинг: 0 / 0

Dima T, ты, конечно же, в DOS'е замеры делал? ;) Потому что, если ты делал замеры в операционной системе с вытесняющей многозадачностью не создавая тестирующего драйвера режима ядра с маскированием прерываний, то все эти расчёты, ровным счётом, ничего не значат.

...

Рейтинг:

0 / 0

19.02.2018, 11:09

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604028

AlekseySQL

Гость

rdb_devAlekseySQL, ты не видел громоздких конструкций, потому что в этих программах используется выравнивание по умолчанию. Помнится, даже в древнейшем Borland C++ Builder, при создании проекта (32 разрядного, естественно), устанавливалось выравнивание по умолчанию на границу 8 байт. Особенность работы процессоров Intel с оперативной памятью такова, что эти процессоры действительно быстрее работают с выравненными данными, так как если, скажем, процессор читает невыравненное двойное слово, то ему придется дважды выполнить инструкцию чтения из памяти, даже если это двойное слово находится полностью в кэше (два раза обратится к кэшу), а уж если невыравненное двойное слово попадёт на границу линии кеша и одной из линий не окажется в кэше, то возникнет "промах", будет захвачена системная шина и произведена медленная операция чтения из оперативной памяти, при этом, также, могут быть попутно выполнены отложенные инструкции чтения/записи в оперативную память, что приведет к одномоментному резкому снижению производительности.

Для 64-разрядных приложений, естественно, выравнивание должно выполняться по адресам, кратным 8 байтам.

Я как раз и пытаюсь докопаться до информации о выравнивании по- умолчанию. Откуда у вас эта информация?

Например, в опциях компилятора я не нашел подобных настроек. Ведь если компилятор это делает выравнивание по- умолчанию, то должен быть ключ отключения этой возможности. А такого ключа нету...

Функция malloc и переменные в стеке также по- умолчанию невыровнены, иначе не нужны были бы надстройки с выравниванием.

Кто выравнивает данные по- умолчанию?

...

Рейтинг:

0 / 0

19.02.2018, 11:10

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604049

rdb_dev

Участник

Откуда: с болот

Сообщения: 3 797

Рейтинг: 0 / 0

AlekseySQLЯ как раз и пытаюсь докопаться до информации о выравнивании по- умолчанию. Откуда у вас эта информация? Например, Using the GNU Compiler Collection , стр. 475

AlekseySQLНапример, в опциях компилятора я не нашел подобных настроек. Ведь если компилятор это делает выравнивание по- умолчанию, то должен быть ключ отключения этой возможности. А такого ключа нету...Такой ключ есть и не один! Есть даже отдельно ключ для выравнивания по умолчанию членов структур.

AlekseySQLФункция malloc и переменные в стеке также по- умолчанию невыравнены, иначе не нужны были бы надстройки с выравниванием.Еще как выравнены! Во-первых, функция malloc возвращает не адрес выделенной из кучи фрагмента памяти, а адрес, куда программа может поместить свои данные. Этот адрес находится за блоком служебной информации менеджера памяти. Во-вторых, венда, в некоторых случаях, при вызове функций WINAPI может попросту навернуть задачу по исключению, если при входе в API функцию стек не будет выровнен на границу двойного слова.

AlekseySQLКто выравнивает данные по- умолчанию?Компилятор.

...

Рейтинг:

0 / 0

19.02.2018, 11:46

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604067

AlekseySQL

Гость

rdb_devНапример, Using the GNU Compiler Collection , стр. 475

Код: plaintext

1.
2.
3.
4.

Alternatively, you can leave out the alignment factor and just  ask  the compiler
to align a variable or field to the default alignment for the target architecture
you are compiling for.  The default alignment is sufficient for all scalar types,
but may not be enough for all vector types on a target that supports vector
operations.  The default alignment is fixed for a particular target ABI

rdb_devТакой ключ есть и не один! Есть даже отдельно ключ для выравнивания по умолчанию членов структур.

Что это за ключи, которыми можно попросить выровнять данные ("you can leave out the alignment factor and just ask the compiler to align a variable or field to the default alignment")?

В опциях О1, О2, О3 есть только выравнивания для инструкций, и нет опций выравнивания данных:

Код: plaintext

-falign-functions  -falign-jumps 
-falign-loops  -falign-labels

Спасибо, за подсказки, я потихоньку продвигаюсь к решению вопроса (осталось только чудо- ключи найти).

...

Рейтинг:

0 / 0

19.02.2018, 12:12

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604138

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

AlekseySQL(осталось только чудо- ключи найти).

STFW #pragma align
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

19.02.2018, 13:32

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604147

AlekseySQL

Гость

Нашел ключи для платформы х86:

Код: plaintext

1.
2.
3.
4.
5.
6.

-malign-data=type
    Control how GCC aligns variables. Supported values for type are ‘compat’ uses increased alignment value compatible uses GCC 4.8 and earlier, ‘abi’ uses alignment value as specified by the psABI, and ‘cacheline’ uses increased alignment value to match the cache line size. ‘compat’ is the default.

-malign-double
-mno-align-double
    Control whether GCC aligns double, long double, and long long variables on a two-word boundary or a one-word boundary. Aligning double variables on a two-word boundary produces code that runs somewhat faster on a Pentium at the expense of more memory.
    On x86-64, -malign-double is enabled by default.

И для диалекта С++:

Код: plaintext

-faligned-new
    Enable support for C++17 new of types that require more alignment than void* ::operator new(std::size_t) provides. A numeric argument such as -faligned-new=32 can be used to specify how much alignment (in bytes) is provided by that function, but few users will need to override the default of alignof(std::max_align_t).

Так что насколько я понимаю ситуация такая: если не хочешь зависеть от компилятора, то выравнивай сам с помощью: void* _mm_malloc(int size, int base) и alignas.

...

Рейтинг:

0 / 0

19.02.2018, 13:44

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604150

rdb_dev

Участник

Откуда: с болот

Сообщения: 3 797

Рейтинг: 0 / 0

AlekseySQL, дополнительно смотри директиву компилятора #pragma pack

...

Рейтинг:

0 / 0

19.02.2018, 13:47

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604165

AlekseySQL

Гость

rdb_devAlekseySQL, дополнительно смотри директиву компилятора #pragma pack

Спасибо, уже изучил на Хабре .

...

Рейтинг:

0 / 0

19.02.2018, 13:55

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604216

AlekseySQL

Гость

Решил я сделать все по- умному и начать пользоваться выравниванием для своих больших массивов (а на мелкие переменный забить). Но не тут- то было! Нет аналога функции realloc с выравниванием, только для malloc... Засада какая- то :-(

...

Рейтинг:

0 / 0

19.02.2018, 14:39

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604247

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

AlekseySQLНет аналога функции realloc с выравниванием

Те, кто занимается оптимизацией на уровне выравнивания ни при каких обстоятельствах не
будут пользоваться таким ужасом как realloc().
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

19.02.2018, 14:58

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604274

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

19.02.2018, 15:16

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604284

Вася Уткин

Гость

rdb_devDima T, ты, конечно же, в DOS'е замеры делал? ;) Потому что, если ты делал замеры в операционной системе с вытесняющей многозадачностью не создавая тестирующего драйвера режима ядра с маскированием прерываний, то все эти расчёты, ровным счётом, ничего не значат.
Во всех Intel CPU за последние 12 лет как минимум начиная с Intel Pentium 4 и заканчивая последним SkyLake X размер кэш-линии 64 B/line : http://www.7-cpu.com/ и даже на Intel Itanium 2.
А до этого было 32 B/line на Intel Pentium MMX

Для замера проседания скорости при попадании в false-sharing не требуется отключать вытесняющую многозадачность если используется число не превышающее количество ядер, т.к. квант времени на поток на современных ОС (Win/Linux) относительно огромен - более 1 мс, а оверхед на переключение контекста менее ~1 мкс - это в 1000 раз меньше, т.е. менее 0.1%. И не требуется отключать(маскировать) прерывания если параллельно с вашим тестом не работает высоко-нагруженное приложение постоянно взаимодействующее с устройствами.
И даже если бы было потоков больше, чем ядер, и шел шквал прерываний, то это испортило бы только величину проседания при false-sharing, но не испортило бы понимание где начинается false-sharing и где он заканчивается, т.е. размер кэш-линии в любом случае статистически виден четко, т.к. в хорошем тесте замер происходит сотни тысяч раз и усредняется.

...

Рейтинг:

0 / 0

19.02.2018, 15:24

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604354

д0kХ

Гость

Довброшу навский ...

Если вы используете или планируете использовать
сериализацию на диск то

Нужно равняться по страницам памяти ОС,
а потом, внутри этого выравнивания, по линейкам кешей.
что бы выравнивание объектов не съезжало с выравнивания
по границам страниц памяти, запрашивать с диска нужно
не конкретный объект, а выровнянный по структуре
хранения на диске и в памяти блок,
из которого через коственую адресацию
получать указатель на нужный объект.

приблизительно так ....

В противном случае, сериализация на диск
польностью убъет все ваши усилия получить профит от выравнивания.

...

Рейтинг:

0 / 0

19.02.2018, 16:18

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604441

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Док. Это без пяти минут dbms.

...

Рейтинг:

0 / 0

19.02.2018, 21:01

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604459

д0kХ

Гость

maytonДок. Это без пяти минут dbms.

Я так невзначай вбросил предупредил,
ковырясь носу :)

Если уж выраниваете, то равняйте так , что бы потом
не перевыравнивать.

Толку мало если вы выиграете на локальном выравнивании, потеряете кучу времени,
но потом, в продуктиве, менеджер виртуальной памяти ОС
съест всю вашу экономию, и даже чуть чуть больше чем вы предполагали :)

...

Рейтинг:

0 / 0

19.02.2018, 21:46

| Ответить | Цитировать | Написать

А оно нам надо: выравнивание данных?

#39604464

д0kХ

Гость

maytonДок. Это без пяти минут dbms.

Это не dbms

Это толстый намек на длинные массивы и realloc,
которым интересовался автор .

...

Рейтинг:

0 / 0

19.02.2018, 22:00

| Ответить | Цитировать | Написать

21 сообщений из 46, страница 2 из 2

все

Форумы / C++ [игнор отключен] [закрыт для гостей] / А оно нам надо: выравнивание данных?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=57&msg=39604008&tid=2017967]:	0ms
get settings:	10ms
get forum list:	23ms
check forum access:	4ms
check topic access:	4ms
track hit:	81ms
get topic data:	36ms
get forum data:	3ms
get page messages:	88ms
get tp. blocked users:	1ms
others:	236ms

total:	486ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы