Размещение в памяти переменных на чистом Си / C++

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / C++ [игнор отключен] [закрыт для гостей] / Размещение в памяти переменных на чистом Си

5 сообщений из 30, страница 2 из 2

все

Размещение в памяти переменных на чистом Си

#38962197

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

MasterZivА кэш или не кэш - в десятки раз, что немного.
Наверно можно в синтетических тестах до 10 раз ускориться, но в реале максимум в 2-3 раза на современном железе. Например у меня при поиске простых двухкратное ускорение получилось за счет уменьшения окна обсчитываемого за раз. Это при том что количество мат.операций заметно увеличивалось. Я так понимаю окно просто стало целиком влезать в кэш проца.

ИМХУ попадание в кэш проца было актуально когда память была DDR2, на DDR3 работало намного шустрее с тем же процом.
Сейчас уже на подходе DDR4 с частотой 3 ГГц, с такой памятью разница в скоростях обращения к кэшу и к памяти вообще станет незначительной.

MasterZivглавный источник оптимизации программы - это алгоритм обработки данных
И надо оптимизироваться в сторону распараллеливания, т.к. ускорение процов и памяти свыше 3-4 ГГц не стоит ожидать в ближайшем обозримом будущем. А многоядерные процы готовы выпускать все, только применения им практически нет, т.к. очень мало задач хорошо поддающихся распараллеливанию.

...

Рейтинг:

0 / 0

19.05.2015, 08:17:40

| Ответить | Цитировать | Написать

Размещение в памяти переменных на чистом Си

#38962636

Leonid Kudryavtsev

Участник

Сообщения: 9 300

Рейтинг: 0 / 0

S70Dimitry Sibiryakov,

извини, конечно, за прямоту. Твой ответ называется "ответом программиста" - абсолютно точный и настолько же бесполезный.
Есть данные. Поступают они с разной интенсивностью, которая в первом приближении - понятна. Когда данные криво лежат, проц постоянно промахивается по кешу, кроме того, забирает из памяти данные, которые ему сейчас не нужны. Как минимум, я хочу разнести данные с разной интенсивностью обновления.
Насколько я помню, L1 кеш имеет/имел линию в 32 байт. Т.ч. все что больше - глубоко пофиг будут рядом или не рядом (TLB пока не рассматриваем).

Про оптимизацию под L2 / L3 кеш я как-то даже и не слышал

Кроме того, в процессоре out of order execution. Если для какой-то инструкции данные еще не прибыли, но есть следующие инструкции которые можно выполнить - процессор все равно простаивать не будет.

Локальные и глобальные переменные модуля (.C файл) - все равно лежат "рядом". Компилятор и будет их размешать ровно так, так они описаны в приложении.

Тут главное не словить промахи при выполнении, но это нужно брать реальное приложение и запускать под чем нибудь типа Intel VTune (пользовался в начале 2000-х). Промахи могут быть совершенно "экзотические" и крайне удивительные. Лично я напарывался на промах обращения к выравненным данным после обращения к невыравненным (алгоритм такой был). Так там наоборот: то что данные попали в одну линию кеша - как раз и было проблемой. Попадали бы в разные линии, промаха бы не было )))

Т.ч. самая главная "оптимизация" не плодить лишних переменных и сущности )))

Если речь идет о выделении памяти через new / mallloc - тут тоже все сказали. Просто выделяйте одну область и ее используйте.

S70Поступают они с разной интенсивностью, которая в первом приближении - понятна. Когда данные криво лежат, проц постоянно промахивается по кешу
Тут ключевой вопрос ОТКУДА и КАК поступают данные.

Если данные поступают по сети - тут не ЯДРО проца по кешу может промахнуться, а прерывание от сетевой карты не на то ядро придти ))) (если проц многоядерный). А при таком "промахе" никакой кеш не поможет, ядро совсем другое

Если же система многозадачная, то как бы Вы не оптимизировали, скорее всего в промежутках между поступлениями данных все кеши уже кто нибудь выбьет напрочь (другой поток, ОС, сетевой драйвер и так далее).

Если данные приходят по сети (а она скорее всего TCP/IP) Оптимизировать можно, но тут проблемы AFAIK совсем другого уровня. Взаимодействие железа + прерывания + ядро проца + драйвер + ОС + прикладной софт. Но AFAIK этим занимаются только производители ОЧЕНЬ дорогого и специфического железа. Всякая китайская дешевка ))) типа Ethernet 10 G и их драйвера на такое внимание не обращают. Т.ч. там хоть оптимизируй прикладной соофт хоть нет - ничто не поможет ))). Только выкидывать нафиг устаревший TCP/IP и переходить на что нибудь более современное ))) AFAIK

...

Рейтинг:

0 / 0

19.05.2015, 13:28:39

| Ответить | Цитировать | Написать

Размещение в памяти переменных на чистом Си

#38962824

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

Leonid KudryavtsevНасколько я помню, L1 кеш имеет/имел линию в 32 байт.
в i7 L1,L2,L3 имеют линию 64 байта.

для борьбы с TLB - большие страницы выделять

...

Рейтинг:

0 / 0

19.05.2015, 15:21:49

| Ответить | Цитировать | Написать

Размещение в памяти переменных на чистом Си

#38962832

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

Leonid KudryavtsevТолько выкидывать нафиг устаревший TCP/IP и переходить на что нибудь более современное )))
PGM , например

...

Рейтинг:

0 / 0

19.05.2015, 15:25:20

| Ответить | Цитировать | Написать

Размещение в памяти переменных на чистом Си

#38962917

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Тут надо оптимизировать применительно к алгоритму и к железке. Без этих знаний получается
философская беседа.

...

Рейтинг:

0 / 0

19.05.2015, 16:20:01

| Ответить | Цитировать | Написать

5 сообщений из 30, страница 2 из 2

все

Форумы / C++ [игнор отключен] [закрыт для гостей] / Размещение в памяти переменных на чистом Си

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=57&gotonew=1&tid=2018991]:	0ms
get settings:	10ms
get forum list:	15ms
check forum access:	4ms
check topic access:	4ms
track hit:	179ms
get topic data:	11ms
get first new msg:	5ms
get forum data:	2ms
get page messages:	50ms
get tp. blocked users:	1ms
others:	234ms

total:	515ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы