|
|
|
Разница между двумя алгоритмами - различна на разных платформах.
|
|||
|---|---|---|---|
|
#18+
Есть два вычислительных алгоритма. Сравнивается время их выполнения - сначала выполняется один, потом второй. Каждый - параллельно в 50 потоках. Сore i5 760 (4 ядра, нет HT) / 8GB RAM / win7 - первый на 5...10% быстрее второго. Xeon E7 - 4830 / 32 GB RAM / Windows Server 2008 R2 Standard - первый на 200% медленнее второго :) Каждый алгоритм использует большую таблицу констант в памяти - мегабайт по 100, т.е. в кеш не влезает. Во втором даже оптимизирован доступ к данным, сделано выравнивание и прочие упорядочивания чтений из ОЗУ. Куда копать? Нет, не так... Куда ДУМАТЬ? Чем может быть вызвано? Спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.08.2012, 00:11 |
|
||
|
Разница между двумя алгоритмами - различна на разных платформах.
|
|||
|---|---|---|---|
|
#18+
Ксеонов - 2 на матери. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.08.2012, 00:12 |
|
||
|
Разница между двумя алгоритмами - различна на разных платформах.
|
|||
|---|---|---|---|
|
#18+
Начать с самих алгоритмов: 1) Сделать асимптотический анализ обоих алгоритмов. 2) Замерить линейные куски алгоритмов и умножить их на соответствующие O(f(n)) Полученные значения будут отражать ожидаемое время выполнения на некоем абстрактном железе. Если ожидаемое время выполнения не совпадает с реальным на каком-либо железе, значит это железо вносит свои коррективы: кэши памяти, (не-)производительные внешние накопители и подобное. Тогда уже можно будет смотреть по факту железа и искать место проблемы - какой из линейных кусков выполняется неожиданно долго. Если обе задачи распараллеливаются, то еще одним проблемным местом может быть само распараллеливание и синхронизация. Это уже обычно зависит от ОС и используемых механизмов распараллеливания. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.08.2012, 00:27 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=37932699&tid=1342154]: |
0ms |
get settings: |
5ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
166ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
35ms |
get tp. blocked users: |
1ms |
| others: | 204ms |
| total: | 441ms |

| 0 / 0 |
