|
|
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
есть смысл маленькие подмассивы сортировать иначе - insertion_sort-ом стандартная сортировка в джаве, например, так делает, порог = 32 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.08.2014, 23:08:05 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
hard for me а там используется пункт 6 в описании ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.08.2014, 23:19:14 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
SOFT FOR YOU, 1) test_integers: заменил в шараховской HybridSortSha_AII вызовы Compare на прямое сравнение (+ пара правок под integer) - и она обогнала вашу (немного) 2) вставил в test_integers код вашего шаблона и поставил "type T = integer" - скорость оказалась чуточку, но медленнее чем у QuickSortInteger (мелочь, а неприятно) 3) еще по-мелочи: вы проверяли выигрыш самодельного "стека" по скорости? ведь при работе такого же решения, но с рекурсией, стек будет задействован на в точности ту же глубину - кстати, у вас она ограничена 64, а в системном явно больше ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 13:36:45 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
з.ы. как ни странно, с test_strings таких проблем нет - измененный шаблон даже чуть быстрее, чем QuickSortString и шараховская от вашей отстала ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 13:41:06 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
до кучи: - для несколькисекундных тестов разрешение GetTickCount маловато - QueryPerformanceCounter гораздо лучше - перед тестом стоит сделать Randomize, чтобы на разных запусках были разные данные (хотя может быть смысл и не делать этого) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 13:58:18 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
а в целом, раз придраться больше не к чему, можешь считать, что все отлично :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 15:00:25 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
optimiserз.ы. как ни странно, с test_strings таких проблем нет - измененный шаблон даже чуть быстрее, чем QuickSortString и шараховская от вашей отстала Какая из? Их там много. Ну, и выложить было бы неплохо куда-нить, а то, может, не то или не так тестировали. Выравнивания опять же могут влиять. Сам понимаешь, лучше один раз увидеть. P.S. Довольно трудно поверить в отставание, т.к. в плане ускорения предложенный здесь вариант не содержит ничего нового по сравнению с рассмотренными в статье вариантами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 15:21:00 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
Aleksandr Sharahov, возможно, я коряво заменил у вас вызовы Compare на прямые сравнения - с приведениями указателей к строкам видимо, обрадовался, что моя наивная реализация оказалась чуть быстрее и этим удовлетворился тестил в дельфи 7 мои комменты начинаются 4 слешами по-хорошему тестирование нужно переделывать - не по 100 прогонов каждого, а 100 прогонов * (всех по очереди по 1 разу), и не суммировать время, а брать минимальное в микросекундах (имхо, так точнее) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 23:19:29 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
кстати, в fastcode есть CompareStr - может, она побыстрее встроенного сравнения будет? и вроде у вас после всех сравнений "< 0" - Compare мог бы булеан возвращать и быть покороче ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.08.2014, 23:32:49 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
optimiserкстати, в fastcode есть CompareStr - может, она побыстрее встроенного сравнения будет? и вроде у вас после всех сравнений "< 0" - Compare мог бы булеан возвращать и быть покороче Очевидно, что сортировки имеет смысл сравнивать, если у них функции сравнения одинаковы. Поэтому алгоритмы часто записываются так, чтобы они использовали один тип сравнения, обычно это сравнение "строго меньше". Что эквивалентно возврату булевского значения. Если же вы используете разные функции сравнения, то тем самым ставите проверяемые алгоритмы сортировки в неравное положение. Описанные в моей статье алгоритмы допускают использование любых функций сравнения, в том числе и возвращающих булевское значение. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 00:02:13 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
optimiserвидимо, обрадовался, что моя наивная реализация оказалась чуть быстрее и этим удовлетворился тестил в дельфи 7 на E6850 (D7, InsCount=32 у всех алгоритмов) чуть быстрее те, что в статье: QuickSort(String) test: SmartQuickSort... 11581ms. SmartQuickSortTemplate... 11533ms. QuickSortSha_AII... 9689ms. QuickSortSha_0AA... 9693ms. QuickSortSha_A0I... 9691ms. My DumbQuickSort... 10195ms. Это неудивительно, т.к. это все это почти одинаковые алгоритмы. В код особо не вникал, но замечу, что время измеряется довольно грязно: включается копирование буфера, проверка правильности сортировки, перемежается с выводом - ужас. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 00:56:09 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
optimiser спасибо за участие! автор1) test_integers: заменил в шараховской HybridSortSha_AII вызовы Compare на прямое сравнение (+ пара правок под integer) - и она обогнала вашу (немного) рано или поздно нужно было это проверить что круче: низкоуровневые оптимизации и алгоритмы победили в очередной раз алгоритмы :) автор2) вставил в test_integers код вашего шаблона и поставил "type T = integer" - скорость оказалась чуточку, но медленнее чем у QuickSortInteger (мелочь, а неприятно) Это потому что сама функция универсальная Чтобы скорость осталась прежней - нужно CMP_MODE выставить 1 Сейчас же копируется не интеджер, а массив байт - поэтому медленнее автор3) еще по-мелочи: вы проверяли выигрыш самодельного "стека" по скорости? ведь при работе такого же решения, но с рекурсией, стек будет задействован на в точности ту же глубину - кстати, у вас она ограничена 64, а в системном явно больше Проверять - не проверял. Но смысл в том, что в случае самодельного стека экономятся(оптимизируются) регистры, а так же снимаются накладные расходы на вызов функции - push/pop регистров в стек и call/ret. А что до глубины в 64 - так это явно с запасом :). На случай если в x64 приложении будет сортироваться массив байт размером 2^64 (я даже не знаю как такое число назвать) и при этом не будут использоваться сортировки вставками :) авторз.ы. как ни странно, с test_strings таких проблем нет - измененный шаблон даже чуть быстрее, чем QuickSortString это погрешности измерения можешь сравнить код функций - должно быть идентично автордо кучи: - для несколькисекундных тестов разрешение GetTickCount маловато - QueryPerformanceCounter гораздо лучше - перед тестом стоит сделать Randomize, чтобы на разных запусках были разные данные (хотя может быть смысл и не делать этого) я согласен, только времени было впритык если внесёшь свою лепту - будет круто Aleksandr Sharahovна E6850 (D7, InsCount=32 у всех алгоритмов) чуть быстрее те, что в статье: QuickSort(String) test: SmartQuickSort... 11581ms. SmartQuickSortTemplate... 11533ms. QuickSortSha_AII... 9689ms. QuickSortSha_0AA... 9693ms. QuickSortSha_A0I... 9691ms. My DumbQuickSort... 10195ms. Это неудивительно, т.к. это все это почти одинаковые алгоритмы. Помоему результат отличный. Твои сортировки быстрее моей больше чем на 10%! Не скажешь навскидку, в чём цимус? В трёх опорах? Я у себя побоялся их применять. авторВ код особо не вникал, но замечу, что время измеряется довольно грязно: включается копирование буфера, проверка правильности сортировки, перемежается с выводом - ужас. Проверка корректности используется только в DEBUG Копирование буфера... Я просто не знаю, как сделать лучше Модернизируй пожалуйста тест и выложи сорсы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 07:17:26 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
модернизировал тест по-своему, выкладываю Pentium E6700, Delphi 7 Код: plaintext 1. 2. 3. 4. 5. 6. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 11:38:10 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
очевидно, разница в том, что в коре-дуо 4 МБ кэша 2 уровня, а в моём пентиуме - только 2 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 12:12:36 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
на старом ноутбуке (T5600, тоже с 2 МБ кэша) более "закономерные" результаты: "смарт" впереди, но хотя бы мой отстал от шараховского ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 12:24:41 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
для полноты: размер L1 кэша у 2 моих процов (десктоп и ноут) тоже совпадает - 32 КБ * 2 ядра * 2 (данных+инструкций) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 13:52:19 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
как может быть, что на одной конфигурации мой код работает быстрее, а на другой - Шарахова? должен быстрее работать код Шарахова везде ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 17:35:42 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
> должен ситуация "works for me" некому и не из кого "долг" выбивать: у каждого на его компе его код быстрее :) btw, мы еще на атлонах не пробовали с 64KB L1 cache ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 18:25:36 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
я уж не говорю про x64 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 18:28:54 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
optimiserу каждого на его компе его код быстрее :)в смысле, я тоже этого добился было достаточно избавится от вложенности процедур, которую я ранее сделал в совершенно напрасной уверенности, что чем меньше параметров передается, тем лучше правда, на некоторых данных (т.е. запусках - я вставил Randomize) Smart всё же обгонял Dumb еще, неправильные способы (рекурсия правых, левых, больших половин) чуть обгоняют правильный (рекурсия меньших половин) в общем, иллюзия борьбы далеко за гранью погрешности ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 19:17:39 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
Хотелось бы, чтобы Александр сравнил и сказал, почему у него быстрее на 10% Есть ли простая модификация, после которой мой код обгонит его ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.08.2014, 20:02:17 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
SOFT FOR YOUу него быстрее на 10%это у тебя так? шо за проц? а на моём железе у него медленнее, но от силы на 3-4% (пень E6700, 2M L2 Cache, 3.20 GHz, 1066 FSB) Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.08.2014, 04:03:17 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
немного поиграл с размерами массива данных и длинами строк, и понял, что пора бросать этой ерундой маяться: то один вперед вырвется, то другой... в общем, единицы процентов не стоят серьезных усилий, разве что ради пиара и для маркетинга ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.08.2014, 05:29:50 |
|
||
|
О QuickSort не говори
|
|||
|---|---|---|---|
|
#18+
asviridenkovТогда есть смысл посмотреть на код! Ты раз такой любитель оптимизации, то обратил бы внимание на другой аспект. У меня вот гораздо чаще возникают претензии к скорости поиска а не сортировки. С появлением TDictionary стало получше, но все равно говорят что там до оптимальности очень далеко, особенно в плане скорости работы хэш-функции. Вот если бы ты написал что-то компилируемое во всей линейке XE2+ 32/64 всеплатформенное и работающее быстрее, было бы круто. Представляю вашем вниманию альтернативную библиотеку шаблонов Rapid.Generics https://github.com/d-mozulyov/Rapid.Generics Бенчмарки сортировок, поисков и контейнеров привожу ниже. Бенчмарк по хеш-таблицам будет скорее всего на этой неделе, но в другой ветке. P.S. Для оптимизации сортировок, небольшие части сортируются вставками. Для числовых предусмотрены так же поразрядные сортировки P.P.S. Данные таблицы характерны для версий компилятора XE7+. На версиях ниже, производительность будет существенно отличаться ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.03.2017, 02:33:46 |
|
||
|
|

start [/forum/topic.php?fid=58&msg=38718858&tid=2042048]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
189ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
72ms |
get tp. blocked users: |
1ms |
| others: | 230ms |
| total: | 532ms |

| 0 / 0 |
