|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Коваленко Дмитрий, спасибо, это было интересно. БД на RAM диске, конечно, не может не отличаться от БД на HDD. PS С 2.5 сравнить не хочешь в тех же условиях ? :) ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 17:12 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Мимопроходящий, как какой, он же из Red Soft ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 17:25 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Hello, Симонов Денис! You wrote on 17 марта 2017 г. 17:30:05: Симонов Денисон же из Red Softна нём не написано Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 17:30 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Коваленко Дмитрий> У меня c FB3 SS получилась немного другая картина. Спасибо, очень интересно. А можешь сравнить SS c CS (ну и SC до кучи) ? hvlad> PS С 2.5 сравнить не хочешь в тех же условиях ? :) Присоединяюсь. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 18:09 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Коваленко Дмитрий, imho фигня полная. я даже не знаю, что комментировать. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 19:20 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Коваленко Дмитрий, все-таки комментарий появился. а с какого боку тут мульти-тредовое приложение? Тест про вставку из параллельных коннектов. Кроме того, один коннект в ФБ что 2.5 что 3.0 не распараллеливается. А я у тебя что-то там вставки в N коннектах совсем не вижу. Может я код C# не понимаю, но тем не менее. Отсюда вывод, что результаты тем более ахинейные, и ты просто меряешь распараллеливаемость своего OLE DB провайдера. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 19:40 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdv, на каждый воркер отдельное подключение. Вроде все корректно. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 19:46 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Romanzek, ткните меня носом в код. В любом случае, я уже такое количество тестов проводил, что нутром чую, что тест должен быть максимально чистым. В нашем случае мы стартовали isql с входным скриптом insert. Что может быть чище? Никакого оверхеда на компоненты, worker threads, и так далее. Кроме того, результаты. в 20 потоках 1млн записей вставляется в 4 раза быстрее, чем в 1. Это при том, что все эти потоки лупят в одну таблицу. Где тут распараллеливаемость может "вдруг случиться", скажите мне? Каким образом 32 isql втыкают записи на супере, на 12-ядерном проце так же, как в 1 коннекте, и каким образом 20 тредов из одного приложения втыкают этот же миллион записей в 4 раза быстрее чем 1 коннект? Откуда может быть такая разница? Ну давайте, объясните мне. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 19:54 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
hvladКоваленко Дмитрий, спасибо, это было интересно. БД на RAM диске, конечно, не может не отличаться от БД на HDD. Да, я тоже эту фишку просёк :) hvladPS С 2.5 сравнить не хочешь в тех же условиях ? :) Да можно. Суперклассик? Я на ночь оставлю. Гаджимурадов РустамА можешь сравнить SS c CS (ну и SC до кучи) ? Рустам, по секрету - сиди на суперсервере тройки :) --- Пока я глазел на студенток шатался, тут посчитались цифры для 40млн записей. Код: plaintext 1. 2. 3. 4. 5. 6.
База с 18MB (пустая) опухла до 2.4GB - то есть она еще даже за пределы страничного кэша не вылезла (3.1гига). ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 21:00 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdvНу давайте, объясните мне.Дисковая малёху пошустрей? тест с isql готов прогнать на своем десктопе, если что. конфиг i3 проц, ссд на 240 гиг, 16 гиг ОЗУ, Suse42.2 FB 3.0.2 ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 21:01 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Коваленко ДмитрийhvladPS С 2.5 сравнить не хочешь в тех же условиях ? :) Да можно. Суперклассик? Я на ночь оставлю.SS тоже интересно. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 21:06 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdvВ нашем случае мы стартовали isql с входным скриптом insert. Что может быть чище? Никакого оверхеда на компоненты, worker threads, и так далее.А у Коваленко препарированные инсерты. Ы ? :) Или ты set bulk_insert умеешь готовить ? :) ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 21:15 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
А ещё у него таблица всего с одним полем (индекс есть) и с неизвестным триггером (вдруг он ускоряет инсерты ? ). ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 21:19 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
hvladА у Коваленко препарированные инсерты. Ы ? :) Или ты set bulk_insert умеешь готовить ? :) ну и нахрена это надо? я не очень понимаю смысл такого теста. Ну фиг с ним, пусть препарированные. Но пусть запускает N процессов тогда. Не надо вот этой псевдо-многопоточности в C#. hvladА ещё у него таблица всего с одним полем (индекс есть) у нас в тесте было Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
Что с одним, что с двумя столбцами - это напороться на артефакт с 50% заполнением страниц. Я про это уже несколько раз писал. Правда, на ФБ 3 не проверял. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 21:47 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
господа. Для повтора теста требуется некий консенсус по поводу условий этого теста. Если я еще понимаю 1. проверку вставки без индексов совсем хотя это нереальный случай, то 2. проверка вставки с несколькими индексами относится несколько к другому тесту - а именно - замедлению вставки при увеличении количества индексов. Понятно, что к тесту как таковой параллельной вставки это имеет мало отношения. У нас уже были семинары (за рубежом и в Москве) где Алексей Ковязин показывал разницу между вставкой с индексом bigint и индексом varchar(36). То есть, понятно, что вставка с увеличением количества индексов замедлится, и ее можно было бы проверить в монопольном режиме, достаточно быстро, а дальше уже экстраполировать на результаты "минимальной" вставки в отношении "многопользовательского режима". Но - вы чего хотите-то? Например, у нас в кулуарах зашел вопрос об использовании gen_id. Например, если его вообще исключить, то получится сугубо синтетический тест. С другой стороны, вызов gen_id на каждый insert "монополизирует" вставку. Но в реальной системе-то идентификаторы как-то генерятся! gen_id напрямую, или триггерами, или еще бог знает как. Проводить тест "налысо", т.е. без минимальной привязки к практическому программированию, я не вижу смысла. Соответственно, возникает вопрос. Либо повторить тест в том виде, в каком он был сделан, именно на 3.0.2, либо повторить тест с множеством отклонений. Понятно, что меня тоже интересует разница "вообще, при разных условиях". Но поскольку сам по себе тест займет не меньше недели (к слову, я ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 23:53 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdv, экая хня. урл на ютуб в теге http движок развернул в embedded видео. тут я не виноват. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2017, 23:55 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Ты хочешь набор мнений услышать или чего? Для этого надо четкую цель теста озвучить. Лично я за тест на одной плоской таблице, с 5-7 полями (2 строковых, остальные int), в разрезе 1-8 коннектов по всем архитектурам, а) без индексов совсем б) с PK+ 1-2 индекса. 10-40 лямов записей не нужно - достаточно, чтобы минимальная длительность превышала 30 секунд и была стабильна. Ну и 2.5 vs 3.0. kdv> gen_id. Например, если его вообще исключить, kdv> то получится сугубо синтетический тест kdv> Проводить тест "налысо", т.е. без минимальной привязки kdv> к практическому программированию, я не вижу смысла. Так он и сейчас синтетический. Теоретически, его можно и позже "присвоить" update where pk is null. А насчет реальной системы - в реально системе это всё вряд ли будет монопольно, не говоря уже о том, что у таблицы есть зависимости. Неделей раньше или позже - значения не имеет. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 00:17 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Гаджимурадов Рустам10-40 лямов записей не нужно - достаточно, чтобы минимальная длительность превышала 30 секунд и была стабильна. Ну и 2.5 vs 3.0 как видим, тут и 1 млн записей достаточно. Гаджимурадов РустамТак он и сейчас синтетический. тут ты совсем неправ. Исходный тест был разработан по мотивам (и со структурой таблицы) конкретной компании. Для проверки, что там у них "распараллеливается". Выяснилось, что все это фикция. Гаджимурадов РустамА насчет реальной системы - в реально системе это всё вряд ли будет монопольно, не говоря уже о том, что у таблицы есть зависимости. гм, что??? в куче систем есть задача по массовой заливке данных. Понятно что в 90% этих систем может быть задача по массовому обновлению данных, но это уже несколько другая тема :-) в частности, мы периодически выкладывали логи нашего теста oltp-emul https://ib-aid.com/en/logs-3-0/ Это куда более "синтетично" чем просто вставка или update. Это эмуляция вполне реальной системы. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 00:26 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdv> Исходный тест был разработан по мотивам kdv> (и со структурой таблицы) конкретной компании Она у них без зависимостей что ли?! > гм, что??? в куче систем есть задача по массовой заливке данных. И? Они заливку ночером на одной таблице запускают? Это разве что с репликацией какой-то сравнить, да и-то сильно вырожденный случай. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 00:35 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Кстати, да. Интересно бы знать цель теста. И этого и нового. Вот, например, вчера по рассылке ссылка на видео пришла. [spoiler] Видео ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 00:52 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Цель всех тестов - сравнить. Вопросы звучат как "что сравнивать?" и "чтобы что узнать?". Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 00:58 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdv2. проверка вставки с несколькими индексами относится несколько к другому тесту - а именно - замедлению вставки при увеличении количества индексов. Лично у меня есть подозрение, что это замедление вставки - тоже миф и большее количество индексов увеличит распараллеливание. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 01:07 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Гаджимурадов Рустам, в том и вопрос: "чтобы что узнать". Вот (например), лично для тебя, как для разработчика - какая польза от информации, что на десктопном компе с 4Гб ОЗУ фаерберд 2.1 ресторит базу быстрее, чем FB 2.5? Это чем-то напоминает сие сообщение "британских ученых" . Общий вес жертв пауков составляет 400-800 миллионов тонн в год. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 01:07 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
Гаджимурадов РустамОна у них без зависимостей что ли?! каких зависимостей? что значат "зависимости" в твоем понимании? FK? Триггеры? Гаджимурадов РустамИ? Они заливку ночером на одной таблице запускают? нет, постоянно заливка работает. биржевые котировки, микротранзакции. Гаджимурадов РустамЭто разве что с репликацией какой-то сравнить, да и-то сильно вырожденный случай. да х. с ним. Есть же у людей задачи вставки нового товара, обновления прайсов, и прочего. чччДИнтересно бы знать цель теста. И этого и нового. есть такая мулька - "параллельно вставлять". Этот тест показал, что эта "мулька" бессмыслена. чччДНо какая польза разработчику от этой информации? разработчику пользы нет, а администратору - есть. По крайней мере он может - оценить 2.0 vs 2.1 2.5 если сидит на 2.0 - оценить restore с теми или иными опциями (-se или прочее) чччДНаверняка, цель какая-то была. Но вот какая - непонятно. лично у меня была цель сравнить IB и FB. Ну и остальное. Dimitry Sibiryakovчто это замедление вставки - тоже миф и большее количество индексов увеличит распараллеливание. ну пендец... ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 01:20 |
|
ANN: видео о мифе эффективности параллельной вставки
|
|||
---|---|---|---|
#18+
kdv... чччДНо какая польза разработчику от этой информации? разработчику пользы нет, а администратору - есть. По крайней мере он может - оценить 2.0 vs 2.1 2.5 если сидит на 2.0 ... И? Администратор, посмотрев твои видео, потребует от разработчика мигрировать программный комплекс на новую версию??? С каких пор администратор принимает решение о выборе СУБД? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2017, 01:25 |
|
|
start [/forum/topic.php?fid=40&msg=39421828&tid=1560443]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
127ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
65ms |
get tp. blocked users: |
1ms |
others: | 15ms |
total: | 251ms |
0 / 0 |