powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / ANN: видео о мифе эффективности параллельной вставки
25 сообщений из 91, страница 2 из 4
ANN: видео о мифе эффективности параллельной вставки
    #39421779
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коваленко Дмитрий,

спасибо, это было интересно.

БД на RAM диске, конечно, не может не отличаться от БД на HDD.

PS С 2.5 сравнить не хочешь в тех же условиях ? :)
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421791
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Мимопроходящий,

как какой, он же из Red Soft
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421796
Мимопроходящий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Hello, Симонов Денис!
You wrote on 17 марта 2017 г. 17:30:05:

Симонов Денисон же из Red Softна нём не написано
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421828
Гаджимурадов Рустам
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коваленко Дмитрий> У меня c FB3 SS получилась немного другая картина.

Спасибо, очень интересно. А можешь сравнить SS c CS (ну и SC до кучи) ?

hvlad> PS С 2.5 сравнить не хочешь в тех же условиях ? :)

Присоединяюсь.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421869
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коваленко Дмитрий,

imho фигня полная. я даже не знаю, что комментировать.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421879
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коваленко Дмитрий,

все-таки комментарий появился. а с какого боку тут мульти-тредовое приложение? Тест про вставку из параллельных коннектов.
Кроме того, один коннект в ФБ что 2.5 что 3.0 не распараллеливается. А я у тебя что-то там вставки в N коннектах совсем не вижу. Может я код C# не понимаю, но тем не менее.
Отсюда вывод, что результаты тем более ахинейные, и ты просто меряешь распараллеливаемость своего OLE DB провайдера.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421882
Romanzek
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdv,

на каждый воркер отдельное подключение. Вроде все корректно.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421884
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Romanzek,

ткните меня носом в код. В любом случае, я уже такое количество тестов проводил, что нутром чую, что тест должен быть максимально чистым. В нашем случае мы стартовали isql с входным скриптом insert. Что может быть чище? Никакого оверхеда на компоненты, worker threads, и так далее.

Кроме того, результаты. в 20 потоках 1млн записей вставляется в 4 раза быстрее, чем в 1. Это при том, что все эти потоки лупят в одну таблицу. Где тут распараллеливаемость может "вдруг случиться", скажите мне?
Каким образом 32 isql втыкают записи на супере, на 12-ядерном проце так же, как в 1 коннекте, и каким образом 20 тредов из одного приложения втыкают этот же миллион записей в 4 раза быстрее чем 1 коннект? Откуда может быть такая разница?
Ну давайте, объясните мне.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421912
Коваленко Дмитрий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hvladКоваленко Дмитрий,

спасибо, это было интересно.

БД на RAM диске, конечно, не может не отличаться от БД на HDD.

Да, я тоже эту фишку просёк :)

hvladPS С 2.5 сравнить не хочешь в тех же условиях ? :)
Да можно. Суперклассик? Я на ночь оставлю.

Гаджимурадов РустамА можешь сравнить SS c CS (ну и SC до кучи) ?

Рустам, по секрету - сиди на суперсервере тройки :)

---
Пока я глазел на студенток шатался, тут посчитались цифры для 40млн записей.
Код: plaintext
1.
2.
3.
4.
5.
6.
1	4981
2	2744
4	1807
8	1458
10	1413
20	1316

База с 18MB (пустая) опухла до 2.4GB - то есть она еще даже за пределы страничного кэша не вылезла (3.1гига).
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421913
Ivan_Pisarevsky
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdvНу давайте, объясните мне.Дисковая малёху пошустрей?

тест с isql готов прогнать на своем десктопе, если что.
конфиг i3 проц, ссд на 240 гиг, 16 гиг ОЗУ, Suse42.2 FB 3.0.2
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421916
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коваленко ДмитрийhvladPS С 2.5 сравнить не хочешь в тех же условиях ? :)
Да можно. Суперклассик? Я на ночь оставлю.SS тоже интересно.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421918
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdvВ нашем случае мы стартовали isql с входным скриптом insert. Что может быть чище? Никакого оверхеда на компоненты, worker threads, и так далее.А у Коваленко препарированные инсерты. Ы ? :)
Или ты set bulk_insert умеешь готовить ? :)
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421921
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А ещё у него таблица всего с одним полем (индекс есть) и с неизвестным триггером (вдруг он ускоряет инсерты ? ).
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421926
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hvladА у Коваленко препарированные инсерты. Ы ? :)
Или ты set bulk_insert умеешь готовить ? :)
ну и нахрена это надо? я не очень понимаю смысл такого теста. Ну фиг с ним, пусть препарированные. Но пусть запускает N процессов тогда. Не надо вот этой псевдо-многопоточности в C#.

hvladА ещё у него таблица всего с одним полем (индекс есть)
у нас в тесте было
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
create table fix (
    id bigint not null
    ,rate_time timestamp not null
    ,dbwrite_time timestamp not null
    ,quote_ref int not null
    ,rate_bid double precision not null
    ,rate_ask double precision not null
    ,src_bid_ref int not null
    ,src_ask_ref int not null
    ,sl_session_uid bigint
    ,constraint pk_fix primary key (id) using index pk_fix
);



Что с одним, что с двумя столбцами - это напороться на артефакт с 50% заполнением страниц. Я про это уже несколько раз писал. Правда, на ФБ 3 не проверял.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421970
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
господа. Для повтора теста требуется некий консенсус по поводу условий этого теста.
Если я еще понимаю
1. проверку вставки без индексов совсем
хотя это нереальный случай, то
2. проверка вставки с несколькими индексами
относится несколько к другому тесту - а именно - замедлению вставки при увеличении количества индексов.
Понятно, что к тесту как таковой параллельной вставки это имеет мало отношения. У нас уже были семинары (за рубежом и в Москве) где Алексей Ковязин показывал разницу между вставкой с индексом bigint и индексом varchar(36).
То есть, понятно, что вставка с увеличением количества индексов замедлится, и ее можно было бы проверить в монопольном режиме, достаточно быстро, а дальше уже экстраполировать на результаты "минимальной" вставки в отношении "многопользовательского режима".

Но - вы чего хотите-то? Например, у нас в кулуарах зашел вопрос об использовании gen_id. Например, если его вообще исключить, то получится сугубо синтетический тест. С другой стороны, вызов gen_id на каждый insert "монополизирует" вставку. Но в реальной системе-то идентификаторы как-то генерятся! gen_id напрямую, или триггерами, или еще бог знает как.
Проводить тест "налысо", т.е. без минимальной привязки к практическому программированию, я не вижу смысла.

Соответственно, возникает вопрос. Либо повторить тест в том виде, в каком он был сделан, именно на 3.0.2, либо повторить тест с множеством отклонений. Понятно, что меня тоже интересует разница "вообще, при разных условиях". Но поскольку сам по себе тест займет не меньше недели (к слову, я
YouTube Video
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421971
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdv,

экая хня. урл на ютуб в теге http движок развернул в embedded видео. тут я не виноват.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421978
Гаджимурадов Рустам
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ты хочешь набор мнений услышать или чего?
Для этого надо четкую цель теста озвучить.

Лично я за тест на одной плоской таблице,
с 5-7 полями (2 строковых, остальные int),
в разрезе 1-8 коннектов по всем архитектурам,
а) без индексов совсем б) с PK+ 1-2 индекса.

10-40 лямов записей не нужно - достаточно,
чтобы минимальная длительность превышала
30 секунд и была стабильна. Ну и 2.5 vs 3.0.

kdv> gen_id. Например, если его вообще исключить,
kdv> то получится сугубо синтетический тест
kdv> Проводить тест "налысо", т.е. без минимальной привязки
kdv> к практическому программированию, я не вижу смысла.

Так он и сейчас синтетический. Теоретически, его
можно и позже "присвоить" update where pk is null.
А насчет реальной системы - в реально системе это
всё вряд ли будет монопольно, не говоря уже о том,
что у таблицы есть зависимости.

Неделей раньше или позже - значения не имеет.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421980
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гаджимурадов Рустам10-40 лямов записей не нужно - достаточно,
чтобы минимальная длительность превышала
30 секунд и была стабильна. Ну и 2.5 vs 3.0
как видим, тут и 1 млн записей достаточно.
Гаджимурадов РустамТак он и сейчас синтетический.
тут ты совсем неправ. Исходный тест был разработан по мотивам (и со структурой таблицы) конкретной компании. Для проверки, что там у них "распараллеливается". Выяснилось, что все это фикция.
Гаджимурадов РустамА насчет реальной системы - в реально системе это всё вряд ли будет монопольно, не говоря уже о том, что у таблицы есть зависимости.
гм, что??? в куче систем есть задача по массовой заливке данных. Понятно что в 90% этих систем может быть задача по массовому обновлению данных, но это уже несколько другая тема :-)

в частности, мы периодически выкладывали логи нашего теста oltp-emul
https://ib-aid.com/en/logs-3-0/
Это куда более "синтетично" чем просто вставка или update. Это эмуляция вполне реальной системы.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421984
Гаджимурадов Рустам
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdv> Исходный тест был разработан по мотивам
kdv> (и со структурой таблицы) конкретной компании

Она у них без зависимостей что ли?!

> гм, что??? в куче систем есть задача по массовой заливке данных.

И? Они заливку ночером на одной таблице запускают?
Это разве что с репликацией какой-то сравнить, да и-то
сильно вырожденный случай.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421989
чччД
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Кстати, да.
Интересно бы знать цель теста. И этого и нового.

Вот, например, вчера по рассылке ссылка на видео пришла.
[spoiler] Видео
YouTube Video
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421994
Гаджимурадов Рустам
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Цель всех тестов - сравнить. Вопросы звучат
как "что сравнивать?" и "чтобы что узнать?".
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421998
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdv2. проверка вставки с несколькими индексами
относится несколько к другому тесту - а именно - замедлению вставки при увеличении
количества индексов.

Лично у меня есть подозрение, что это замедление вставки - тоже миф и большее количество
индексов увеличит распараллеливание.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39421999
чччД
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гаджимурадов Рустам,

в том и вопрос: "чтобы что узнать".

Вот (например), лично для тебя, как для разработчика - какая польза от информации, что на десктопном компе с 4Гб ОЗУ фаерберд 2.1 ресторит базу быстрее, чем FB 2.5?
Это чем-то напоминает сие сообщение "британских ученых" .

Общий вес жертв пауков составляет 400-800 миллионов тонн в год.
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39422002
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гаджимурадов РустамОна у них без зависимостей что ли?!
каких зависимостей?
что значат "зависимости" в твоем понимании? FK? Триггеры?
Гаджимурадов РустамИ? Они заливку ночером на одной таблице запускают?
нет, постоянно заливка работает. биржевые котировки, микротранзакции.
Гаджимурадов РустамЭто разве что с репликацией какой-то сравнить, да и-то сильно вырожденный случай.
да х. с ним. Есть же у людей задачи вставки нового товара, обновления прайсов, и прочего.
чччДИнтересно бы знать цель теста. И этого и нового.
есть такая мулька - "параллельно вставлять". Этот тест показал, что эта "мулька" бессмыслена.
чччДНо какая польза разработчику от этой информации?
разработчику пользы нет, а администратору - есть. По крайней мере он может
- оценить 2.0 vs 2.1 2.5 если сидит на 2.0
- оценить restore с теми или иными опциями (-se или прочее)
чччДНаверняка, цель какая-то была. Но вот какая - непонятно.
лично у меня была цель сравнить IB и FB. Ну и остальное.
Dimitry Sibiryakovчто это замедление вставки - тоже миф и большее количество индексов увеличит распараллеливание.
ну пендец...
...
Рейтинг: 0 / 0
ANN: видео о мифе эффективности параллельной вставки
    #39422004
чччД
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kdv...
чччДНо какая польза разработчику от этой информации?
разработчику пользы нет, а администратору - есть. По крайней мере он может
- оценить 2.0 vs 2.1 2.5 если сидит на 2.0
...

И?
Администратор, посмотрев твои видео, потребует от разработчика мигрировать программный комплекс на новую версию???

С каких пор администратор принимает решение о выборе СУБД?
...
Рейтинг: 0 / 0
25 сообщений из 91, страница 2 из 4
Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / ANN: видео о мифе эффективности параллельной вставки
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]