высокопроизводительная CLR-сборка с кодом на C++ для SQL Server / WinForms, .Net Framework

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

18 сообщений из 93, страница 4 из 4

все

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38355556

andreybs

Гость

ИзопропилandreybsА конструкторы тоже хранятся в памяти, как обычные методы в общем сегменте кода?
да, хранятся так же.

"Лишний" указатель - вряд ли является узким местом в данном проекте.
память, выделяемая C-шным malloc - тоже имеет накладные расходы - на выравнивание данных, на хранение длины выделенного блока.

Да, с malloc есть проблема. На основании этой статьи я решил построить все на базе динамического массива (std::vector), содержащего структуры (включая вложенные динамические массивы ссылок) с описанием элементов системы. В моем случае интересует максимально быстрый последовательный доступ к элементам массивов и добавление элементов в конец массивов. Для уменьшения фрагментированности памяти я планирую предварительно отсортировать средствами СУБД импортируемые из БД данные со структурой системы. Как-то так будем бороться с недостатками malloc...

...

Рейтинг:

0 / 0

05.08.2013, 17:34

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38362223

andreybs

Гость

Скорость ADO не радует при возврате блока данных в sql-сервер. Судя по профайлеру, если передавать строки через объект рекордсета, то данные передаются с помощью курсора. Если передавать напрямую через команду insert с параметрами, то получается быстрее, но все равно не то. Нужен либо BULK Copy, либо возвращаемая табличная переменная. Решил таки использовать шаблоны OLEDB (sqloledb + atldbcli) вместо ADO.

Чертов OLEDB задрал уже... Мало того, что в документации msdn нет нормальных примеров, так баг на баге сидит. Вот, сейчас борюсь с некорректной работой удаления CDynamicStringAccessor без параметров . И оказывается, это далеко не единственный косяк в библиотеке. Я вот чего не пойму - я ставил vs2012 ultimate, на нее даже какие-то апдейты накатились. Но баги с OLEDB остались, хотя о них известно давно (судя по статьям). Может нужно какой фикс на vs2012 скачать, не в курсе?

И еще вопрос по специфике использования oledb с mssql. Почему то мне не удается выполнить неподготовленную команду. CCommand.Open выдает ошибку "команда не подготовлена". Если команду подготовить, то в профайлере видно "exec sp_prepexec ... exec sp_unprepare", а я хочу "exec sp_executesql", который в моем случае будет быстрее. ADO выполнял команды без prepare именно через sp_executesql. Непонятно, как добиться этого же с помощью CCommend.

...

Рейтинг:

0 / 0

11.08.2013, 12:25

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38362309

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

andreybs,

если борьба за последние микросекунды - лучше использовать хранимые процедуры

...

Рейтинг:

0 / 0

11.08.2013, 15:24

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38362383

andreybs

Гость

Изопропилandreybs,

если борьба за последние микросекунды - лучше использовать хранимые процедуры

Это не поможет. Объясню. Потери возникают в момент возврата рассчитанных данных в sql-сервер. Так уж получается, что для серьезной задачи приходится возвращать порядка 1000 строк за каждый такт вычислений. А при той скорости вычислений, которой мне удалось добиться (на тестовой задаче: ~250тыс вычислений в секунду, ~10тыс вычислений на такт, ~25тактов/сек) эта чертова вставка жрет слишком много времени.

Так вот, сейчас происходит вставка данных в лоб при помощи приготовленной параметризированной команды insert, которая вызывается 1000 раз в каждый такт, т.е. 25тыс вставок в секунду. Оптимизатору sql будет все равно - будет ли делать вставку команда insert или хранимая процедура с параметрами, главный минус - каждая вставка порождает одну транзакцию, которая фиксируется в журнале транзакций. Я хочу использовать BULK INSERT (интерфейс FastLoad из OLEDB), что должно либо сильно ускорить вставку, т.к. сам механизм BULK INSERT работает на физическом уровне и каждая вставка выполняется за рамкой транзакции.

Думал это реализовать через OLE DB, но серьезно увяз в нюансах его работы. Сейчас попробую еще одну идею - скрестить ADO и шаблоны OLEDB. В некоторых классах ADO есть выход на DataSource. Можно попробовать за него зацепиться и создать класс расширения ADOBulkInsert. Тогда сохранится удобство обертки ADO (на ней все прекрасно работает) и добавится новая возможность.

...

Рейтинг:

0 / 0

11.08.2013, 18:10

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38362387

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

andreybsЭто не поможет.
а к чему тогда слёзы по sp_prepexec ?
andreybsЯ хочу использовать BULK INSERT
правильно.

А закончится заменой СУБД

...

Рейтинг:

0 / 0

11.08.2013, 18:20

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38362402

andreybs

Гость

ИзопропилandreybsЭто не поможет.
а к чему тогда слёзы по sp_prepexec ?
andreybsЯ хочу использовать BULK INSERT
правильно.

А закончится заменой СУБД

sp_prepexec нужен не всегда. Он нужен только для повторяющихся команд. Для одиночных команд select лучше использовать sp_executesql. Как управлять этим из ADO - мне понятно, но повторить это в OLEDB у меня не получилось, примеров я не нашел, а пробовать готовые библиотеки и копаться в их исходниках просто нет не времени ни желания.

Заменой СУБД не закончится - в ней достаточно сложная обработка больших массивов статистических данных. Реализовать такое в программе мне не под силу в разумные сроки. Так что буду добивать вариант выноса вычислений за пределы СУБД. Ведь все получилось, остался один маленький шажок с BULK INSERT через OLEDB...

...

Рейтинг:

0 / 0

11.08.2013, 18:51

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38362608

andreybs

Гость

Уф, ну и намучился я с этим капризным OLE DB. Короче, может кому понадобится, вот кусок кода на C++, как подключиться к открытому коннекту ADO Connection и получить доступ к интерфейсу OLE IRowsetFastLoad (он же BULK INSERT) для дальнейшей массовой вставки данных в таблицу... Это как раз то, что мне не хватало в ADO.

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.

	HRESULT hr;
	_ConnectionPtr pConn = ...
	
	ADOConnectionConstruction* m_pConnConst = NULL;
	hr = pConn->QueryInterface(__uuidof(ADOConnectionConstruction), (void**)&m_pConnConst);

	IUnknownPtr m_pSession = NULL;
	hr = m_pConnConst->get_Session(&m_pSession);

	IOpenRowset* m_pOpenRowset = NULL;
	hr = m_pSession->QueryInterface(__uuidof(IOpenRowset), (void**)&m_pOpenRowset);

	IRowsetFastLoad* m_pIFastLoad=NULL;

	DBID m_TableId;
	m_TableId.uName.pwszName = L"myTableName";
	m_TableId.eKind = DBKIND_NAME;

	DBPROP rgRowsetProps[1];
	DBPROPSET RowsetPropSet;

	VariantInit(&rgRowsetProps[0].vValue);

	rgRowsetProps[0].dwOptions = DBPROPOPTIONS_REQUIRED; 
	rgRowsetProps[0].colid = DB_NULLID; 
	rgRowsetProps[0].dwStatus = DBPROPSTATUS_OK; 
	rgRowsetProps[0].dwPropertyID = SSPROP_IRowsetFastLoad; 
	rgRowsetProps[0].vValue.vt = VT_BOOL; 
	rgRowsetProps[0].vValue.boolVal = VARIANT_TRUE;

	RowsetPropSet.rgProperties = rgRowsetProps; 
	RowsetPropSet.cProperties = 1; 
	RowsetPropSet.guidPropertySet = DBPROPSET_SQLSERVERROWSET;

	hr = m_pOpenRowset->OpenRowset(NULL, &m_TableId, NULL, IID_IRowsetFastLoad, 1, &RowsetPropSet, (IUnknown**) &m_pIFastLoad);

//	m_pIFastLoad->InsertRow(...);

	m_pIFastLoad->Release();
	m_pOpenRowset->Release();
	m_pSession->Release();
	m_pConnConst->Release();

Если кому нужно, то от сюда можно дернуть исходники по самой вставке данных

...

Рейтинг:

0 / 0

12.08.2013, 01:10

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38370297

andreybs

Гость

Обрабатывая логику программы, внезапно обнаружил, что на каждую вставку pFastLoad->InsertRow(..) в sql-сервер уходит команда BULK INSERT. Вроде не должно быть такого - должен блоками вставлять: (SSPROP_FASTLOADOPTIONS, L"ROWS_PER_BATCH=10000"). Может причина в pFastLoad->Commit(FALSE), который идет сразу за pFastLoad->InsertRow(..)? В примерах именно так написано, но может Commit(FALSE) не надо трогать до окончания вставки, а в конце сразу сделать Commit(TRUE)?

...

Рейтинг:

0 / 0

19.08.2013, 09:29

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38370401

andreybs

Гость

andreybsОбрабатывая логику программы, внезапно обнаружил, что на каждую вставку pFastLoad->InsertRow(..) в sql-сервер уходит команда BULK INSERT. Вроде не должно быть такого - должен блоками вставлять: (SSPROP_FASTLOADOPTIONS, L"ROWS_PER_BATCH=10000"). Может причина в pFastLoad->Commit(FALSE), который идет сразу за pFastLoad->InsertRow(..)? В примерах именно так написано, но может Commit(FALSE) не надо трогать до окончания вставки, а в конце сразу сделать Commit(TRUE)?

Так и есть - Commit всегда вставляет в базу вне зависимости от принимаемого параметра. Нужно делать Commit(true) только в самом конце вставки. Сам спросил - сам ответил... :)

...

Рейтинг:

0 / 0

19.08.2013, 11:15

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38372575

andreybs

Гость

В итоге реализовал одну и туже задачу в трех средах. Произвел замеры скорости вычислений простенькой нейросети:

результаты: (вычислений/сек)
СУБД t-sql 540
exe C++ 48000
clr C# 72000

В общем, это какой-то провал.... C# почти в два раза быстрее. Я не понимаю, почему так получилось - алгоритмы одни и те же, реализация самих вычислений проста и одинаково реализована. Буду думать...

...

Рейтинг:

0 / 0

20.08.2013, 22:28

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38372756

beg-in-er

Участник

Откуда: Город над вольной Невой

Сообщения: 911

Рейтинг: 0 / 0

andreybsрезультаты: (вычислений/сек)
СУБД t-sql 540
exe C++ 48000
clr C# 72000

В общем, это какой-то провал.... C# почти в два раза быстрее. Я не понимаю, почему так получилось - алгоритмы одни и те же, реализация самих вычислений проста и одинаково реализована. Буду думать...
ну вот , оптимизация на лицо. скорость выросла в 100 раз. по сравнению с t-sql.
а что до того, что якобы C# быстрее ...так это по тому например, что оптимизатор в С# очень неплохой. убери галочку оптимизировать код и сравни )))
тут надо сравнивать ассемблерный код.
чудес не бывает. увы.

...

Рейтинг:

0 / 0

21.08.2013, 09:44

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38372974

andreybs

Гость

beg-in-erandreybsрезультаты: (вычислений/сек)
СУБД t-sql 540
exe C++ 48000
clr C# 72000

В общем, это какой-то провал.... C# почти в два раза быстрее. Я не понимаю, почему так получилось - алгоритмы одни и те же, реализация самих вычислений проста и одинаково реализована. Буду думать...
ну вот , оптимизация на лицо. скорость выросла в 100 раз. по сравнению с t-sql.
а что до того, что якобы C# быстрее ...так это по тому например, что оптимизатор в С# очень неплохой. убери галочку оптимизировать код и сравни )))
тут надо сравнивать ассемблерный код.
чудес не бывает. увы.

Ну, я не сомневался, что C# не плох, но везде пишут, что С++ быстрее раза в два... Я хочу докопаться до причины обратной зависимости в моем случае. Что-то тут явно не то... Сделал отдельную ветку по оптимизации C++ программы . Дальше для ускорения хочу попробовать использовать технологию C++ Accelerated Massive Parallelism для вычислений на базе процессора видеокарты.

...

Рейтинг:

0 / 0

21.08.2013, 11:35

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38372986

Алексей К

Участник

Откуда: Новосибирск

Сообщения: 14 461

Рейтинг: 0 / 0

andreybsВ дотнетах два основных тормоза:
1. Контроль типов при преобразовании от базового класса к потомку.
2. Контроль границ массивов - основной тормоз.

Есть ещё автоматическое управление памятью, но там не всё так однозначно.

Делай выводы...

...

Рейтинг:

0 / 0

21.08.2013, 11:41

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38373315

andreybs

Гость

Алексей КandreybsВ дотнетах два основных тормоза:
1. Контроль типов при преобразовании от базового класса к потомку.
2. Контроль границ массивов - основной тормоз.

Есть ещё автоматическое управление памятью, но там не всё так однозначно.

Делай выводы...

1. учтено. в повторяющихся операциях исключено.
2. учтено. считывание границ один раз за цикл.

Управление памятью в данном случае не влияет, т.к. замеры производим, когда все массивы уже заполнены.

Еще одна фишка - вставил счетчики на базе статических внешних Stopwatch во внутренние функции в проге на C# и производительность упала в 10 раз!!! Надо искать другие варианты точного расчета времени выполнения. Буду экспериментировать...

...

Рейтинг:

0 / 0

21.08.2013, 14:19

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38373320

beg-in-er

Участник

Откуда: Город над вольной Невой

Сообщения: 911

Рейтинг: 0 / 0

andreybsБуду экспериментировать...
Укорения в 100 раз мало?

...

Рейтинг:

0 / 0

21.08.2013, 14:22

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38373657

andreybs

Гость

beg-in-erandreybsБуду экспериментировать...
Укорения в 100 раз мало?

Мало. :)
Я хочу добиться производительности на С++ в два раза выше, чем на С#, а после еще ускорить за счет параллелизма вычислений через GPU.

...

Рейтинг:

0 / 0

21.08.2013, 17:11

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38373691

buser

Участник

Откуда: Санкт-Петербург

Сообщения: 4 229

Рейтинг: 0 / 0

andreybs, как только у Вас получится реализовать задуманное... и это протянет в продакшене хоть у одного кастомера месяцев шесть... отпишите сюда...

...

Рейтинг:

0 / 0

21.08.2013, 17:31

| Ответить | Цитировать | Написать

высокопроизводительная CLR-сборка с кодом на C++ для SQL Server

#38373696

andreybs

Гость

andreybsВ итоге реализовал одну и туже задачу в трех средах. Произвел замеры скорости вычислений простенькой нейросети:

результаты: (вычислений/сек)
СУБД t-sql 540
exe C++ 48000
clr C# 72000

В общем, это какой-то провал.... C# почти в два раза быстрее. Я не понимаю, почему так получилось - алгоритмы одни и те же, реализация самих вычислений проста и одинаково реализована. Буду думать...

Причина тормознутости проги на C++ была в неверных настройках компилятора. На деле С++ получился в 14 (!!!) раз быстрее С#: 2142000 против 125000 вычислений/сек. Вот это дело! Теперь я не жалею, что перевел все на С++...

...

Рейтинг:

0 / 0

21.08.2013, 17:33

| Ответить | Цитировать | Написать

18 сообщений из 93, страница 4 из 4

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=20&gotonew=1&tid=1404184]:	0ms
get settings:	7ms
get forum list:	12ms
check forum access:	3ms
check topic access:	3ms
track hit:	73ms
get topic data:	9ms
get first new msg:	7ms
get forum data:	2ms
get page messages:	54ms
get tp. blocked users:	1ms
others:	11ms

total:	182ms