powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / БД для хранения большого количества бинарных данных
16 сообщений из 16, страница 1 из 1
БД для хранения большого количества бинарных данных
    #38213958
dimajay
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Простые БД, для хранения небольшого количества текстовой информации, "проектировал" )).
Прошу совета и помощи: выбор СУБД (возможно и ОС) и приблизительной структуры.
Цель: необходимо хранить уникальные пары [BIGINT,INT].
Их количество оченьбольшое более 500 000 000 уже, а дальше будет больше (для анализа сигналов...).
Спасибо.
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214198
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dimajayоченьбольшое более 500 000 000
Это количество, конечно, большое, но не очень. Та СУБД, которую ты знаешь не справилась?..
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214291
dimajay
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dimitry Sibiryakov,

MSSQL. C#.
Данные находятся в файлах (файлов больше 3000).
Размер файлов более 500 Мб каждый.
Из файлов я выбираю строку, конвертирую и делаю инсерт в БД пары значений.
Работает в 32 потока.
Мне кажется, что со временем загрузка медленее.
В таблице стоит юник констраинтс (чтобы не было повторов).
Процесс загрузки получается долгий, предположительно более 2 суток.

Может можно что-то делать по другому, дабы ускорить процесс.
Направьтие, пож. Буду разбираться.
Понимаю что моих поверхностных знаний мало, но куда углубляться не знаюю

может сразу грузить не одну пару а несколько?

Спасибо
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214329
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dimajayMSSQL. C#.
Направьтие, пож.
Направляю: http://www.sql.ru/forum/actualtopics.aspx?bid=1
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214386
П-Л
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
На каждую пару - отдельный инсерт ? Или собирается длинная строка на сколько тыщ пар ?
Перегонять ваши загадочные бинарники в цсв файл (допись в конец всякий раз новой строчки), файл инсертить одним чохом штатными средствами.
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214536
sp
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dimajay,

попробуйте секционирование для вашей большой таблицы
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214541
dimajay
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
П-ЛНа каждую пару - отдельный инсерт ? Или собирается длинная строка на сколько тыщ пар ?
Перегонять ваши загадочные бинарники в цсв файл (допись в конец всякий раз новой строчки), файл инсертить одним чохом штатными средствами.

Ситуация: файлов много, размер каждого за 500 Мб. (извините какими штатными средствами грузить много файлов?)
Сотруктурой таблиц понятно.

Гружу програмно - сишарп, на каждую пару свой инсерт. Потоков для загрузки 32.
В таблице на два поля стоит юник.

НО проблема:
- грузится долго несколько дней будет.
- внешне кажется что чем дальше тем медленнее грузится.

Как можно ускорить процесс? Програмно и организационно (БД)?

Вроде понятно?

П.С: Уважаемый, Dimitry Sibiryakov , я обратился за помощью с конкретным вопросом, и указывать на ветку форума как-то дилетантски,
если вы знаток - посоветуйте (а то бы ещё в гугл послали). Лучше с такими ответами не напрягайтесь.
Как мог искал - не помогло. Надеюсь на живых людей. Работу делать надо уже, потому и пишу сюда.
Спасибо.
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214570
sphinx_mv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dimajayП-ЛНа каждую пару - отдельный инсерт ? Или собирается длинная строка на сколько тыщ пар ?
Перегонять ваши загадочные бинарники в цсв файл (допись в конец всякий раз новой строчки), файл инсертить одним чохом штатными средствами.

Ситуация: файлов много, размер каждого за 500 Мб. (извините какими штатными средствами грузить много файлов?)
Сотруктурой таблиц понятно.

Гружу програмно - сишарп, на каждую пару свой инсерт.
Не хорошо...
SqlBulkCopy смотрели?
dimajayПотоков для загрузки 32.
Секционирование таблицы Вам уже предложили.
К этому еще можно добавить использование нескольких файловых групп, включая разнесение групп по разным физическим дискам...
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38214604
Кот Матроскин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dimajay,

Вам посоветовали использовать штатные средства MSSQL ( в первую очередь имхо SSIS, если файлов много). И в ветке "проектирование БД" это действительно оффтопик.

Вам кроме проверки уникальности от этих данных что-то нужно? выборки, поиски?
Если нет - может, Вам в сторону NoSQL посмотреть?
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38215171
dimajay
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Кот Матроскин,


Спасибо, буду читать. Прошу прощения за резкость.
Коль здесь офтопик, то куда? Как перенести.
Я здесь впервой. Да знания мои неглубоки в SQL.
Я системный программист (типа).

c# sqlconnection sqlcommand. Быстро не будет, как я понял?
SqlBulkCopy - спасибо, буду пробовать.
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38215191
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dimajayКоль здесь офтопик, то куда? Как перенести.Куда - вам написал Dimitry Sibiryakov, как- попросить модератора (или задавать новые вопросы уже там)

dimajayКак можно ускорить процесс? Програмно и организационно (БД)?
Основное - использовать средства массовой загрузки, например SqlBulkCopy, bulk insert. Будет быстро.
dimajayизвините какими штатными средствами грузить много файлов?bcp или SSIS
dimajayЦель: необходимо хранить уникальные пары [BIGINT,INT].
Их количество очень большое более 500 000 000 уже, а дальше будет большеНичего, у меня в час ненамного меньше, и не "пары" :-)
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38218055
lookat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
dimajay,

Можно для сравнения попробовать прогрузить все данные
в Infobright (только обязательно попробуйте версию EE):

сайт www.infobright.com

Есть многопоточная загрузка бинарных файлов
фиксированной длины, типа телекомовских CDR.

Constraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Удачи.
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38218443
Кот Матроскин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lookatConstraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Какая прекрасная система.
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38219395
oragraf
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
lookatdimajay,
Constraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Удачи.Последнее слово - это изощренная издевка
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38219637
lookat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Кот МатроскинlookatConstraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Какая прекрасная система.

и не одна :-) есть еще подходящие варианты
...
Рейтинг: 0 / 0
БД для хранения большого количества бинарных данных
    #38225158
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
16 сообщений из 16, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / БД для хранения большого количества бинарных данных
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]