Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / БД для хранения большого количества бинарных данных / 16 сообщений из 16, страница 1 из 1
05.04.2013, 10:17
    #38213958
dimajay
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
Простые БД, для хранения небольшого количества текстовой информации, "проектировал" )).
Прошу совета и помощи: выбор СУБД (возможно и ОС) и приблизительной структуры.
Цель: необходимо хранить уникальные пары [BIGINT,INT].
Их количество оченьбольшое более 500 000 000 уже, а дальше будет больше (для анализа сигналов...).
Спасибо.
...
Рейтинг: 0 / 0
05.04.2013, 12:27
    #38214198
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajayоченьбольшое более 500 000 000
Это количество, конечно, большое, но не очень. Та СУБД, которую ты знаешь не справилась?..
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
05.04.2013, 13:17
    #38214291
dimajay
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
Dimitry Sibiryakov,

MSSQL. C#.
Данные находятся в файлах (файлов больше 3000).
Размер файлов более 500 Мб каждый.
Из файлов я выбираю строку, конвертирую и делаю инсерт в БД пары значений.
Работает в 32 потока.
Мне кажется, что со временем загрузка медленее.
В таблице стоит юник констраинтс (чтобы не было повторов).
Процесс загрузки получается долгий, предположительно более 2 суток.

Может можно что-то делать по другому, дабы ускорить процесс.
Направьтие, пож. Буду разбираться.
Понимаю что моих поверхностных знаний мало, но куда углубляться не знаюю

может сразу грузить не одну пару а несколько?

Спасибо
...
Рейтинг: 0 / 0
05.04.2013, 13:30
    #38214329
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajayMSSQL. C#.
Направьтие, пож.
Направляю: http://www.sql.ru/forum/actualtopics.aspx?bid=1
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
05.04.2013, 13:56
    #38214386
П-Л
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
На каждую пару - отдельный инсерт ? Или собирается длинная строка на сколько тыщ пар ?
Перегонять ваши загадочные бинарники в цсв файл (допись в конец всякий раз новой строчки), файл инсертить одним чохом штатными средствами.
...
Рейтинг: 0 / 0
05.04.2013, 15:09
    #38214536
sp
sp
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajay,

попробуйте секционирование для вашей большой таблицы
...
Рейтинг: 0 / 0
05.04.2013, 15:11
    #38214541
dimajay
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
П-ЛНа каждую пару - отдельный инсерт ? Или собирается длинная строка на сколько тыщ пар ?
Перегонять ваши загадочные бинарники в цсв файл (допись в конец всякий раз новой строчки), файл инсертить одним чохом штатными средствами.

Ситуация: файлов много, размер каждого за 500 Мб. (извините какими штатными средствами грузить много файлов?)
Сотруктурой таблиц понятно.

Гружу програмно - сишарп, на каждую пару свой инсерт. Потоков для загрузки 32.
В таблице на два поля стоит юник.

НО проблема:
- грузится долго несколько дней будет.
- внешне кажется что чем дальше тем медленнее грузится.

Как можно ускорить процесс? Програмно и организационно (БД)?

Вроде понятно?

П.С: Уважаемый, Dimitry Sibiryakov , я обратился за помощью с конкретным вопросом, и указывать на ветку форума как-то дилетантски,
если вы знаток - посоветуйте (а то бы ещё в гугл послали). Лучше с такими ответами не напрягайтесь.
Как мог искал - не помогло. Надеюсь на живых людей. Работу делать надо уже, потому и пишу сюда.
Спасибо.
...
Рейтинг: 0 / 0
05.04.2013, 15:28
    #38214570
sphinx_mv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajayП-ЛНа каждую пару - отдельный инсерт ? Или собирается длинная строка на сколько тыщ пар ?
Перегонять ваши загадочные бинарники в цсв файл (допись в конец всякий раз новой строчки), файл инсертить одним чохом штатными средствами.

Ситуация: файлов много, размер каждого за 500 Мб. (извините какими штатными средствами грузить много файлов?)
Сотруктурой таблиц понятно.

Гружу програмно - сишарп, на каждую пару свой инсерт.
Не хорошо...
SqlBulkCopy смотрели?
dimajayПотоков для загрузки 32.
Секционирование таблицы Вам уже предложили.
К этому еще можно добавить использование нескольких файловых групп, включая разнесение групп по разным физическим дискам...
...
Рейтинг: 0 / 0
05.04.2013, 15:43
    #38214604
Кот Матроскин
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajay,

Вам посоветовали использовать штатные средства MSSQL ( в первую очередь имхо SSIS, если файлов много). И в ветке "проектирование БД" это действительно оффтопик.

Вам кроме проверки уникальности от этих данных что-то нужно? выборки, поиски?
Если нет - может, Вам в сторону NoSQL посмотреть?
...
Рейтинг: 0 / 0
05.04.2013, 21:51
    #38215171
dimajay
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
Кот Матроскин,


Спасибо, буду читать. Прошу прощения за резкость.
Коль здесь офтопик, то куда? Как перенести.
Я здесь впервой. Да знания мои неглубоки в SQL.
Я системный программист (типа).

c# sqlconnection sqlcommand. Быстро не будет, как я понял?
SqlBulkCopy - спасибо, буду пробовать.
...
Рейтинг: 0 / 0
05.04.2013, 22:32
    #38215191
alexeyvg
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajayКоль здесь офтопик, то куда? Как перенести.Куда - вам написал Dimitry Sibiryakov, как- попросить модератора (или задавать новые вопросы уже там)

dimajayКак можно ускорить процесс? Програмно и организационно (БД)?
Основное - использовать средства массовой загрузки, например SqlBulkCopy, bulk insert. Будет быстро.
dimajayизвините какими штатными средствами грузить много файлов?bcp или SSIS
dimajayЦель: необходимо хранить уникальные пары [BIGINT,INT].
Их количество очень большое более 500 000 000 уже, а дальше будет большеНичего, у меня в час ненамного меньше, и не "пары" :-)
...
Рейтинг: 0 / 0
09.04.2013, 01:31
    #38218055
lookat
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
dimajay,

Можно для сравнения попробовать прогрузить все данные
в Infobright (только обязательно попробуйте версию EE):

сайт www.infobright.com

Есть многопоточная загрузка бинарных файлов
фиксированной длины, типа телекомовских CDR.

Constraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Удачи.
...
Рейтинг: 0 / 0
09.04.2013, 11:28
    #38218443
Кот Матроскин
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
lookatConstraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Какая прекрасная система.
...
Рейтинг: 0 / 0
09.04.2013, 19:25
    #38219395
oragraf
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
lookatdimajay,
Constraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Удачи.Последнее слово - это изощренная издевка
...
Рейтинг: 0 / 0
10.04.2013, 02:09
    #38219637
lookat
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
Кот МатроскинlookatConstraints устанавливать не надо, грузите все данные.
Потом можно делать select distinct ...

Какая прекрасная система.

и не одна :-) есть еще подходящие варианты
...
Рейтинг: 0 / 0
14.04.2013, 22:39
    #38225158
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
БД для хранения большого количества бинарных данных
...
Рейтинг: 0 / 0
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / БД для хранения большого количества бинарных данных / 16 сообщений из 16, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]