Тяжелая система, что делать? / MySQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / MySQL [игнор отключен] [закрыт для гостей] / Тяжелая система, что делать?

14 сообщений из 14, страница 1 из 1

Тяжелая система, что делать?

#38466268

lavrov

Гость

Всем привет. Вопрос к знатокам.

Есть задача построить высоконагруженную систему. Опыт работы с БД есть, но не глубокий. Я делал проекты, где в БД были миллионы строк и все прекрасно летало, но сейчас речь о миллиардах строк.

По железу есть: Core i7, 32 GB RAM, 2x2 TB HDD (пока сервер голый, если что, есть возможность поменять на более мощный)

Основная составляющая система – база данных. В данный момент думаю MySQL (так как есть опыт именно с ней). И так большую часть времени будут идти одни инсерты, периодически будут делаться выборки по 500-2000 строк (иногда апдейты). Ожидаемое количество записей во всей БД 1-4 миллиарда (для начала). Больших таблиц будет немного, думаю около 5 (поля в основном varchar, int, tinytext), при этом одна таблица будет на себя брать около 80% всех записей. Собственно у меня вопросы:
1. Сколько записей может поместить в себя MySQL? (есть ли ограничения на 1 таблицу?)
2. Какой объем данных может выдержать БД?
3. Получится ли делать выборки как описано выше (нужно чтобы запросы были не более 2-4 сек, это естественно учетом того, что везде, где только можно будут индексы)?
4. Справится ли этим всем MySQL или лучше другую БД (какую?)
5. Имеет ли смысл сделать 2 или более БД для ускорения работы (учитывая, что на сервере 2 винта)? Может есть смысл сделать несколько однотипных таблиц, ускорит ли это работу?
6. Что делать если понадобиться хранить 100 миллиардов записей?
7. Какую ОС для этого всего лучше выбрать?

Вопросы больше к знатокам, кто именно работал с такими БД.

...

Рейтинг:

0 / 0

15.11.2013, 12:48:13

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466318

tanglir

Участник

Сообщения: 30 379

Рейтинг: 0 / 0

lavrovtinytext255 байт
может, лучше всё же варчар?

1) http://dev.mysql.com/doc/refman/5.0/en/limits.html
2) что значит "выдержать"?
3) если нужные индексы влезут в память, то скорее всего да
4) делать надо на том, что знаете. если знаете мускль, делайте на нём
5) зависит от характера данных и производимых над ними операций
6) см.п.5
7) см.п.4

...

Рейтинг:

0 / 0

15.11.2013, 13:07:45

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466355

lavrov

Гость

tanglir, Спасибо за ответы.

2) что значит "выдержать"?
я имел виду, если у меня размер БД будет 2 TB, не встанет ли все это колом. (За линк спасибо, то что надо, нашел ответ)

зависит от характера данных и производимых над ними операций
объем данных будет на самом деле не большой, думаю самое большое поле, которое я буду использовать - VARCHAR 250... но вот записей будет ну очень много.

Я так думаю запросы будут такие:
90% insert
7% select
3% update

Селекты будут простые, раз будут выборки преимущественно по 500-2000 записей. Но иногда будет дергаться и намного больше (1-2 млн.)

...

Рейтинг:

0 / 0

15.11.2013, 13:28:02

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466458

ScareCrow

Участник

Откуда: Белый город

Сообщения: 16 205

Рейтинг: 0 / 0

партиционирование.

...

Рейтинг:

0 / 0

15.11.2013, 14:31:40

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466475

lavrov

Гость

ScareCrow, спасибо! Вообще не знал про это.

...

Рейтинг:

0 / 0

15.11.2013, 14:39:06

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466554

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

По железу есть: Core i7, 32 GB RAM, 2x2 TB HDD (пока сервер голый, если что, есть возможность поменять на более мощный)

Основная составляющая система – база данных. В данный момент думаю MySQL (так как есть опыт именно с ней). И так большую часть времени будут идти одни инсерты, периодически будут делаться выборки по 500-2000 строк (иногда апдейты). Ожидаемое количество записей во всей БД 1-4 миллиарда (для начала). Больших таблиц будет немного, думаю около 5 (поля в основном varchar, int, tinytext), при этом одна таблица будет на себя брать около 80% всех записей. Собственно у меня вопросы:

1-4 миллиарда для MySQL много. Не потому, что она какая-то неполноценная -- такие объёмы и для промышленных СУБД будут большими. Тут надо columnstore и/или сжатие. Это всё mySQL не умеет.
С columnstore у меня как раз 2 миллиарда на тестовой машине на 16Gb и 8 процов был тестовый набор данных (dbPedia).
Т.е. для columnstore это вообще семечки.

Сейчас вам будут плести про партиции и/или NDB кластеры ...
Пустое это всё. Ключ к решению не там. Партицирование уменьшает объём раз в 10-1000. И это только если удаётся в запросе обрезать лишние партиции оптимизатору (т.е. например запрос за период, хранящийся в одной партиции).
А если нет -- это уже не поможет.
А columnstore работает всегда, во всех запросах.

1. Сколько записей может поместить в себя MySQL? (есть ли ограничения на 1 таблицу?)
2. Какой объем данных может выдержать БД?

Это очень сложно, надо внимательно читать лимиты. Описание mySQL.
И некоторые определяются операционкой. И не забудь заранее определиться с engine.

3. Получится ли делать выборки как описано выше (нужно чтобы запросы были не более 2-4 сек, это естественно учетом того, что везде, где только можно будут индексы)?

Зависит от запросов, данных, таблиц, индексов.

4. Справится ли этим всем MySQL или лучше другую БД (какую?)

Это тебе никто не скажет. Потому что никто не знает.

5. Имеет ли смысл сделать 2 или более БД для ускорения работы (учитывая, что на сервере 2 винта)? Может есть смысл сделать несколько однотипных таблиц, ускорит ли это работу?

Нет, очевидно. Это уменьшение сложности всего лишь в 2 раза. Ну, будет у тебя не 4 миллиарда а 2. Легче ?

6. Что делать если понадобиться хранить 100 миллиардов записей?
7. Какую ОС для этого всего лучше выбрать?

ОС тут мало что решает. Решает СУБД.

Попробуй также поглядеть на Virtuoso open source 7 (лучше на V7, V6 много хуже в этом смысле).
Это как раз та СУБД, с которой я работал. Там серьёзные игры на нескольких миллиардах записей только начинаются.
Также можно глянуть на другие Columnstore СУБД, хвалят вроде бы vertica.

...

Рейтинг:

0 / 0

15.11.2013, 15:18:44

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466586

lavrov

Гость

MasterZiv,

спасибо за развернутый ответ! А что скажите про MSSQL? Опыт работы у меня с ней есть, я почитал она вроде может держать очень большие объемы данных (про скорость только пока не читал).

...

Рейтинг:

0 / 0

15.11.2013, 15:42:36

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466591

ScareCrow

Участник

Откуда: Белый город

Сообщения: 16 205

Рейтинг: 0 / 0

авторТам серьёзные игры на нескольких миллиардах записей только начинаются.
поколоночная запись, да. OLTP пролетает.

...

Рейтинг:

0 / 0

15.11.2013, 15:48:36

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466594

lavrov

Гость

MasterZiv, извиняюсь за глупый вопрос, columnstore оно как раз и есть в mssql?

...

Рейтинг:

0 / 0

15.11.2013, 15:50:15

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466909

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

lavrovMasterZiv,

спасибо за развернутый ответ! А что скажите про MSSQL? Опыт работы у меня с ней есть, я почитал она вроде может держать очень большие объемы данных (про скорость только пока не читал).

Держать, то она может что угодно, можно было бы ещё с этим работать, вот вопрос.

Для row wise большие объемы — миллионы записей. Для column store десятки миллиардов.

Впрочем, ты конечно же можешь попробовать и то, и другое, и третье.

Если замутишь с virtuoso — я и Iv_an_ru тут.

Странно другое. Почему не я занимаюсь такими проектами.

...

Рейтинг:

0 / 0

15.11.2013, 19:14:53

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466913

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

lavrovMasterZiv, извиняюсь за глупый вопрос, columnstore оно как раз и есть в mssql?

До сих пор вроде не было....
Если есть — давай ссылку на доку...

...

Рейтинг:

0 / 0

15.11.2013, 19:16:39

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466924

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Вот, нашел....

www.t-sql.ru/post/columnstore_index_faq.aspx

фициальный выход запланированный на 01 апреля 2012.

В какой версии SQL Server впервые появились колоночные индексы (Columnstore Indexes)?

Колоночные индексы впервые появились в SQL Server Denali CTP 3 и являются одной из ключевых фич (feature) новой версии SQL Server 2012. Разработаны в рамках проекта Аполлон (Apollo).

Что такое Apollo?

Apollo (Аполлон) - кодовое название одного из проектов в рамках разработки SQL Server 2012. Основная цель проекта - уменьшить TCO (Total cost of ownership) существенным ускорением запросов к хранилищу данных (data warehouse). В рамках этого проекта в SQL Server появились две новых технологии: колоночные индексы (Columnstore Indexes) и векторная обработка запросов, названная пакетной обработкой (batches).

Тоже что-то делают...

...

Рейтинг:

0 / 0

15.11.2013, 19:29:12

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38466928

lavrov

Гость

Посмотрел стоимость SQL Server, она пугает... еще и от количества ядер зависит.

...

Рейтинг:

0 / 0

15.11.2013, 19:37:01

| Ответить | Цитировать | Написать

Тяжелая система, что делать?

#38474300

transpose

Участник

Сообщения: 162

Рейтинг: 0 / 0

lavrov,

если стоимость пугает... тогда наверное не подойдет и эта. Но все же для развития кругозора http://developer.teradata.com/database/articles/expanded-teradata-express-family-available Сюда можно и биллионы строк загружать.

...

Рейтинг:

0 / 0

22.11.2013, 13:43:40

| Ответить | Цитировать | Написать

14 сообщений из 14, страница 1 из 1

Форумы / MySQL [игнор отключен] [закрыт для гостей] / Тяжелая система, что делать?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=47&msg=38474300&tid=1835677]:	0ms
get settings:	6ms
get forum list:	16ms
check forum access:	3ms
check topic access:	3ms
track hit:	44ms
get topic data:	9ms
get forum data:	2ms
get page messages:	46ms
get tp. blocked users:	1ms
others:	217ms

total:	347ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы