подскажите по архитектуре высоконагруженной системы / Разработка информационных систем

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / подскажите по архитектуре высоконагруженной системы

13 сообщений из 63, страница 3 из 3

все

подскажите по архитектуре высоконагруженной системы

#38132260

ВМоисеев

Участник

Откуда: Редкино

Сообщения: 2 426

Рейтинг: 0 / 0

>29 янв 13, 18:44 [13846663] niXman,
>представьте ситуацию, ...
Посмотри здесь , может что и сгодится, как подход, и предложенные журналы Хакер полистай,- академия, полезно, я так с удовольствием.

С уважением, Владимир.

...

Рейтинг:

0 / 0

31.01.2013, 13:38

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38132322

niXman

Гость

ВМоисеев, почитаю. спасибо.

...

Рейтинг:

0 / 0

31.01.2013, 14:00

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38132413

ViPRos

Участник

Сообщения: 9 731

Рейтинг: 0 / 0

tumblerrr,

очень много это если генерируются 50-100 лимонов записей и это воще то махонькая часть задачи

...

Рейтинг:

0 / 0

31.01.2013, 14:32

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38132436

niXman

Гость

прошу прощения за оффтоп.

ВМоисеев, скажите, где-то на CVS исходники доступны? кириллица в именах идентификаторов все еще присутствует?

...

Рейтинг:

0 / 0

31.01.2013, 14:40

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38132445

tumblerrr

Участник

Сообщения: 115

Рейтинг: 0 / 0

ViPRostumblerrr,

очень много это если генерируются 50-100 лимонов записей и это воще то махонькая часть задачи

Да это просто для теста был лям.

А так там 2.5-3.0 ляма записей, примерно каждые 15 мин падают.
Надо их импортнуть в БД и обработать.
В общем не самая супернагруженная задача, но тем не менее работа дефолтного постгреса на ней показательна.
А ведь его еще по тюнить можно)

...

Рейтинг:

0 / 0

31.01.2013, 14:43

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38132490

ВМоисеев

Участник

Откуда: Редкино

Сообщения: 2 426

Рейтинг: 0 / 0

>сегодня, 14:40 [13857225] niXman,
>прошу прощения ...

Исходники проектов лежат на gotdotnet.files
//-- Remoting.rar
http://www.gotdotnet.ru/files/407/
//-- Сервер приложений
http://www.gotdotnet.ru/files/367/

С уважением, Владимир

...

Рейтинг:

0 / 0

31.01.2013, 15:00

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38133173

Проясним ситуац

Гость

niXmanпривет.

прежде всего, прошу простить меня, если запостил не в тот раздел.

представьте ситуацию, будто бы у вас онлайн-чат. в чате, у вас, ~200000 юзеров онлайн. каждый юзер, в минуту, пишет 2 сообщения.
и того, в минуту, получаем 400000 инсертов. в час получается - 24000000. ясно, что любая БД не осилит такое кол-во инсертов.
6666 вставок в секунду? Такие объемы спокойно пережевывает и Oracle, и MySQL. А всякие berkeleydb или leveldb жуют и по 240к вставок в секунду.

Ну умеешь настраивать, пупс.

niXman
в добавок, представьте, что клиентская логика на серверной стороне настолько тяжела, что вы вынуждены запустить ваш сервис на 10ти машинах одновременно, чтоб распределить нагрузку.

при такой архитектуре сервиса, встает логичный вопрос: а как быть с БД?

Быть? Очень просто. Дать денег специалистам по БД. Если они конечно есть. Деньги. На специалистов.

...

Рейтинг:

0 / 0

01.02.2013, 02:37

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38176807

Peter F

Гость

niXman,

Интересно, что никто не упомянул о распределеных NoSQL системах хранения (хотя учитывая название форума ничего удивительного в этом нет :) ), которые как раз и появились на свет во многом потому , что традиционные SQL базы данных не обеспечивали нужной производительности для таких систем как Google (факт. родоначальник направления с BiGtable технологией), Amazon (их разработка Dynamo используется самим Амазоном для распределенного хранения информации о продажах - объемы данных сами можете представить). Из ниболее популярных опен-сорсов - Cassandra (если не ошибаюсь изначально была разработана в Facebook) и HBase/Hadoop.

При чем NoSQL означает Not Only SQL. Очень часто эти системы используются как промежуточное хранилище данных обеспечивающее очень быструю запись (за счет чего - отдельная тема, но кратко - данные пишутся в файлы последовательно и периодически отдельным проходом происходит compaction ), а потом данные анализируются, агрегируются и т.д. и пишутся в традиционные СУБД для хранения и обработки традиционными системами , написанными с использованием SQL.
Хотя все больше новых систем проектируется сразу с использованием NoSQL решений.

Основное преимущество - масштабируемость этих систем. Я хорошо понимаю, что на этом форуме собрались адепты и "зубры" SQL технологии , но я думаю вряд ли кто-то может привести пример кластера традиционной SQL СУБД c тысячами серверов и линейным графиком масштабируемости. Также эти системы как правило обеспечивают автоматический data partitioning , re-partitioning в случае потери нода или добавлении нодов в кластер, дублирование информации для failover , распределение нагрузки и т.д.

У каждой технологии ( SQL и NoSQL) есть свои сильные и слабые стороны и области применения. Поэтому надо выбирать исходя из требований, возможного развития системы в будущем, затрат не только на разработку, но и поддержку и т.д.

...

Рейтинг:

0 / 0

07.03.2013, 01:34

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38176814

Peter F

Гость

Peter FИнтересно, что никто не упомянул о распределеных NoSQL системах хранения

Корректировка - уроминание о NoSQL было уже ранее в ответах.

Еще часто ставят In-memory Cache между базой данных и логикой примема/обработки запросов. Системы кеширования могут сливать данные в базу синхроно или асинхроно с указаной задержкой. Я использовал это для того чтобы фактически организовать буффер в памяти для накопления данных и потом записи их в базу "пакетами". Если установить кластер - то потери данных не произрйдет , так как рапределенный кеш реплицирует данные на другой нод. Конкретно систему кеширования я использовал - опен сорс Hazelcast для Джава

...

Рейтинг:

0 / 0

07.03.2013, 02:00

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38176890

Bogdanov Andrey

Участник

Откуда: Да уже и сам не знаю...

Сообщения: 1 871

Рейтинг: 0 / 0

Peter Fно я думаю вряд ли кто-то может привести пример кластера традиционной SQL СУБД c тысячами серверов и линейным графиком масштабируемости.:) Вот прямо сейчас изучаю проект в котором MySQL и шардинг ровно (в текущий момент) на 1000 серверов. Скромная платежная система.

...

Рейтинг:

0 / 0

07.03.2013, 09:00

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38177662

IgorK

Участник

Откуда: Краснодар

Сообщения: 426

Рейтинг: 0 / 0

Вот всегда почему-то приводят в пример то Амазон, но Фейсбук то еще что-то. Есть в этих системах одно НО, что позволяет "размазывать данные" по куче серверов.
Это НО называется ДАННЫЕ. Фича этих данных, что они НЕ СВЯЗАНЫ МЕЖДУ СОБОЙ!!! Поясню - системе абсолютно все равно что данные Пети лежат на одном сервере, а данные Васи на другом! Платежные системы - то же самое! Транзакции обращаются к 1 - 2 счетам, найти которые не составляет проблемы.
Попробуйте размазать данные бухучета и получить потом баланс в реальном времени? Никакой шардинг тут не работает! Поэтому и строят кластера Ораклячие - чтобы иметь доступ ко ВСЕМ данным.

...

Рейтинг:

0 / 0

07.03.2013, 18:07

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38177709

Peter F

Гость

IgorKВот всегда почему-то приводят в пример то Амазон, но Фейсбук то еще что-то. Есть в этих системах одно НО, что позволяет "размазывать данные" по куче серверов.
...
Попробуйте размазать данные бухучета и получить потом баланс в реальном времени? Никакой шардинг тут не работает! Поэтому и строят кластера Ораклячие - чтобы иметь доступ ко ВСЕМ данным.

Согласен, потому сразу и написал - что все зависит от конкретной задачи и выбор технологий зависит от многих факторов.
Но даже в случае Фейсбук - не все так просто как кажется , у них-то данные как раз очень взаимосвязаны - по сути это один большой граф , вот сильно упрощенный пример:
- сообщение от пользователя привязано к пользователю , который его написал
- этот пользователь связан с другими пользователями "дружеско-семейными" связями
- у тех польхователей куча своих сообщений, статусов, предпочтений (I like it)
- и т.д.

И они предоставляют свой Graph API чтобы ходить/искать по этим связям и "выворачивать" данные как угодно. И этот API используется рекламными "монстрами" чтобы проводить рекламные компании и в реальном времени отслеживать эффективность, смену предпочтений и т.д.

Но если мы вспомним с чего началась эта дискуссия - это быстрая запись в базу большого объема информации. Вот например ссылка
http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html

В которой приводятся результаты тестирования Кассандры Нетфликсом (один из крупнейших провайдеров видео через Инет в Штатах)
Тестировали в Амазон облаке, получили 1.1 млн записей в секунду с репликацией в три зоны, итого 3.3 млн. записей в секунду.
В статье есть график масштабируемости - фактически линейно вплоть до 350 серверов.
К сожалению статья на англ. но наверное можно автоматом приличный перевод получить в Хроме или еще как.

Это один из примеров, таких бенчмарк можно много накопать.

Опять же, это как альтернативная точка зрения. Даже если традиционная технология лучше подходит под ваши требования - всегда полезно узнать что-то новое, это может натолкнуть на какие-то свежие или оригинальные идеи или подходы и применить их даже в рамках традиционной SQL или любой другой платформы.

...

Рейтинг:

0 / 0

07.03.2013, 18:50

| Ответить | Цитировать | Написать

подскажите по архитектуре высоконагруженной системы

#38182237

Проясним ситуац

Гость

Peter Fсвежие или оригинальные идеи или подходы и применить их даже в рамках традиционной SQL или любой другой платформы.

И что? У тебя есть миллионы пользователей или хотя-бы три сервера (не виртуальных) c сотню роботов-генераторов трафика где можно попробовать хоть что-то применить?

...

Рейтинг:

0 / 0

13.03.2013, 00:30

| Ответить | Цитировать | Написать

13 сообщений из 63, страница 3 из 3

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=33&msg=38132445&tid=1547727]:	0ms
get settings:	7ms
get forum list:	13ms
check forum access:	2ms
check topic access:	2ms
track hit:	145ms
get topic data:	7ms
get forum data:	1ms
get page messages:	32ms
get tp. blocked users:	1ms
others:	220ms

total:	430ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы