|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
>29 янв 13, 18:44 [13846663] niXman, >представьте ситуацию, ... Посмотри здесь , может что и сгодится, как подход, и предложенные журналы Хакер полистай,- академия, полезно, я так с удовольствием. С уважением, Владимир. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2013, 13:38 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
ВМоисеев, почитаю. спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2013, 14:00 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
tumblerrr, очень много это если генерируются 50-100 лимонов записей и это воще то махонькая часть задачи ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2013, 14:32 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
прошу прощения за оффтоп. ВМоисеев, скажите, где-то на CVS исходники доступны? кириллица в именах идентификаторов все еще присутствует? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2013, 14:40 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
ViPRostumblerrr, очень много это если генерируются 50-100 лимонов записей и это воще то махонькая часть задачи Да это просто для теста был лям. А так там 2.5-3.0 ляма записей, примерно каждые 15 мин падают. Надо их импортнуть в БД и обработать. В общем не самая супернагруженная задача, но тем не менее работа дефолтного постгреса на ней показательна. А ведь его еще по тюнить можно) ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2013, 14:43 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
>сегодня, 14:40 [13857225] niXman, >прошу прощения ... Исходники проектов лежат на gotdotnet.files //-- Remoting.rar http://www.gotdotnet.ru/files/407/ //-- Сервер приложений http://www.gotdotnet.ru/files/367/ С уважением, Владимир ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2013, 15:00 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
niXmanпривет. прежде всего, прошу простить меня, если запостил не в тот раздел. представьте ситуацию, будто бы у вас онлайн-чат. в чате, у вас, ~200000 юзеров онлайн. каждый юзер, в минуту, пишет 2 сообщения. и того, в минуту, получаем 400000 инсертов. в час получается - 24000000. ясно, что любая БД не осилит такое кол-во инсертов. 6666 вставок в секунду? Такие объемы спокойно пережевывает и Oracle, и MySQL. А всякие berkeleydb или leveldb жуют и по 240к вставок в секунду. Ну умеешь настраивать, пупс. niXman в добавок, представьте, что клиентская логика на серверной стороне настолько тяжела, что вы вынуждены запустить ваш сервис на 10ти машинах одновременно, чтоб распределить нагрузку. при такой архитектуре сервиса, встает логичный вопрос: а как быть с БД? Быть? Очень просто. Дать денег специалистам по БД. Если они конечно есть. Деньги. На специалистов. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2013, 02:37 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
niXman, Интересно, что никто не упомянул о распределеных NoSQL системах хранения (хотя учитывая название форума ничего удивительного в этом нет :) ), которые как раз и появились на свет во многом потому , что традиционные SQL базы данных не обеспечивали нужной производительности для таких систем как Google (факт. родоначальник направления с BiGtable технологией), Amazon (их разработка Dynamo используется самим Амазоном для распределенного хранения информации о продажах - объемы данных сами можете представить). Из ниболее популярных опен-сорсов - Cassandra (если не ошибаюсь изначально была разработана в Facebook) и HBase/Hadoop. При чем NoSQL означает Not Only SQL. Очень часто эти системы используются как промежуточное хранилище данных обеспечивающее очень быструю запись (за счет чего - отдельная тема, но кратко - данные пишутся в файлы последовательно и периодически отдельным проходом происходит compaction ), а потом данные анализируются, агрегируются и т.д. и пишутся в традиционные СУБД для хранения и обработки традиционными системами , написанными с использованием SQL. Хотя все больше новых систем проектируется сразу с использованием NoSQL решений. Основное преимущество - масштабируемость этих систем. Я хорошо понимаю, что на этом форуме собрались адепты и "зубры" SQL технологии , но я думаю вряд ли кто-то может привести пример кластера традиционной SQL СУБД c тысячами серверов и линейным графиком масштабируемости. Также эти системы как правило обеспечивают автоматический data partitioning , re-partitioning в случае потери нода или добавлении нодов в кластер, дублирование информации для failover , распределение нагрузки и т.д. У каждой технологии ( SQL и NoSQL) есть свои сильные и слабые стороны и области применения. Поэтому надо выбирать исходя из требований, возможного развития системы в будущем, затрат не только на разработку, но и поддержку и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.03.2013, 01:34 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
Peter FИнтересно, что никто не упомянул о распределеных NoSQL системах хранения Корректировка - уроминание о NoSQL было уже ранее в ответах. Еще часто ставят In-memory Cache между базой данных и логикой примема/обработки запросов. Системы кеширования могут сливать данные в базу синхроно или асинхроно с указаной задержкой. Я использовал это для того чтобы фактически организовать буффер в памяти для накопления данных и потом записи их в базу "пакетами". Если установить кластер - то потери данных не произрйдет , так как рапределенный кеш реплицирует данные на другой нод. Конкретно систему кеширования я использовал - опен сорс Hazelcast для Джава ... |
|||
:
Нравится:
Не нравится:
|
|||
07.03.2013, 02:00 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
Peter Fно я думаю вряд ли кто-то может привести пример кластера традиционной SQL СУБД c тысячами серверов и линейным графиком масштабируемости.:) Вот прямо сейчас изучаю проект в котором MySQL и шардинг ровно (в текущий момент) на 1000 серверов. Скромная платежная система. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.03.2013, 09:00 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
Вот всегда почему-то приводят в пример то Амазон, но Фейсбук то еще что-то. Есть в этих системах одно НО, что позволяет "размазывать данные" по куче серверов. Это НО называется ДАННЫЕ. Фича этих данных, что они НЕ СВЯЗАНЫ МЕЖДУ СОБОЙ!!! Поясню - системе абсолютно все равно что данные Пети лежат на одном сервере, а данные Васи на другом! Платежные системы - то же самое! Транзакции обращаются к 1 - 2 счетам, найти которые не составляет проблемы. Попробуйте размазать данные бухучета и получить потом баланс в реальном времени? Никакой шардинг тут не работает! Поэтому и строят кластера Ораклячие - чтобы иметь доступ ко ВСЕМ данным. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.03.2013, 18:07 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
IgorKВот всегда почему-то приводят в пример то Амазон, но Фейсбук то еще что-то. Есть в этих системах одно НО, что позволяет "размазывать данные" по куче серверов. ... Попробуйте размазать данные бухучета и получить потом баланс в реальном времени? Никакой шардинг тут не работает! Поэтому и строят кластера Ораклячие - чтобы иметь доступ ко ВСЕМ данным. Согласен, потому сразу и написал - что все зависит от конкретной задачи и выбор технологий зависит от многих факторов. Но даже в случае Фейсбук - не все так просто как кажется , у них-то данные как раз очень взаимосвязаны - по сути это один большой граф , вот сильно упрощенный пример: - сообщение от пользователя привязано к пользователю , который его написал - этот пользователь связан с другими пользователями "дружеско-семейными" связями - у тех польхователей куча своих сообщений, статусов, предпочтений (I like it) - и т.д. И они предоставляют свой Graph API чтобы ходить/искать по этим связям и "выворачивать" данные как угодно. И этот API используется рекламными "монстрами" чтобы проводить рекламные компании и в реальном времени отслеживать эффективность, смену предпочтений и т.д. Но если мы вспомним с чего началась эта дискуссия - это быстрая запись в базу большого объема информации. Вот например ссылка http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html В которой приводятся результаты тестирования Кассандры Нетфликсом (один из крупнейших провайдеров видео через Инет в Штатах) Тестировали в Амазон облаке, получили 1.1 млн записей в секунду с репликацией в три зоны, итого 3.3 млн. записей в секунду. В статье есть график масштабируемости - фактически линейно вплоть до 350 серверов. К сожалению статья на англ. но наверное можно автоматом приличный перевод получить в Хроме или еще как. Это один из примеров, таких бенчмарк можно много накопать. Опять же, это как альтернативная точка зрения. Даже если традиционная технология лучше подходит под ваши требования - всегда полезно узнать что-то новое, это может натолкнуть на какие-то свежие или оригинальные идеи или подходы и применить их даже в рамках традиционной SQL или любой другой платформы. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.03.2013, 18:50 |
|
подскажите по архитектуре высоконагруженной системы
|
|||
---|---|---|---|
#18+
Peter Fсвежие или оригинальные идеи или подходы и применить их даже в рамках традиционной SQL или любой другой платформы. И что? У тебя есть миллионы пользователей или хотя-бы три сервера (не виртуальных) c сотню роботов-генераторов трафика где можно попробовать хоть что-то применить? ... |
|||
:
Нравится:
Не нравится:
|
|||
13.03.2013, 00:30 |
|
|
start [/forum/topic.php?fid=33&msg=38132445&tid=1547727]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
49ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
53ms |
get tp. blocked users: |
1ms |
others: | 15ms |
total: | 159ms |
0 / 0 |