|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
BazistneodddBazist, обьясните, вы предлагаете компании терять деньги и клиентов, если единственный сервер упадет или ваши сервера никогда не падают и в датацентрах электричество не пропадает? Я не понимаю, вам что ТС подошел и начал плакатся в жилетку что у него падают сервера ? У ТСа элементарная как 5 копеек задача. Откуда взялись фермы, откуда взялось решение тысячи непонятных проблем. Все сервера падают конечно, и этот сайт раз другой лежит в дауне в месяц и ничего, живет както развивается. Bazist, я вам процитировал про ферму у ТС-ра. Как по-вашему, есть разница между sql.ru и компанией с обязательствами перед клиентами? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:55 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Ну тогда пардон,. Если на одном сервере потребность в этих данных то хештаблица, если нужно шарить эту таблицу между несколькими серверами, то наверное редис или чтото в этом роде. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:59 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Хм, а зачем какой-то редис для такой простой задачи? Если нам нужна ненадежность редиса при его производительности - то можно просто включить кэширование на жестком диске или отключить логгирование при записи в эту таблицу (или воспользоваться еще кучей вариантов разменять производительность на надежность, имеющиеся в любой БД). Вместо сложной фермы - просто поставить 2 (n) серверов и дублировать записывающий поток на все из них (впрочем, для БД есть и стандартные драйвера). Это вполне себе системными средствами можно сделать. А так как сама табличка влезает в память, блокировки не нужны - то любая БД вполне себе справится :) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.05.2012, 18:14 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
DPH3... А так как сама табличка влезает в память, блокировки не нужны - то любая БД вполне себе справится :) Тут выбор прост: память (раз влазит) А если память, зачем гнать через горлышко БД? С Редисом сразу получаем гибкую систему, с примерно на порядок большей производительностью. При этом меньше вероятность рассыпания диска, что тоже полезно для системы в целом. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.05.2012, 18:55 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
neoddd, Ну, с точки зрения эксплуатации, лучше уж БД, для которой можно всегда найти специалиста, нежели фигня, которую придется поддерживать исключительно самостоятельно и набивать шишки тоже самостоятельно. Тем более что СУБД обычно уже есть :) На порядок большая производительность - это вряд ли, с чего-бы. тут производительность зависит от скорости диска на потоковую запись, так что какая разница. Разве что СУБД обычно с диском поэффективнее работают. А вот про рассыпание диска - тут поподробнее, почему это для Редиса вероятность будет меньше? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.05.2012, 23:13 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
DPH3, я считаю, что достаточно озвучил свои доводы. Реального желания спорить у меня нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.05.2012, 12:17 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
[quote ДохтаР]sphinx_mvпропущено... Нормальная и правильная постановка задачи для автоматического контроля ДДОС . Отсуюда и разный алгоритм , что бы ненапрягаясь отдавать дедосящим факоФФ или редирект наюх ничего другого не делая. Stinger03, угадал ? Нет, совсем не угадал. К ддосу мы не имем никакого отношения, но сами испытывали что это такое. Так что тех кто занимается - очень-очень сильно не любим. Под задачей сейчас стоит несколько серверов и так - само-собой ни один сервер в одиночку это не потянет. И падение системы конечно недопустимо ни на минуту - ибо запросы идут, деньги теряются. пока сделали подпорку через мемкешед как предлагали в самом начале. кой-как это работает :) само-собой конечно это верно только для одного сервера в ферме, но пока устраивает хотя бы так. Сейчас перевалило за 200кк входящих запросов в сутки (соответственно это около 500-600кк исходящих получается). По поводу redis - сайчас нам мемкешед лучше подходит так как получается быстрее. Теперь стал вопрос в обработке более подробной информации по трафику и соответсвенно нагрузка продолжает расти. К тому же сервера для устойчивости разнесены по разным ДЦ, поэтому задача имеет продолжение. Так что кто обсуждает - всем спасибо большое. Помогаете смотреть на задачу со стороны и смотреть те варианты над которыми не задумывались или не знали. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.05.2012, 18:30 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03... Сейчас перевалило за 200кк входящих запросов в сутки (соответственно это около 500-600кк исходящих получается). ... Еще есть, куда расти. Например: Stats: The firehose is at 250 million tweets a day. 936 CPU Cores Supports 16,000 Data Streams Per Server Processes Whole Twitter Firehose 250+ million Tweets per day. As a comparison, Visa says in 2007 they processed 27.612 billion transactions, which this paper estimates is 2100 transactions per second during the busiest 8 hours of the day. Those are complete transactions however. Current Peak Delivery of 120,000 Tweets Per Second (260Mbit bandwidth) Performs 250+ million sentiment analysis with sub 100ms latency ... |
|||
:
Нравится:
Не нравится:
|
|||
17.05.2012, 18:43 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз Товарищи, это полный пи#$ец, как говаривал один мой друган. Эту процитированную задачу решает простой тупой прокси-сервер, который тупо и просто гадит в локальный файл, что любой студень напишет на любом перле\пхп на любой переменке между любыми лабами. Определение было ли обращение - постфактум по этим файлам. При чём в процитированной постановке СУБД вообще? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.06.2012, 01:59 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Не вникнув в суть задачи делать заявления о п#$це по меньшей мере не красиво. Тупой прокси-сервер ляжет через 0,1 секунду после включения и утянет за собой всю структуру. За вчера обработано 1 017 929 064 запросов. Это где то 12к входящих запросов в секунду. И обрабатывать их надо в рилтайме. Перл/пхп банально не имеют многопоточности и впадают в ступор тут же, точнее сказать мгновенно, как собственно и студенты которые просто не поймут что делать. Собственно по сути вопрос не решился - точность определения повторов сейчас страдает, но пока в допустимых пределах. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 16:29 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Тупой прокси-сервер ляжет через 0,1 секунду Ну используйте не тупой, или тыщу штук запустите. Должно быть принципиальное понимание, что если сейчас некая сущность в состоянии принимать запросы и в принципе работает, то заведомо более легковесная сущность с меньшим лагом - тем более будет работать. Stinger03И обрабатывать их надо в рилтайме Это ещё зачем вдруг понадобилось? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:00 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Повторю задачу для тех кто читает с конца топика. Есть ферма. На нее приходит запрос на данные. В зависимости от уникальности ИП формируется ответ на этот запрос и отдается. Если этот ИП уже запрашивал данные, то ответ должен быть уже другим. Т.е. мне надо не просто отсеять уники от неуников, но и учитывать уникальность при выдаче информации. Причем отдать эту информацию надо тоже как можно быстрее, хотя бы по причине того, что в случае задержек все просто заткнется из-за количества запросов. Ну если сильно упростить всю задачу и на пальцах: Надо по каждому клиенту показать уникальный банер. Если он этот видел - надо показывать другой. Этот банер формируется при запросе на лету. Вся информация для построения банера берется с компьютеров вне фермы, поэтому надо еще учесть время на запрос информации извне, построение банера и отдачи на запрос. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:29 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Ничего оперативнее уже предложенного - 12311559 , имхо, вряд ли что придумаешь. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:40 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
в том что ферма состоит из нескольких десятков машин. а считать уникальность надо в пределах всей фермы. выделить машину под такую базу в памяти и обращатся к ней ? так количество запросов не протиснется в интерфейс помоему ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:49 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03выделить машину под такую базу в памяти и обращатся к ней ? так количество запросов не протиснется в интерфейс помоему12к входящих запросов в секунду - протиснется. Потенциальная подстава будет, если в другой ДЦ обращаться придется. А не протиснется - шардить. Благо, что задача легко шардится хоть на миллион серверов. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:54 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03, Кстати, если хранить не линейным массивом, а деревом, то время обработки несколько возрастет (вряд ли заметно по сравнению с сетевыми задержками), а расход памяти резко снизится. Тогда, возможно, можно будет даже не выносить на отдельный сервер. Хотя, конечно, синхронизация от этого не упростится... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:58 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03, А есть ли четкая зависимость, что какие-то ip-адреса обычно обращаются в один ДЦ, другие - в другой, третьи - в третий? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:00 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
miksoft12к входящих запросов в секунду - протиснется Проблема в том, что в начале топега было 2k запросов в секунду. В ноябре чел зашьётся на 100k записей в секунду, или придётся всё переделывать опять. Stinger03Ну если сильно упростить всю задачу и на пальцах: Надо по каждому клиенту показать уникальный банер Гы 100500 раз. Любому очевидно, что гарантировать уникальность в этом деле - себе дороже. Достаточно с вероятностью близкой к 1 это делать. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:43 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
нет. несколько машин стоят под распределение нагрузки и они раскидывают запросы в зависимости от нагрузки на рабочие сервера. поэтому одини тот же ИП может появится на разных машинах. сейчас как раз решаем вопросы синхронизации данных используя мемкешед. от разных датацентров кстати пришлось отказатся - все сейчас в одном. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:47 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03, Кстати, а почему вы не решаете задачу хранением этого флага/счетчика на клиенте? в куках, например. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:48 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
у клиентов нету куков :) это не конечные пользователи ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:56 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03у клиентов нету куков :) это не конечные пользователидесятки или сотни миллионов клиентов, которым показывают рекламные баннеры - не конечные пользователи??? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 19:02 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Банеры это всеже слегка притянутый за уши пример, хотя суть отражает полностью. Мы даем информацию, которая в конечном счете доходит до компьютеров пользователей, но мы никакого доступа к этим компьютерам не имеем. ... |
|||
:
Нравится:
Не нравится:
|
|||
28.07.2012, 13:58 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03нет. несколько машин стоят под распределение нагрузки и они раскидывают запросы в зависимости от нагрузки на рабочие сервера. поэтому одини тот же ИП может появится на разных машинах. сейчас как раз решаем вопросы синхронизации данных используя мемкешед. Это как? Если, например, четные адреса обрабатываются одной подсистемой, а нечетные - другой, то один конкретный IP будет только в одной подсистеме. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.08.2012, 18:11 |
|
|
start [/forum/search_topic.php?author=lemma&author_mode=last_topics&do_search=1]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
get settings: |
11ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
40ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
60ms |
get tp. blocked users: |
2ms |
others: | 893ms |
total: | 1065ms |
0 / 0 |