|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Попытаюсь обьяснить суть задачи. Около 150-200кк запросов к серверу в сутки Это около 1700-2300 запросов в секунду. Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз. Хранить данные более 24 часов ненужно. Что потянет подобную задачу и потянет ли вообще ? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 02:59 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Задача не для СУБД. Копайте в сторону ферм. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 08:37 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
авторЭто около 1700-2300 запросов в секунду. Код: sql 1.
тоже запрос. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 08:54 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
SERG1257Задача не для СУБД. Да ну?! ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 09:07 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз. Хранить данные более 24 часов ненужно. Что потянет подобную задачу и потянет ли вообще ?Сколько раз вообще или сколько раз за последние 24 часа? С какой точностью это нужно делать? Как часто это "определить" должно происходить? Как долго/быстро оно должно происходить? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 10:21 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Попытаюсь обьяснить суть задачи. Около 150-200кк запросов к серверу в сутки Это около 1700-2300 запросов в секунду. Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз. Хранить данные более 24 часов ненужно. Что потянет подобную задачу и потянет ли вообще ? По сути задача сводится к работе с таблицей из двух полей, одно из которых уникальный ключ из целочисленного представления IP-адреса (IPv4 - 4 байта, IPv6 - максимум 16 байт), а вторая - время последнего обращения... Чтобы прикрутить "сколько раз" - ну, добавь еще одно поле с накоплением количества обращений. В итоге - с этой задачей вполне справится ЛЮБОЙ SQL сервер. Выбирать, естественно, лучше из тех, которые "лучше знаешь"... ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 11:37 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Попытаюсь обьяснить суть задачи. Около 150-200кк запросов к серверу в сутки Это около 1700-2300 запросов в секунду. Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз. Хранить данные более 24 часов ненужно. Что потянет подобную задачу и потянет ли вообще ? Добрый день. Довольно-таки примитивная задача для СУБД CACHE. Даже если все это будет установлено на обычный ПК совресенной косплектации Нагрузка на процессор будет 1-3%. Проверено опытом. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 12:57 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Кто бы спорил что запросы на статических данных будут делатся быстро. А как ТС собирается базу обновлять? ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 16:58 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
SERG1257Кто бы спорил что запросы на статических данных будут делатся быстро. А как ТС собирается базу обновлять? Вы полагаете, что 2300 модифицирующих запросов для СУБД - это нереальные цифры? Автору надо быстро вставлять... ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 17:33 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
сори, возможно немного не точно обьяснил. На вебсервер приходит запрос. Мне надо проверить был ли уже запрос с таким ИП в течении суток и сколько раз. Плотность запросов - 1700-2300 в секунду. SERG1257Задача не для СУБД. Копайте в сторону ферм. Если не сложно - что это такое ? Всем отписавшимся спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 18:44 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03На вебсервер приходит запрос. Мне надо проверить был ли уже запрос с таким ИП в течении суток и сколько раз. Плотность запросов - 1700-2300 в секунду. И как тебе уже сказали: СУБД тут ни к чему. То, что тебе нужно, это простейшее in-memory key-value хранилище. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 18:55 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Dimitry SibiryakovИ как тебе уже сказали: СУБД тут ни к чему. То, что тебе нужно, это простейшее in-memory key-value хранилище.Можно подумать, что "in-memory key-value хранилище" - это не СУБД :) ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 19:14 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
pkarklin Вы полагаете, что 2300 модифицирующих запросов для СУБД - это нереальные цифры? Автору надо быстро вставлять...Одиночными инсертами с коммитом? Нет я верю, что вы можете этого добится, я сомневаюсь что РСУБД для этого предназначена. miksoft Можно подумать, что "in-memory key-value хранилище" - это не СУБД :) Не РСУБД. Плюс, забив на ACID, ее можно легко кластеризовать (раскидать по нодам) ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 22:40 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03 Если не сложно - что это такое ? http://en.wikipedia.org/wiki/Server_farm ... |
|||
:
Нравится:
Не нравится:
|
|||
20.03.2012, 22:46 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
SERG1257Stinger03Если не сложно - что это такое ? http://en.wikipedia.org/wiki/Server_farm это само-собой и так сейчас работает, ибо на каждый полученный запрос формируется 3-4 от нас, обрабатывается с них инфа и выдается наружу. Но вот с некоторыми вопросами статистики выходят затыки. поэтому решил у олла проконсультироватся. коллективный разум оно сподручнее :) ... |
|||
:
Нравится:
Не нравится:
|
|||
21.03.2012, 01:12 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
ответьте на вопросы miksoft ... |
|||
:
Нравится:
Не нравится:
|
|||
21.03.2012, 03:25 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
miksoftStinger03Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз. Хранить данные более 24 часов ненужно. Что потянет подобную задачу и потянет ли вообще ?Сколько раз вообще или сколько раз за последние 24 часа? С какой точностью это нужно делать? Как часто это "определить" должно происходить? Как долго/быстро оно должно происходить? Сколько раз за последние 24 часа. если ИП за 24 часа не сделал ни одного запроса данных он считается уникальным. "Определить" должно происходить при каждом запросе данных. Т.е. если есть запрос данных есть надо определить - он уникальный или нет и сколько раз он уже был и от этого планируются дальнейшие действия с ним. Происходить должно очень быстро - время ответа сервера доли секунды ибо он должен дождатся ответов от других серверов и отдать данные обработки максимум за 2-3 секунды. лучше 1-1,5. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.03.2012, 10:54 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
miksoftМожно подумать, что "in-memory key-value хранилище" - это не СУБД :) Массив в памяти это БД? А код, который с ним работает это СУБД? Тогда std::map это точно СУБД. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.03.2012, 14:04 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
2Stinger03 То есть по сути у вас есть Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9.
Вы не ответили за точность - произойдет ли большая беда если там будет плюс минус одна секунда в 24 часов. Что будет если один (только один запрос, и очень редко будет забыт) Нужна ли высокая доступность, что будет если ваша система уйдет в даун (потому как все это очень сильно пахнет кластерами) Что будет если во время форс-мажора (все ноды были обесточены) ляжет весь кластер. (тут вопрос надо ли делать бакап свежевставленных записей на диск или можно просто поднять лишную ноду) Если ошибки в принципе приемлимы (неприятно, но не смертельно) то дорога вам в NoSQL базы, кластеры, распределители нагрузки и бежнодовое взаимодействие. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.03.2012, 16:34 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
SERG1257Вы не ответили за точность - произойдет ли большая беда если там будет плюс минус одна секунда в 24 часов. Нет, беды никакой не будет. SERG1257Что будет если один (только один запрос, и очень редко будет забыт) Тоже не смертельно. SERG1257Нужна ли высокая доступность, что будет если ваша система уйдет в даун (потому как все это очень сильно пахнет кластерами) Вряд ли уйдет - сервера стоят в разных странах, не то что в разных ДЦ. Выход 1 сервера не ложит систему - нагрузка распределяется между живыми. Запас пока есть. SERG1257Что будет если во время форс-мажора (все ноды были обесточены) ляжет весь кластер. (тут вопрос надо ли делать бакап свежевставленных записей на диск или можно просто поднять лишную ноду) выше ответил. SERG1257Если ошибки в принципе приемлимы (неприятно, но не смертельно) то дорога вам в NoSQL базы, кластеры, распределители нагрузки и бежнодовое взаимодействие. Ошибки (небольшие) приемлемы. Система по сути работает и без этого, но это очень не оптимальный вариант работы. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.03.2012, 17:30 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
SERG1257Вряд ли уйдет - сервера стоят в разных странах, не то что в разных ДЦ. Выход 1 сервера не кладет систему - нагрузка распределяется между живыми. Запас пока есть. Т.е. для сервиса "контроля IP" тоже нужно обеспечивать синхронизацию между ДЦ хотя бы на уровне logshipping? А сколько вообще, в среднем, IP в сутки? А сколько в пике? И какая нагрузка в пике? А то есть у меня подозрение, что при таком сценарии работы любая СУБД будет, де-факто, in-memory и справится с легкостью. Нужно только каким-то образом (специфичном для БД) указать, что локи при update делать не нужно (или, по крайней мере, не нужно их писать на диск). Ну, еще можно включать write cache на дисках (потери при падении, как уже говорилось, не существенны). Основная сложность - синхронизация между ДЦ и автоматическое управление при падении. Какая сейчас РСУБД используется в системе? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.03.2012, 03:36 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Берешь любую СУБД. Создаешь таблицы: Unlogged Tables. Отключаешь у СУБД синхронные commit и flush на диск. Выставляешь в СУБД побольше размеры буфера. Включаешь на диске cache на запись и отключаешь flush. И используешь параметризованные запросы и пулы конектов в php. Ну и используй особенности каждой СУБД. Если допустим используешь PostgreSQL, то используй хэш-индекс. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.03.2012, 13:59 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
DPH3SERG1257Вряд ли уйдет - сервера стоят в разных странах, не то что в разных ДЦ. Выход 1 сервера не кладет систему - нагрузка распределяется между живыми. Запас пока есть. Т.е. для сервиса "контроля IP" тоже нужно обеспечивать синхронизацию между ДЦ хотя бы на уровне logshipping? что то будем изобретать наверное... отельно пасиб за то что сразу обратили на это внимание. DPH3А сколько вообще, в среднем, IP в сутки? А сколько в пике? И какая нагрузка в пике? Основная сложность - синхронизация между ДЦ и автоматическое управление при падении. Какая сейчас РСУБД используется в системе? В среднем около 150кк в среднем и до 360кк в пиках в сутки. в сукунду до 10к в пиках, но это редко. среднее что то около 2-3к в секунду. Вобщем то запросы идут относительно ровно. При этих расчетах не используется никакая. Пока для всего что нужно хватает текстовых файлов для расчетов - они небольшие и в основном все считается в памяти со сбросом изредка на диск. Но этой информации очень нехватает, надо проводить более сложные статистические расчеты по этому трафику. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.03.2012, 14:11 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03При этих расчетах не используется никакая. Пока для всего что нужно хватает текстовых файлов для расчетов - они небольшие и в основном все считается в памяти со сбросом изредка на диск. Но этой информации очень нехватает, надо проводить более сложные статистические расчеты по этому трафику.А расчёты нужны сразу? А то может просто импортитовать раз в сутки данные и уже потом считать аналитику. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.03.2012, 19:10 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
В среднем около 150кк в среднем и до 360кк в пиках в сутки. в сукунду до 10к в пиках, но это редко. среднее что то около 2-3к в секунду. Я плохо выразился. А сколько разных IP в сутки и сколько, например, в секунду в пике. Именно "разных" (по которым аггрегацию и нужно проводить). ... |
|||
:
Нравится:
Не нравится:
|
|||
24.03.2012, 21:39 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
авторЯ плохо выразился. А сколько разных IP в сутки и сколько, например, в секунду в пике. Именно "разных" (по которым аггрегацию и нужно проводить). И инфа нужна именно оперативная? С точностью до последнего запроса последней секунды? ... |
|||
:
Нравится:
Не нравится:
|
|||
24.03.2012, 22:46 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Сколько разговоров о элементарной задаче :) ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 01:31 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
DPH3В среднем около 150кк в среднем и до 360кк в пиках в сутки. в сукунду до 10к в пиках, но это редко. среднее что то около 2-3к в секунду. Я плохо выразился. А сколько разных IP в сутки и сколько, например, в секунду в пике. Именно "разных" (по которым аггрегацию и нужно проводить). Они все разные. повторения достаточно редки. редко когда будет больше 10 повторений в сутки. поэтому в таблице будет около 150-300кк записей ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 03:28 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
SERG1257авторЯ плохо выразился. А сколько разных IP в сутки и сколько, например, в секунду в пике. Именно "разных" (по которым аггрегацию и нужно проводить). И инфа нужна именно оперативная? С точностью до последнего запроса последней секунды? инфа нужна крайне оперативно. от нее зависит по какому алгоритму обрабатывать запрос. ответ должен быть в доли секунды - был ли такой ип и сколько раз ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 03:31 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03SERG1257пропущено... И инфа нужна именно оперативная? С точностью до последнего запроса последней секунды? инфа нужна крайне оперативно. от нее зависит по какому алгоритму обрабатывать запрос. ответ должен быть в доли секунды - был ли такой ип и сколько раз Если смысл анализа статистики количества запросов с какого-то отдельно взятого IP-адреса за определенный период времени еще как-то просматривается (сам сталкивался), то изменение алгоритма обработки запроса в зависимости от количества ранее сделанных запросов (ака, номера текущего запроса с конкретного IP-адреса) для СУБД - как-то не очень... ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 13:13 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Они все разные. повторения достаточно редки. редко когда будет больше 10 повторений в сутки. поэтому в таблице будет около 150-300кк записей Обращения с двухсот миллионов уникальных IP-адресов в сутки... Гугль? Скайп? Аська?.. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 13:17 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov, Нет, реклама и трафик. Просто я правда говорю, что задача достаточно нетривиальная и нагрузка идет высокая. Иногда упираемся даже в физические ограничения протоколов и железа. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 22:03 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Нет, реклама и трафик. Просто я правда говорю, что задача достаточно нетривиальная и нагрузка идет высокая. 300 миллионов адресов IPv4 это массив размером в гигабайт. Всё пространство адресов у IPv4 - четыре гигабайта. Оно целиком влезает в память. Что нетривиального в том, чтобы построить в памяти дерево и повесить ему на листья счётчики? Или даже простейший массив. 16 гигабайт ОЗУ хватит чтобы посчитать по четыре миллиарда подключений в сутки с каждого из возможных и невозможных адресов. А у тебя, как ты говоришь, количество повторных подключений не превышает десятка. В какие ограничения вы там упираетесь? Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
25.03.2012, 22:46 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Стебелек бери. Вставляет 20 млн в секунду на Икор7. В 20 раз быстрее чем стд::мап ... |
|||
:
Нравится:
Не нравится:
|
|||
04.05.2012, 23:15 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
сегодня был тест 80 миллионов вставок за 4 секунды. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.05.2012, 23:16 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
sphinx_mvStinger03пропущено... инфа нужна крайне оперативно. от нее зависит по какому алгоритму обрабатывать запрос. ответ должен быть в доли секунды - был ли такой ип и сколько раз Если смысл анализа статистики количества запросов с какого-то отдельно взятого IP-адреса за определенный период времени еще как-то просматривается (сам сталкивался), то изменение алгоритма обработки запроса в зависимости от количества ранее сделанных запросов (ака, номера текущего запроса с конкретного IP-адреса) для СУБД - как-то не очень... Нормальная и правильная постановка задачи для автоматического контроля ДДОС . Отсуюда и разный алгоритм , что бы ненапрягаясь отдавать дедосящим факоФФ или редирект наюх ничего другого не делая. Stinger03, угадал ? ... |
|||
:
Нравится:
Не нравится:
|
|||
05.05.2012, 00:21 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
ДохтаРsphinx_mvпропущено... Нормальная и правильная постановка задачи для автоматического контроля ДДОС . Отсуюда и разный алгоритм , что бы ненапрягаясь отдавать дедосящим факоФФ или редирект наюх ничего другого не делая. Ни к нормальной, ни, тем более, к правильной постановке задачи ЭТО никакого отношения не имеет. По простой причине - решение задачи защиты сетевых ресурсов к задачам СУБД не относится... ... |
|||
:
Нравится:
Не нравится:
|
|||
05.05.2012, 11:15 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Redis - самое то ... |
|||
:
Нравится:
Не нравится:
|
|||
09.05.2012, 14:13 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
вот думаю: может банить тех кто пишет "ХХХ - самое то" ? если человек ничего умного больше не в состоянии написать - стоит ли ему писать? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.05.2012, 18:02 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Попытаюсь обьяснить суть задачи. Около 150-200кк запросов к серверу в сутки Это около 1700-2300 запросов в секунду. Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз. Хранить данные более 24 часов ненужно. Что потянет подобную задачу и потянет ли вообще? авторвот думаю: может банить тех кто пишет "ХХХ - самое то" ? если человек ничего умного больше не в состоянии написать - стоит ли ему писать? Уважаемый модератор, по-моему я точно и полно ответил на вопрос топикстартера. Разбираю по частям: авторЧто потянет подобную задачу Redis автори потянет ли вообще - самое то. Или нужно мануал сюда вставить? Краткость - сестра таланта! ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 12:58 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Такую задачу потянет обычная хештаблица. Зачем Редис то ? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 13:02 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
BazistТакую задачу потянет обычная хештаблица. Зачем Редис то ? Вы собираетесь одним вебсервером обойтись? По-моему, там без фермы никак, так что будете делать хештаблицу в отдельном процессе и соответственно заново откроете Редис :) ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 13:08 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
neoddd, Гдеже вы такие беретесь. Какая ферма, что за бред. Обычная хештаблица тянет 5-10 млн вставок / секунда. Какой нибудь 286й или 386й, 90х годов завалявшийя на чердаке потянет с головой 2 тысчи вставок в секунду. Можно взять Стебельковые алгоритмы, те 80 млн айпи адресов вставляют/апдейтят/ищут за 4,5 секунды на Икор7 в инмемори режиме. Но ТСу такая мощность просто не нужна ... ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:16 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
BazistГдеже вы такие беретесь. Какая ферма, что за бред. Вежливо отвечаю: ферма для обработки веб-запросов. То есть несколько веб-серверов должны иметь доступ к общей хеш-таблице, которая, получается, должна находиться в отдельном процессе. К тому же это обеспечит сохранность данных на случай падения какого-то вебсервера в ферме. Основы основ, а вы все своими алгоритмами хвалитесь. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:24 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
neoddd, С чего вы взяли что у ТСа несколько вебсерверов и все не крутится на одной тачке ? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:27 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Около 150-200кк запросов к серверу в сутки Вижу единственое число. Видимо один сервер, одна хештаблица, зачем ферма я так и не понял. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:28 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Bazist Вижу единственое число. Видимо один сервер, одна хештаблица, зачем ферма я так и не понял. Это просто надо знать, что при такой нагруженности всегда несколько серверов в ферме стоит, даже если один справляется, есть fail-over. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:34 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
neoddd, 2000 запросов это вообще порожняковая нагрузка. На этот форум думаю поболее приходит в пик и не думаю что прямо у Джуджа ферма серверов стоит. При нормальном посоле обычный веб сервер может до полумиллиона запросов держать. Но конечно если там не такие "разработчики" которые вместо каждой хештаблицы в коде редис лепят ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:42 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03SERG1257пропущено... http://en.wikipedia.org/wiki/Server_farm это само-собой и так сейчас работает, ибо на каждый полученный запрос формируется 3-4 от нас, обрабатывается с них инфа и выдается наружу. Но вот с некоторыми вопросами статистики выходят затыки. поэтому решил у олла проконсультироватся. коллективный разум оно сподручнее :) Bazist, обьясните, вы предлагаете компании терять деньги и клиентов, если единственный сервер упадет или ваши сервера никогда не падают и в датацентрах электричество не пропадает? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:45 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
neodddBazist, обьясните, вы предлагаете компании терять деньги и клиентов, если единственный сервер упадет или ваши сервера никогда не падают и в датацентрах электричество не пропадает? Я не понимаю, вам что ТС подошел и начал плакатся в жилетку что у него падают сервера ? У ТСа элементарная как 5 копеек задача. Откуда взялись фермы, откуда взялось решение тысячи непонятных проблем. Все сервера падают конечно, и этот сайт раз другой лежит в дауне в месяц и ничего, живет както развивается. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:51 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
BazistneodddBazist, обьясните, вы предлагаете компании терять деньги и клиентов, если единственный сервер упадет или ваши сервера никогда не падают и в датацентрах электричество не пропадает? Я не понимаю, вам что ТС подошел и начал плакатся в жилетку что у него падают сервера ? У ТСа элементарная как 5 копеек задача. Откуда взялись фермы, откуда взялось решение тысячи непонятных проблем. Все сервера падают конечно, и этот сайт раз другой лежит в дауне в месяц и ничего, живет както развивается. Bazist, я вам процитировал про ферму у ТС-ра. Как по-вашему, есть разница между sql.ru и компанией с обязательствами перед клиентами? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:55 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Ну тогда пардон,. Если на одном сервере потребность в этих данных то хештаблица, если нужно шарить эту таблицу между несколькими серверами, то наверное редис или чтото в этом роде. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.05.2012, 14:59 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Хм, а зачем какой-то редис для такой простой задачи? Если нам нужна ненадежность редиса при его производительности - то можно просто включить кэширование на жестком диске или отключить логгирование при записи в эту таблицу (или воспользоваться еще кучей вариантов разменять производительность на надежность, имеющиеся в любой БД). Вместо сложной фермы - просто поставить 2 (n) серверов и дублировать записывающий поток на все из них (впрочем, для БД есть и стандартные драйвера). Это вполне себе системными средствами можно сделать. А так как сама табличка влезает в память, блокировки не нужны - то любая БД вполне себе справится :) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.05.2012, 18:14 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
DPH3... А так как сама табличка влезает в память, блокировки не нужны - то любая БД вполне себе справится :) Тут выбор прост: память (раз влазит) А если память, зачем гнать через горлышко БД? С Редисом сразу получаем гибкую систему, с примерно на порядок большей производительностью. При этом меньше вероятность рассыпания диска, что тоже полезно для системы в целом. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.05.2012, 18:55 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
neoddd, Ну, с точки зрения эксплуатации, лучше уж БД, для которой можно всегда найти специалиста, нежели фигня, которую придется поддерживать исключительно самостоятельно и набивать шишки тоже самостоятельно. Тем более что СУБД обычно уже есть :) На порядок большая производительность - это вряд ли, с чего-бы. тут производительность зависит от скорости диска на потоковую запись, так что какая разница. Разве что СУБД обычно с диском поэффективнее работают. А вот про рассыпание диска - тут поподробнее, почему это для Редиса вероятность будет меньше? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.05.2012, 23:13 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
DPH3, я считаю, что достаточно озвучил свои доводы. Реального желания спорить у меня нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.05.2012, 12:17 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
[quote ДохтаР]sphinx_mvпропущено... Нормальная и правильная постановка задачи для автоматического контроля ДДОС . Отсуюда и разный алгоритм , что бы ненапрягаясь отдавать дедосящим факоФФ или редирект наюх ничего другого не делая. Stinger03, угадал ? Нет, совсем не угадал. К ддосу мы не имем никакого отношения, но сами испытывали что это такое. Так что тех кто занимается - очень-очень сильно не любим. Под задачей сейчас стоит несколько серверов и так - само-собой ни один сервер в одиночку это не потянет. И падение системы конечно недопустимо ни на минуту - ибо запросы идут, деньги теряются. пока сделали подпорку через мемкешед как предлагали в самом начале. кой-как это работает :) само-собой конечно это верно только для одного сервера в ферме, но пока устраивает хотя бы так. Сейчас перевалило за 200кк входящих запросов в сутки (соответственно это около 500-600кк исходящих получается). По поводу redis - сайчас нам мемкешед лучше подходит так как получается быстрее. Теперь стал вопрос в обработке более подробной информации по трафику и соответсвенно нагрузка продолжает расти. К тому же сервера для устойчивости разнесены по разным ДЦ, поэтому задача имеет продолжение. Так что кто обсуждает - всем спасибо большое. Помогаете смотреть на задачу со стороны и смотреть те варианты над которыми не задумывались или не знали. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.05.2012, 18:30 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03... Сейчас перевалило за 200кк входящих запросов в сутки (соответственно это около 500-600кк исходящих получается). ... Еще есть, куда расти. Например: Stats: The firehose is at 250 million tweets a day. 936 CPU Cores Supports 16,000 Data Streams Per Server Processes Whole Twitter Firehose 250+ million Tweets per day. As a comparison, Visa says in 2007 they processed 27.612 billion transactions, which this paper estimates is 2100 transactions per second during the busiest 8 hours of the day. Those are complete transactions however. Current Peak Delivery of 120,000 Tweets Per Second (260Mbit bandwidth) Performs 250+ million sentiment analysis with sub 100ms latency ... |
|||
:
Нравится:
Не нравится:
|
|||
17.05.2012, 18:43 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Задача - определить было ли уже в течении 24 часов обращение с одного и того же ИП и желательно сколько раз Товарищи, это полный пи#$ец, как говаривал один мой друган. Эту процитированную задачу решает простой тупой прокси-сервер, который тупо и просто гадит в локальный файл, что любой студень напишет на любом перле\пхп на любой переменке между любыми лабами. Определение было ли обращение - постфактум по этим файлам. При чём в процитированной постановке СУБД вообще? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.06.2012, 01:59 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Не вникнув в суть задачи делать заявления о п#$це по меньшей мере не красиво. Тупой прокси-сервер ляжет через 0,1 секунду после включения и утянет за собой всю структуру. За вчера обработано 1 017 929 064 запросов. Это где то 12к входящих запросов в секунду. И обрабатывать их надо в рилтайме. Перл/пхп банально не имеют многопоточности и впадают в ступор тут же, точнее сказать мгновенно, как собственно и студенты которые просто не поймут что делать. Собственно по сути вопрос не решился - точность определения повторов сейчас страдает, но пока в допустимых пределах. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 16:29 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03Тупой прокси-сервер ляжет через 0,1 секунду Ну используйте не тупой, или тыщу штук запустите. Должно быть принципиальное понимание, что если сейчас некая сущность в состоянии принимать запросы и в принципе работает, то заведомо более легковесная сущность с меньшим лагом - тем более будет работать. Stinger03И обрабатывать их надо в рилтайме Это ещё зачем вдруг понадобилось? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:00 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Повторю задачу для тех кто читает с конца топика. Есть ферма. На нее приходит запрос на данные. В зависимости от уникальности ИП формируется ответ на этот запрос и отдается. Если этот ИП уже запрашивал данные, то ответ должен быть уже другим. Т.е. мне надо не просто отсеять уники от неуников, но и учитывать уникальность при выдаче информации. Причем отдать эту информацию надо тоже как можно быстрее, хотя бы по причине того, что в случае задержек все просто заткнется из-за количества запросов. Ну если сильно упростить всю задачу и на пальцах: Надо по каждому клиенту показать уникальный банер. Если он этот видел - надо показывать другой. Этот банер формируется при запросе на лету. Вся информация для построения банера берется с компьютеров вне фермы, поэтому надо еще учесть время на запрос информации извне, построение банера и отдачи на запрос. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:29 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Ничего оперативнее уже предложенного - 12311559 , имхо, вряд ли что придумаешь. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:40 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
в том что ферма состоит из нескольких десятков машин. а считать уникальность надо в пределах всей фермы. выделить машину под такую базу в памяти и обращатся к ней ? так количество запросов не протиснется в интерфейс помоему ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:49 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03выделить машину под такую базу в памяти и обращатся к ней ? так количество запросов не протиснется в интерфейс помоему12к входящих запросов в секунду - протиснется. Потенциальная подстава будет, если в другой ДЦ обращаться придется. А не протиснется - шардить. Благо, что задача легко шардится хоть на миллион серверов. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:54 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03, Кстати, если хранить не линейным массивом, а деревом, то время обработки несколько возрастет (вряд ли заметно по сравнению с сетевыми задержками), а расход памяти резко снизится. Тогда, возможно, можно будет даже не выносить на отдельный сервер. Хотя, конечно, синхронизация от этого не упростится... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 17:58 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03, А есть ли четкая зависимость, что какие-то ip-адреса обычно обращаются в один ДЦ, другие - в другой, третьи - в третий? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:00 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
miksoft12к входящих запросов в секунду - протиснется Проблема в том, что в начале топега было 2k запросов в секунду. В ноябре чел зашьётся на 100k записей в секунду, или придётся всё переделывать опять. Stinger03Ну если сильно упростить всю задачу и на пальцах: Надо по каждому клиенту показать уникальный банер Гы 100500 раз. Любому очевидно, что гарантировать уникальность в этом деле - себе дороже. Достаточно с вероятностью близкой к 1 это делать. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:43 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
нет. несколько машин стоят под распределение нагрузки и они раскидывают запросы в зависимости от нагрузки на рабочие сервера. поэтому одини тот же ИП может появится на разных машинах. сейчас как раз решаем вопросы синхронизации данных используя мемкешед. от разных датацентров кстати пришлось отказатся - все сейчас в одном. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:47 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03, Кстати, а почему вы не решаете задачу хранением этого флага/счетчика на клиенте? в куках, например. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:48 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
у клиентов нету куков :) это не конечные пользователи ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 18:56 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03у клиентов нету куков :) это не конечные пользователидесятки или сотни миллионов клиентов, которым показывают рекламные баннеры - не конечные пользователи??? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.07.2012, 19:02 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Банеры это всеже слегка притянутый за уши пример, хотя суть отражает полностью. Мы даем информацию, которая в конечном счете доходит до компьютеров пользователей, но мы никакого доступа к этим компьютерам не имеем. ... |
|||
:
Нравится:
Не нравится:
|
|||
28.07.2012, 13:58 |
|
Нужна консультация по очень большой нагрузке
|
|||
---|---|---|---|
#18+
Stinger03нет. несколько машин стоят под распределение нагрузки и они раскидывают запросы в зависимости от нагрузки на рабочие сервера. поэтому одини тот же ИП может появится на разных машинах. сейчас как раз решаем вопросы синхронизации данных используя мемкешед. Это как? Если, например, четные адреса обрабатываются одной подсистемой, а нечетные - другой, то один конкретный IP будет только в одной подсистеме. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.08.2012, 18:11 |
|
|
start [/forum/topic.php?all=1&fid=35&tid=1552527]: |
0ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
30ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
91ms |
get tp. blocked users: |
2ms |
others: | 13ms |
total: | 177ms |
0 / 0 |