|
|
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinovnetwind, дык елы-палы.... угу, и "мы" видим дальше тонко подмечено - информации действительно мало, будь ее достаточно, все бы сразу зарешалось. Что можно понять по логам состояния... Зато мне видно, что ни одно из ваших предположений не подходит. репозитарии лишние не подключали? Ubuntu и так славен быстрым включением необстрелянных пакетов и ядер. Может пока не поздно посмотреть в сторону FreeBSD Этот Ubuntu не славен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 21:25:31 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, что не подходит? посмотреть дебаг-лог? не смешите ... вы же "все видите дальше", что там дальше? Пустота там, с логами состояния, ничего никто не знает, даже разработчики... Знали бы - ответили "Ты вася сделай так и так и все будет хорошо" Чем Убунту не славен... вы хоть с Линуксом общаетесь? Сравните ядра в Дебиане Центе по одну сторону и Убунту федорой по другую, а потом проанализируйте, что ставят на серьезные сервера из Линуксов. Отвечу - ставят более консервативные дистрибутивы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 21:45:21 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinov, кстати, из собственной практики, в этот год не захотел переводить сервера с Цента6 на Цент7 - перевел на Убунту 14, такой же ЛТС, теперь просто плююсь, то одно ляжет то другое не встанет... хотя дома Убунту - десктоп, не жалуюсь ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 21:55:49 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinov, вот два ваших неверных предположения : 1 это не проблема конфигурации 2 памяти достаточно про ubuntu в какой-нибудь другой топик. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 21:59:02 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
С репозитория перконы все установлено. Не думаю, что соберу как-то по другому, что оно лучше заработает. Что Вы привязались к памяти я не знаю, ещё в первом посте написал, что её точно хватает. Дебаг лог ещё не анализировал, завтра посмотрим что там интересного. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 22:32:45 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
На убуете весь парк, больше сотни машин, у некоторых аптайм пару лет, как правило ни со стабильностью ни с установкой софта, как вы написали, у нас проблем нет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 22:35:13 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, спасибо за мнение. мое мнение - оно неправильное, буду точнее - вы занимаетесь отрицанием, не говоря утверждения. и вы не тот человек, который может говорить в данном случае, правильны мои предположения или нет. У вас просто нет предположений. Про убунту речи не идет, посмотрите на название топика. У топик стартера ОС-Убунту 14 ЛТС. Перечитайте. Про память я даже не заикался. (опять же - про... даже не понял про какую) Не надо комкать все что у вас в голове с моими репликами. Суть. У человека в обкатке Галера на убунту. Регулярно вылетает ошибка (выше). В продакшн он такое ест-но не запустит. авторAlex_Ustinov, вот два ваших неверных предположения : 1 это не проблема конфигурации 2 памяти достаточно1 и 2 - это мое или ваше, я свое не узнаю. Я не зря упомянул про 100 случаев, У галеры узким местом может быть даже "узкий" хаб 100М Hett, да ставят Убунту, верю я вам, и у самого стоит. Просто у меня степень надежности в практике у Убунту занижена. Так сложилось. В дебаге запустили? интересен лог. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 22:45:49 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinovnetwind, спасибо за мнение. мое мнение - оно неправильное, буду точнее - вы занимаетесь отрицанием, не говоря утверждения. Правильно. Я помогаю отфильтровать ваши изначально неудачные предположения. Просто внимательно перечитайте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 22:49:42 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Hett, ***Что Вы привязались к памяти я не знаю, ещё в первом посте написал, что её точно хватает. ))) да не приязывался я к памяти... Я вижу что ее выше крыши (в системе) в логе который вы показали, не было параметра выделенным шрифтом sort_buffer_size, стал навскидку считать и не увидел. Все проблемы в Линуксах на виду. Только самое сложное где их найти эти виды... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 22:52:29 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, правильно, я могу накопипастить ваши только отрицающие реплики. Перечитайте, и вспомните для чего существуют форумы, прежде чем написать в ответ. И это не отфильтровывать чужие предположения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 22:58:39 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinov, в данной ситуации отсечение неверных причин - тоже помощь. Маловероятно что и отладочный лог прольет на что-то свет. Это третье бесполезное предположение от вас. Код надо вместе с файлом core надо смотреть, а его понимают только разработчики. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 23:01:12 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, дебаг-логи на что-то прольют, примерно будет видно где затык. я вижу все чисто объективно - это галера + ноды + сетевые интерфейсы (свич)+ плотность записи на диски и это узкие места, в одной галере дело не сто`ит Если бы Hett сказал - у меня свич 10G и интерфейсы мин 1G и диски SSD я бы не предполагал может быть "лишнего" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 23:12:25 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinovnetwind, дебаг-логи на что-то прольют, примерно будет видно где затык. Часто проливают в других программах. Но тут разработчик по ссылке уже написал, что им нужен файл core. Там какие-то тикеты и мутексы в bt. Скорее всего эти очень часто вызываемые операции ничего в отладочный лог не пишут. Это, кстати, было мое первое "положительное" предложение. А второе, в том чтобы не использовать Galera. Есть же репликация master-master. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 23:17:58 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, ****Это третье бесполезное предположение от вас. да не надо считать мои верные неверные предположения, вы не можете утверждать какие они по сути. первые два я так и не понял, может быть их уже 4-е? Странная у вас позиция... отфильтровывать... Не ведите себя как Люмикс... Он как я видел, любитель бесполезного оффтопа Диссертацию что ли пишите... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 23:20:26 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinov, поясню почему считаю важным высказываться, хотя некоторым это кажется внесением сплошного негатива : люди потом приходят с гугла и начнают заново проделывать заранее непродуктивные действия в порядке обсуждения . Ну вот так это происходит. Хорошо сделано на stackoverflow, где бредовые версии тоже высказываются, но потом не набирают плюсиков чтобы попасть наверх или их не выбирает задающий вопрос в качестве верного ответа. Вот тогда все довольны. Но у нас этого нет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 23:31:28 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, я может быть и согласен с вами в некоторых вещах, но исходя из последнего... в большинстве случаев вы тогда занимаетесь каким то сбором плюсиков, делая мне минусики... что в корне странно, правда? так где-то и на майлруответ и еще где то, но в контексте топикстартера это чушь. Вы поймите процесс галеры, даже просто механизм и будет проще... Несколько ПК отсылают друг другу информацию по своим портам и пишут ее на диски. Опять же я предполагаю, что все ноды самостоятельно "хороши" Настройки очень просты, но в данной схеме есть узкое место. Его надо вычислить. По моим предположением забиваются либо потоки либо упор в запись на диск. Если это каким то образом подтверждается - делаем так и так, если нет копаем дальше сигнал 11 - это общая ошибка для многих случаев именно в таких ситуациях. А вы что-то отсеиваете, если еще сеять нечего, еще только собирается посадочный материал... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.12.2015, 23:48:51 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinovузкое место забиваются либо потоки либо упор в запись на диск. сигнал 11 - это общая ошибка для многих случаев именно в таких ситуациях. запустите в линуксе man 7 signal. Там будет конкретное соответствие между номером и названием сигнала . в man будет такая строка : SIGSEGV 11 Core Invalid memory reference Теперь прочитайте внимательно из интернета как этот сигнал объясняет википедия: https://ru.wikipedia.org/wiki/Ошибка_сегментации Это ошибки логики программы - разыменование указателя, выход за границы массива, совместный доступ без надлежащей блокировки и тд. Ее не должно быть ни при какой нагрузке. Программа же завершается. Никакой связи с предложенными вами причинами нет. Совершенно очевидная вещь для тех, кто хоть чуть-чуть писал на классических языках - C/C++/Pascal, допускал такие ошибки и видел SIGSEGV. Нет, 1С не из этих. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 02:18:19 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, вы начинаете понимать механизм работы программы. вы начинаете делать предположения (я кстати не беру на себя роль оценщика или арбитра, каким для плюсиков заделались вы) вы начинаете заниматься плагиатом, видно поняв свои непредположительные высказывания. Практически любые ошибки в программах - это неверное "использование-управление памятью", так сказать "утечка", или какие то блокировки (???). Что такое блокировки? А это блокирование к страницам памяти да и диска тоже, опускаясь на землю, у нас же есть ibdata, с которым проводятся достаточно мощные операции. А откуда блокировки? Ах да, тут же потоки...Ах да, тут же семафоры для поездов )) Кстати, модное слово Мутекс (мьютекс мютекс, в какой удобно транскрипции) - это всего лишь "бабушка с влажком" - пускать дальше или приостановить поток. Если вы хоть что-то близко делали на с/с++ - вы должны это понимать. Говоря о википедии - ее можно читать, но догмой считать нельзя. Статью писал человек, возможно такой же как и вы. Многие пишут для "плюсиков". Я знаю сотню статей ни о чем, которые показывают просто при устройстве на работу - "посмотрите сколько у меня статей!". Думать, еще раз думать, задача программиста. И искать лучшие варианты. А теперь о том что я упоминал выше. Вы просто переписали мои предположения другими словами. Пока, я на 99 процентов уверен, что проблема с потоками (которые используют память), и если урегулировать потоки в ноде (уменьшить) и на галере (допустим, есть такое wsrep_slave_threads ), то что-то можно выжать. Возвращаюсь к выше сказанному мной - "надеюсь что железо в порядке" (пометим /***/). Про сто случаев у signal 11 я уже писал. Еще раз - сигнал 11 подходит под 100 ошибок. Все они растут из одного места (если /***/ в порядке). Если вы не читаете то что я пишу, то мне не пишите. ....Вы возвели себя в ранг непонятно кого (уже честно напрягает). Спускайтесь на землю. Здесь все спокойно... И упрощайте, упрощайте. Буздумное заучивание терминов не приводит к результату. Важно понимание. на сим хватит, оффтопить. Уходит очень много времени. и еще. Сейчас мы обговариваем элементарный "тюнинг", чтобы привести систему в спокойную работу. Умные слова отбросим. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 09:12:42 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
авторЕсли бы Hett сказал - у меня свич 10G и интерфейсы мин 1G и диски SSD я бы не предполагал может быть "лишнего" Все так и есть. Но что-то сомневаюсь, что проблема в "узком месте". Там нагрузка для такого железа совсем никакая. Включение дебага ничего не дало, он показывает какие запросы выполнялись до крэша но это ничего не проясняет, так как всегда все по разному. Сейчас думаю над версией некорректного обновления (сначала поставили мускуль 5.5 на галере 2, потом обновились до 5.6 на галере 3) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 09:52:03 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
автор Там нагрузка для такого железа совсем никакая. Да даже если бы и железо было слабое, не должно оно даже на максимальной нагрузке валиться так. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 09:52:42 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_UstinovПока, я на 99 процентов уверен, что проблема с потоками (которые используют память), и если урегулировать потоки в ноде (уменьшить) и на галере (допустим, есть такое wsrep_slave_threads ), то что-то можно выжать. Возвращаюсь к выше сказанному мной - "надеюсь что железо в порядке" (пометим /***/). Это - вредный совет. Ошибка может появиться уже при большой нагрузке с более печальными последствиями и невозможностью поделиться личными данными клиентов. Лучше сейчас ловить и отправить core. Alex_Ustinov....Вы возвели себя в ранг непонятно кого (уже честно напрягает). Спускайтесь на землю. Здесь все спокойно... И упрощайте, упрощайте. Буздумное заучивание терминов не приводит к результату. Важно понимание. Человека, который искренне не понимает почему вы даете вредные советы. Если бы вы не знали изложенных очевидных фактов, цитат из википедии, то это для меня бы все объяснило. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 11:01:10 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Hett, я не вижу что у вас, поэтому такие общие вещи. еще мелочи- проверьте синхронизацию времени (ntp) отключение selinux (допустим MariaDB Cluster этого настоятельно просит) таблицы все innodb (без MyIsam), первичные ключи (уникальные ключи), если время у вас позволяет, конечно лучше сделать все с нуля. Хотя бы будете уверены, что все на чистом листе. ****...какие запросы выполнялись до крэша но это ничего не проясняет, так как всегда все по разному если это будет дальше - смотреть запросы. ведь крах в рез-те их выполнения (баги существуют, их надо обходить). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 11:08:42 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
netwind, я против отправки core разработчикам или куда угодно. Ни одним словом это не озвучивал. Я не дал ни одного вредного совета. Я наталкиваю на мысль, предполагая что-то, и получаю доп.информацию. Вы не дали никакого. Посоветую читать не энциклопедические статьи, а практические и конечно мануалы. Вспоминая ваше упоминание о с/с++ напомню, что добавление одного ключика при компиляции резко меняет дальнейшую судьбу приложения. Этого ключика вы можете не найдете в энциклопедии. Теперь после ответа Hett - @...какие запросы выполнялись до крэша но это ничего не проясняет, так как всегда все по разному...@ ситуация упростилась. Это не проблемы Галеры (как я и предполагал), интерфейсов, сетевой структуры, а проблемы структуры базы, говорю общими словами. Выше мною написано - баги существуют, можно элементарно наткнуться на баг при использовании NULL default у поля. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 11:24:32 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Hett, кстати выложите, может, конфиги и pt-summary с обоих машин. Если, допустим, меняли thread_stack под воздействием других вредных советов, то это запросто может привести к SIGSEGV. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 11:32:08 |
|
||
|
Падает мускуль
|
|||
|---|---|---|---|
|
#18+
Alex_Ustinov я НЕ против отправки core разработчикам или куда угодно. Ни одним словом это не озвучивал. Я не дал ни одного вредного совета. Я наталкиваю на мысль, предполагая что-то, и получаю доп.информацию. Вы не дали никакого. Не, от меня три совета было: послать core использовать master-master сообщить побольше информации о системе. Просто посмотрим чем закончится ситуация в багтрекере. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.12.2015, 11:43:50 |
|
||
|
|

start [/forum/topic.php?fid=47&msg=39136590&tid=1832323]: |
0ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
55ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
70ms |
get tp. blocked users: |
2ms |
| others: | 248ms |
| total: | 418ms |

| 0 / 0 |
