Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Знаю, что при длительных вычислениях память может прочитать/записать некорректные данные. И дальнейшие математические расчеты идут "на смарку". Есть, конечно, память с контролем четности, но у меня ее использовать не позволяет компьютер + там этот вопрос тоже не решен на 100%. Как в длительных вычислениях защищаются от подобной напасти на обычных ПК (без контроля четности)? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 13:14 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQL, где и когда ты с таким сталкивался при использовании однопоточных приложений? Даже на десктопных системах с памятью unbuffered non-ECC такое случается только с битыми (нестабильными) модулями памяти. Если у тебя такое происходит - тестируй память с разгоном на 10% без повышения напряжения и меняй сбоящие модули. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 13:24 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLЗнаю, что при длительных вычислениях память может прочитать/записать некорректные данные. Если у тебя битая память, то в первую очередь грохнется ОС, причём непредсказуемо. К счастью, если память не битая, то просто так она сбоить не начнёт. AlekseySQLКак в длительных вычислениях защищаются от подобной напасти на обычных ПК (без контроля четности)? Никак. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 13:35 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Ну никто же не мешает выполнить вычисление на двух разных компьютерах, а потом сравнить результат. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 13:38 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Dimitry SibiryakovЕсли у тебя битая память, то в первую очередь грохнется ОС, причём непредсказуемо.Зависит от размера памяти и от расположения участка битой памяти. Грохнуться может далеко несразу, а проявится может именно в процессе работы пользовательских приложений в виде вылетов этих приложений. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 13:39 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Leonid Kudryavtsevвыполнить вычисление на двух разных компьютерах Только не на двух, а на трёх. И взять тот, что совпадёт у двоих. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:20 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLЗнаю, что при длительных вычислениях память может прочитать/записать некорректные данные. И дальнейшие математические расчеты идут "на смарку". Есть, конечно, память с контролем четности, но у меня ее использовать не позволяет компьютер + там этот вопрос тоже не решен на 100%. Как в длительных вычислениях защищаются от подобной напасти на обычных ПК (без контроля четности)? Как вариант можно материализовать промежуточные результаты на диск, как это делает Hadoop при выполнении пакетных задач MapReduce, по и создавать точки восстановления, чтобы не начинать всё вычисление с нуля. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:26 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
NekZ, вот так как раз делать и нельзя. Т.к. рядом с темой "Робя, а что делать с ошибками памяти?" появится тема "Робя, а что делать с ошибками на диске?" ))) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:29 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Leonid KudryavtsevNekZ, вот так как раз делать и нельзя. Т.к. рядом с темой "Робя, а что делать с ошибками памяти?" появится тема "Робя, а что делать с ошибками на диске?" ))) А для таких вещей есть облачные ФС, рэйд-массивы. NUMA немного из другой серии. Да и найти на каком этапе произошла ошибка будет проще. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:35 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
rdb_devAlekseySQL, где и когда ты с таким сталкивался при использовании однопоточных приложений? Даже на десктопных системах с памятью unbuffered non-ECC такое случается только с битыми (нестабильными) модулями памяти. Если у тебя такое происходит - тестируй память с разгоном на 10% без повышения напряжения и меняй сбоящие модули. Нет, это случается со всеми модулями: описание проблемы Например, моя чудо- обработка выделяется / заполняет / модифицирует 300 ГБайт памяти (за три минуты). Что будет когда я ее включу на неделю? Свою память с помощью memtest я проверил (не помню на какой итерации прервал, но точно больше часа): ошибок не обнаружено. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:38 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Leonid KudryavtsevNekZ, вот так как раз делать и нельзя. Т.к. рядом с темой "Робя, а что делать с ошибками памяти?" появится тема "Робя, а что делать с ошибками на диске?" ))) После записи данных на диск можно проверить качество их записи: считать и сравнить (и если найдена ошибка, то записать повторно). Но данный подход требует двукратных мощностей (различий будет мало, поэтому коэффициент можно считать равным 2) + алгоритм должен легко дробиться на части, где возможна запись небольшого объема данных на диск. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:42 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQL, Разумное дробление на самостоятельные подзадачи является одним из факторов успешной и поддерживаемой архитектуры. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:47 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQL, не надо читать всякую муть, о том, что может случится при ненормальной эксплуатации аппаратных комплексов информационной системы! На всякий случай - ни один десктопный комп или дорогущий сервер от IBM, HP, SuperMicro и т.д. не переживёт мощный всплеск ЭМИ, находясь в его зоне действия. На такое расчитаны только определённые системы, произведенные для военных нужд, например, некоорые платформы на базе процессора "Эльбрус". Не забивай себе голову тем, чем забивать её, абсолютно точно, не надо! В нормальных условиях эксплуатации, при использовании надёжных, хорошо зарекомендовавших и проверенных компонент никаких ошибок памяти не происходит. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:47 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQL....описание проблемы... Вы свой компьютер в космос запускаете? Ну... богато жить не запретишь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 14:51 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQL, скачай себе загрузочну флешку Memtest. Загрузись с нее и посмотри какие дефекты выскакивают на конкретно твоём железе. На скрине будет такое вот окошко. Если дефектов нет - то расслабся. Лет 30 назад программисты предусматривали прерывание по сбою памяти. И придумывали хитрые сценарии обхода. Но в наше время этим никто не занимается. Вообще сложно предусмотреть какой-то логичный сценарий обхода. Этим занимаются разве-что поставщики облак такие как MS, Google, Amazon но у них другие подходы к самой проблеме. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 17:06 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
maytonЛет 30 назад программисты предусматривали прерывание по сбою памяти. И придумывали хитрые сценарии обхода. Но в наше время этим никто не занимается. Вообще сложно предусмотреть какой-то логичный сценарий обхода. СМ 1420. ОЗУ с кодами Хэмминга штатно исправляет одиночные ошибки и обнаруживает двойные. Современный ЕСС только обнаруживает одиночные ошибки и пропускает двойные, но всем пофиг, поскольку надёжность памяти возросла до достаточной величины. PS: У ТС-а просто гениальный талант забивать голову совершенно бредовыми вопросами. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 18:18 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
mayton, спасибо, memtest запускал (ждал больше часа): ошибок не обнаружено. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 19:08 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLmemtest запускал (ждал больше часа) Час это несерьёзно. Хотя бы пару суток непрерывно погоняй. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 19:10 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Сутки тоже несерьезно. Например, моя чудо- обработка выделяется / заполняет / модифицирует 300 ГБайт памяти (за три минуты). Что будет когда я ее включу на неделю ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 19:16 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Leonid KudryavtsevСутки тоже несерьезно. Ну да, автору может и не хватить. Но лично я уже после суток объявлял комп "годным к использованию в качестве сервера". Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 19:22 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
А я вот частично поддержу топикстартера. Проблема хоть и не является острой, но имеет место быть. Dimitry SibiryakovСовременный ЕСС только обнаруживает одиночные ошибки и пропускает двойныеСтарые алгоритмы исправляют одиночные и обнаруживают двойные (при разрядности памяти 64+8). Современные ( 1 , 2 , 3 , 4 ) позволяют корректировать несколько ошибок, и даже продолжать работать при выходе из строя целого чипа. Dimitry Sibiryakovнадёжность памяти возросла до достаточной величины.Есть несколько противонаправленных векторов. С одной стороны - растет качество изготовления кристаллов. С другой - уменьшаются размеры элементов (т.е. их электрическая емкость), снижается напряжение питания, растут частоты. И растут объемы. Растут быстрее, чем растет надежность отдельных ячеек. Гугл подтверждает (страница 4), что количество исправленных ошибок не так уж мало. Ну и на моей скромной практике - совершенно нормальное явление, когда у сервера ежедневно растет счетчик исправленных ошибок. Как решать - либо переходить на сервера с ECC, либо вводить алгоритмический контроль результатов вычислений (как вариант - повторное вычисление). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 19:58 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
Дайвайте в топике пойдем не от гугла а от собственной практики. Кто из присутствующих может дать справку о современном положении дел серверной памяти? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 20:11 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
miksoftКак решать - либо переходить на сервера с ECC, либо вводить алгоритмический контроль результатов вычислений (как вариант - повторное вычисление). Сервер - там где сервер нужен. Там где ненужен - рабочие станции. В обоих ящиках память ЕСС с 8 битным хэшем. Кстати в IBM серверах в дополнение к ЕСС можно зазеркалить память. А от ошибок памяти не избавится: прилетит космическая гостья и поменяет битики... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 20:49 |
|
||
|
Робя, а что делать с ошибками памяти?
|
|||
|---|---|---|---|
|
#18+
maytonДайвайте в топике пойдем не от гугла а от собственной практики. Кто из присутствующих может дать справку о современном положении дел серверной памяти?А что с ней не так? В ЦОД'ах серваки, порой, годами в аптайме и никаких проблем. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2018, 21:23 |
|
||
|
|

start [/forum/topic.php?fid=57&fpage=18&tid=2017835]: |
0ms |
get settings: |
8ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
93ms |
get topic data: |
13ms |
get forum data: |
2ms |
get page messages: |
67ms |
get tp. blocked users: |
1ms |
| others: | 15ms |
| total: | 220ms |

| 0 / 0 |
