|
|
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Процессоры на заводе проходят нагрузочное тестирование. И те которые "ошиблись" идут обратно в сырьё. С жесткими дисками думаю вероятность сбойнуть - повыше. Переиодически анализируйте SMART-таблицы. Если там константы - выше пороговых то это значит что устройство еще не сбойнуло но может сбойнуть скоро. Фиксится заменой. А вообще на такие гипотетические проблемы откровенно забивают ибо цифры имеют астрономический порядок. Если быть честно твоя формула в первую очередь должна учесть падение метеоритов, цунами, извержения вулканов а уже потом подобные ошибки. Не учёл это? Значит ошибаешся в суждениях. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.12.2012, 19:05 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
GermanVДумаю двойной расчет даст ответ этому спору."Отправляясь в открытое море бери один компас или три". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.12.2012, 20:00 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Edd.DragonВинт имеет право прочесть неправильно один бит на 10-1000 прочитанных терабайт (это с учетом проверки контрольных сумм). Память - аналогично (порядок цифр не помню).Понимаете какое дело ... Если оставить в стороне данные гугла о гугловских датацентрах, то можете вы привести реальный пример отказа, который возник по причине железа и при этом вместо фатального сбоя системы в целом или приложения в частности, привёл к "ошибке в расчётах"? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.12.2012, 20:05 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
GermanVДумаю двойной расчет даст ответ этому спору. тройной - иначе не проголосовать. не шутка ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.12.2012, 22:14 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovПонимаете какое дело ... Если оставить в стороне данные гугла о гугловских датацентрах, то можете вы привести реальный пример отказа, который возник по причине железа и при этом вместо фатального сбоя системы в целом или приложения в частности, привёл к "ошибке в расчётах"? Балин, да дело не в полном отказе! Если сервер отправит юзеру что-то несуразное, то тот просто повторит запрос и получит свои данные. И никакого падения не произойдет. А в нашем случае кто будет выступать в роли интеллектуальной системы, способной оценить адекватность полученных данных? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.12.2012, 13:20 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
В физике и мат.статистике говорят - если вероятность этого так ничтожно мала - то этим можно пренебречь. А решение твоей проблемы - это аппаратная кластеризация. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.12.2012, 13:29 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
GermanVБалин, да дело не в полном отказе!Я вообще-то и попросил пример, когда единичный сбой памяти привёл к искажениям данных, а не к сбою конкретного приложения или системы в целом.А в нашем случае кто будет выступать в роли интеллектуальной системы, способной оценить адекватность полученных данных?Ещё раз - вы решаете проблему за пределами зоны своей ответственности и, вероятно, компетенции. P.S. Про мажиоритарную системы вам уже и намекнули и явно сказали. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.01.2013, 20:46 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
GermanVЕсли оставить в стороне данные гугла о гугловских датацентрах, то можете вы привести реальный пример отказа, который возник по причине железа и при этом вместо фатального сбоя системы в целом или приложения в частности, привёл к "ошибке в расчётах"? Для этого его нужно злонамеренно изловить, чем я не занимаюсь. А учитывая, что бОльшая часть читаемых нами файлов - это данные, допускающие искажения без особых последствий, то не вижу ничего "фантастического". Из фантастического: в этом году, например, находил на старом винте readme с мусором вместо текста. Смарт идеальный. Сбоев не было (ну и, следовательно, процедур проверки/восстановления). Файл на месте, читается, никуда не девался. А искажен... Ну не по моей вине - точно. А по чьей - никто не признаётся! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 05:53 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Я тоже об этом думал. Еще во времена ФАТ32 изобретал свою ФС где имя файла должно содержать опциональную часть (контрольная сумму). А вообще есть полезные фичи в ZFS http://ru.wikipedia.org/wiki/ZFS Кроме того, имеет место переменный размер блока, что лучшим образом влияет на производительность, параллельность выполнения операций чтения-записи, а также 64-разрядный механизм использования контрольных сумм, сводящий к минимуму вероятность незаметного разрушения данных. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 13:12 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
В IBM-мэйнфреймах для минимизации непредсказуемых сбоев в работе вычислительного блока, вычисления проводятся параллельно на двх блока с последующим сравнением результатов. А авиации и космонавтике вычислительных независимых блоков может быть больше двух. Вероятность сбоя отнюдь не маленькая, ибо есть фоновая радиация, всякие квантовые эффекты, температурные девиации, питание и банально ошибки аппаратной реализации алгоритмов в CPU или FPU, как это было уже не один раз в прошлом. Так что как и советовали ранее - параллельные вычисления на независимых железаках, причем желательно не полностью идентичных по хардверу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 13:20 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
GermanV, посмотрите, например, на LEON3FT. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 16:38 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Anatoly MoskovskyВы сейчас описали настолько редкую ситуацию, что никому и в голову не приходило создавать какие-то методики для предотвращения или борьбы с таким. Зачем врете? Fault tolerant железо существует и активно применяется, особенно в embedded. Вероятность того что ваша программа сбоит из-за оборудования, ошибки в компиляторе или ОС, а не просто криво написана, стремится к нулю. Зачем врете? Не знаете - так помалкивайте. Вероятность сбоев железа очень большая. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 16:43 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
GermanVНу может есть какой-то паттерн программирования, чтобы такое отловить. Например, в бухгалтерии придумали двойную запись и теперь легко ловят ошибки, если баланс "не сходится". Интервальная арифметика помогает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 16:44 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
oldjackalВероятность сбоев железа очень большая. Все относительно (с) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 20:24 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Edd.DragonИз фантастического: в этом году, например, находил на старом винте readme с мусором вместо текста.Т.е. из единичного сбойного бита на терабайты данных мы резко получили поток сплошных ошибок? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 21:36 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovEdd.DragonИз фантастического: в этом году, например, находил на старом винте readme с мусором вместо текста.Т.е. из единичного сбойного бита на терабайты данных мы резко получили поток сплошных ошибок? 1. Я разве написал, что знаю причину? Вроде писал ровно ОБРАТНОЕ. 2. Не поток сплошных ошибок, а мусор. И очевидно, для этого достаточно испортить совсем мало данных в файловой таблице, не трогая само содержимое файла. (но все же см. п.1.). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 22:32 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Edd.Dragonдля этого достаточно испортить совсем мало данных в файловой таблице главное - синхронно испортить все копии оной ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.01.2013, 22:40 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Edd.Dragon1. Я разве написал, что знаю причину? Вроде писал ровно ОБРАТНОЕ.Контекст, батенька, контекст. Когда в разговоре о единичных ошибках возникает "мусор" - это или "сплошной поток ошибок" или "а это здесь причём?".И очевидно, для этого достаточно испортить совсем мало данных в файловой таблице, не трогая само содержимое файла.Есть разные файловые системы и, насколько я понимаю, "в большинстве современных" контрольными суммами защищены, как минимум метаданные (те самые "совсем мало данных"). И даже бит контроля чётности защищает единичных битовых ошибок. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.01.2013, 08:14 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Изопропилглавное - синхронно испортить все копии онойЕсли "для примера", то в FAT12/FAT16 на вторую копию смотрит только чекист. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.01.2013, 08:16 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Несколько мыслей. 1. Тут нужно рассмотреть несколько layers представления данных. Не знаю как насчёт HDD но CDROM/DVDROM допускают процент ошибок на физическом уровне. При этом на уровень выше мы можем иметь чистое представление данных так как будто-бы ошибок и нет. Коды Хэмминга выруливают ситуацию. Причем архитектура кодов настолько гибкая что мы можем регулировать количество сбойных бит на блок которые можно 100% исправить. Ссылки. Код Хэмминга 2. У популярной утилиты Nero Burning Rom есть несколько режимов нарезки диска с данными где регулируется % кодов восстановления. Тоесть, если юзер - параноик и желает хранить свои фотки супер надёжно то он жертвует размером но получает диск который меньше боиться царапин и физ. дефектов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.01.2013, 12:24 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Basil A. Sidorovи, насколько я понимаю, "в большинстве современных" контрольными суммами защищены И на сколько я понимаю. А конфуз случился. И ни контрольные суммы винта не помогли. Ни контрольные суммы NTFS. Мне от этого легче? А если я узнаю причину и как это случилось - легче станет? Единичная, не единичная ошибка - мне то что? 1. Результат не адекватен. 2. Контрольки и астрономически низкие вероятности ошибок не спасли. Это все что я знаю и ничего другого слышать не хочу - файл мне ваши теории не вернут. Но при этом, плевать мне на этот файл. Т.е. критичность этой ошибки - почти нулевая. ТС же говорил о высокой критичности ошибок, но это только слова. Ранее он намекал, что не выводил оценок этой керитичности и понятия не имеет, насколько единичная ошибка может повлиять на конечный результат. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.01.2013, 00:38 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Edd.DragonА конфуз случился. И ни контрольные суммы винта не помогли. Ни контрольные суммы NTFS. Мне от этого легче? А если я узнаю причину и как это случилось - легче станет? Единичная, не единичная ошибка - мне то что?Контекст, батенька, контекст. Не надо вываливать пример произвольной ошибки в произвольную тему. Особенно, если вы не знаете почему произошла ошибка. Может вы изначально битый архив распаковали.ТС же говорил о высокой критичности ошибок, но это только слова. Ранее он намекал, что не выводил оценок этой керитичности и понятия не имеет, насколько единичная ошибка может повлиять на конечный результат.ТС пишет разную хрень, но и это не повод. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.01.2013, 08:04 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovТС пишет разную хрень, но и это не повод. Почему это "хрень"? Совершенно правильный подход. Существует и fault tolerant железо, и многочисленные алгоритмы верификации результатов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.01.2013, 15:17 |
|
||
|
Как отловить ошибки на уровне ОС / оборудования / языка?
|
|||
|---|---|---|---|
|
#18+
oldjackalBasil A. SidorovТС пишет разную хрень, но и это не повод. Почему это "хрень"? Совершенно правильный подход. Существует и fault tolerant железо, и многочисленные алгоритмы верификации результатов. Ты читай внимательно что пишет ТС. Его железячные вопросы не интересуют. Он спрашивает о методах программирования. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.01.2013, 16:22 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=38099084&tid=1341978]: |
0ms |
get settings: |
6ms |
get forum list: |
10ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
158ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
| others: | 198ms |
| total: | 436ms |

| 0 / 0 |
