Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Время доброго Понадобилась задача. Есть 130К файлов общим объемом 3.2Тб в трех копиях Сортированные списки файлов совпадают, даты сбиты. Суммарный размер всех файлов прыгают примерно на тысячные доли процентов (при объеме в терребайты, разница в объеме в сто мегабайт) Но. Есть подозрение что часть файлов в каждой копии битая. Как определить, какие именно ? Пытался намутить md5sum, но она медленная ужасно. Какие еще могут быть варианты ? Пока на уме - сделать некое подобие xor-хеша с фибоначи-позициями. То есть брать позиции 1 2 3 5 8 13... и делать исключающее или. Теоретически, это быстрее и возможно даже что-то выдаст... 4 8 15 16 23 42 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 00:13 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Раз уж различия в объемах, так почему бы не проверить идентичность размеров одноименных файлов в каждой из трех копий. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 00:31 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
размеры не совпадают. Пока грешу на разные настройки файловых систем (везде ext4) Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 00:49 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Кароч, я таки запустил хеш на два потока (пока только две копии генерят кеш) за 50 минут прошло 20к и 29к файлов (хз какого размера суммарно) оставлю на ночь - посмотрю что будет утром :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 01:01 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Aklinоставлю на ночь - посмотрю что будет утром :-) Обязательно сообщи результат! Вся страна с замиранием ждет это знаменательное событие! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 01:50 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Aklinразмеры не совпадают. Пока грешу на разные настройки файловых систем (везде ext4) Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 03:42 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Мимо проходилсяAklin Обязательно сообщи результат! Вся страна с замиранием ждет это знаменательное событие! 29 несовпадений по хеш :-/ ПРИЧЕМ две резервных копии (cold и hold) - совпадают между собой а основная копия (data) - с ними не совпадает :-/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 13:32 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Aklin, ты хоть что-нибудь гуглишь ? есть cksum. похоже это crc32 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 15:54 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
netwindAklin, ты хоть что-нибудь гуглишь ? есть cksum. похоже это crc32 видел вроде, но в на машине еще не установлена и установить не могу - инета нету ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 16:22 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Aklin, да стандартная она. из пакета coreutils ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 18:07 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Врятли дело в скорости хеша. Мой Core Duo P8600 считает MD5 на скорости > 400 мбайт/с, так что всё скорее всего упирается в диски. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 18:18 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
МутагенВрятли дело в скорости хеша. Мой Core Duo P8600 считает MD5 на скорости > 400 мбайт/с, так что всё скорее всего упирается в диски. похоже на то поэтому я и думал какой-нибудь кеш, который не требует всего файла... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 18:20 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
netwindAklin, да стандартная она. из пакета coreutils на моей убунте почему то нет :-( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 18:20 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
в общем такое ощущение что повторным копированием этих файлов (их оказалось 30 штук всего, причем разного размера все - от килобайтных до десятков гб) - проблема решилась хеши md5sum стали совпадать запустил на ночь md5sum + sha1sum посмотрю что будет... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.01.2012, 18:46 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
поднимаю вопрос ребилдил рейд, увеличил ФС снова выдает овер 120 ошибок на тех же файлах в чем может быть проблема ?? пытаюсь сейчас написать програмулину, которая бы сравнивала файлы бинарно и исправляла ошибки при необходимости :-/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.02.2012, 18:58 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
что интересно - прогонял одновременно и md5 и sha1 хеши. по md5 - 490 строк различий (примерно - 4 строки это один различающийся файл) по sha1 - 430строк ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.02.2012, 19:21 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
написал програмулину, побайтово сравнивающую файлы получилось, что в первом файле который я проверил - не совпадает один блок, причем подрят байты несовпадающие идут :-/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.02.2012, 19:40 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
интересная статистика расхождений: я сделал так, что бы выводились блоки. случайное попадание одного символа - не считается. получилось: Код: plaintext 1. 2. 3. 4. 5. 6. блоки 28к отличаются от блоков в 4к двумя совпадающими символами. если не считать и их - получается весьма и весьма забавная картика :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.02.2012, 21:48 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
а вот отличие на другом, 40гб файле: Код: plaintext 1. 2. 3. 4. 5. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.02.2012, 21:59 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Интересно, смешному лунтику Алкину кто-нибудь уже пояснит уже, что у него битая оперативка? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2012, 00:12 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Ваш капитан очевидностьИнтересно, смешному лунтику Алкину кто-нибудь уже пояснит уже, что у него битая оперативка? почему именно память а не контроллер ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2012, 00:23 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
AklinВаш капитан очевидностьИнтересно, смешному лунтику Алкину кто-нибудь уже пояснит уже, что у него битая оперативка? почему именно память а не контроллер ? В контроллере есть встроенные механизмы (CRC и прочие), да еще и OS часто следит за этим, а в памяти - нет. При этом даже ECC не спасает. Подобное поведение было замечено, и не раз, если на сервере криво выставлены тайминги и вообще скорость. Тупо сыпется память, бьются блоки в Oracle. Метод проверки - .iso файл(ы) записывается в /tmp (tmpfs), потом два раза (ну или 100) считается md5. Если поймал расхождение - ищи косяк в мозгах. В своих в т.ч. (тебе это особенно актуально). Метод гарантии не дает, кстати. Особенно если в своих. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2012, 00:27 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Ваш капитан очевидность, md5 и sha1 на 20 запусков - одинаковы фот запущу на ночь новсякей ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2012, 01:08 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
AklinВаш капитан очевидность, md5 и sha1 на 20 запусков - одинаковы фот запущу на ночь новсякей Откуда ты запускал, глупыш? Совсем про tmpfs ничего не понял? Файл должен целиком залезть в оперативку. Целиком. Какой дурак проверяет работоспособность отдельного буфера размером в мегабайт при 8 гектарах оперативы, которая просто ничего не делает при этом? А потом - поменять местами планки, и еще раз прогнать. Объяснять зачем менять? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2012, 01:12 |
|
||
|
Быстрый хеш ?
|
|||
|---|---|---|---|
|
#18+
Ваш капитан очевидность, посмотри в зеркало - что ты там видишь ? Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.02.2012, 01:18 |
|
||
|
|

start [/forum/topic.php?fid=25&msg=37634181&tid=1483660]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
94ms |
get topic data: |
9ms |
get forum data: |
3ms |
get page messages: |
55ms |
get tp. blocked users: |
1ms |
| others: | 302ms |
| total: | 496ms |

| 0 / 0 |
