|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Несколько сотен тысяч файлов, все <=2 Кб, разбросаны по папкам вложенности от 3-5. 7z упаковывает такое дело в ~40 раз. Однако хранить на диске нужно именно в таком открытом виде, чтобы приложение могло читать (это тайлы для картографического сервера). Соответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками. Как можно оптимизировать хранение и операции обновления-удаления-переименования такого вида файлов? Файловые контейнеры, специализированные ФС и т.д.? ПС На счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:34 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
С чем вообще связано обновление этих самых тайлов? Регулярно переснимаются соответствующие участки местности или что? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:44 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим Н> Несколько сотен тысяч файлов, все <=2 Кб, разбросаны по папкам вложенности от 3-5. > 7z упаковывает такое дело в ~40 раз. Однако хранить на диске нужно именно в таком открытом виде, чтобы приложение могло читать (это тайлы для картографического сервера). Создать VHD с compressed NTFS... -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:45 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим НФайловые контейнеры, специализированные ФС и т.д.? NTFS оптимизирована для хранения большого количества файлов. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:47 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraСоздать VHD с compressed NTFS...Нахрена это надо-то? Для мелких и уже несжимаемых файлов? Диск на 80Гб утилизировать? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:50 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Нахрена это надо-то? > Для мелких и /уже несжимаемых/ файлов? Диск на 80Гб утилизировать? Чтобы удобнее переносить было в одном контейнере, как архив... ;-) -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:54 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirra Чтобы удобнее переносить было в одном контейнере, как архив... ;-)Я про осмысленность компрессии. P.S. Про "архив" - тоже непонятно. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 16:56 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Я про осмысленность компрессии. > P.S. Про "архив" - тоже непонятно. Ну, компрессия - к слову пришлось... А остальное: у меня, например, старая фидошная база в msg валяется... Не десятки тысяч мелких файлов, но один десяток тысяч - точно есть... Всё лежит в VHD, который подключается при старте... Мне вполне удобно пользоваться этим в таком виде, что я этот файл могу оттараканить в любую винду, подключить его и пользоваться и там... -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:09 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraМне вполне удобно пользоваться этим в таком виде, что я этот файл могу оттараканить в любую винду, подключить его и пользоваться и там...Только мне кажется, что даже если владельцу картографического сервера потребуется что-то и куда-то тягать, то он (при минимальной адекватности) воспользуется несколько более другими средствами, чем виртуальный диск в файле-контейнере? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:15 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Только мне кажется, что даже если владельцу картографического сервера потребуется что-то и куда-то тягать, то он (при минимальной адекватности) воспользуется несколько более другими средствами, чем > виртуальный диск в файле-контейнере? Надо у ТС спросить... Зачем использовать ХШ, если можно просто подождать ЕГО ответа?.. ;))) -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:17 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraЗачем использовать ХШ, если можно просто подождать ЕГО ответа?.. ;)))Ключевая фраза моего возражения - "даже если". Вероятная причина заблуждений ТС - "7z сжимает в сорок раз". ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:23 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. SidorovС чем вообще связано обновление этих самых тайлов? Регулярно переснимаются соответствующие участки местности или что? Да, раз в месяц примерно, но схем много очень. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:24 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим ННесколько сотен тысяч файлов, все <=2 Кб... 100 000 x 2kb = 200 000 kb = 200 Mb - совсем не много Максим НСоответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками. Разбираться. Что значит очень медленно? Что значит ресурсозатратно? Какие ошибки? Максим НКак можно оптимизировать хранение и операции обновления-удаления-переименования такого вида файлов?... 1) Читать доки, разбираться 2) Кого-то нанять, кто может выполнить п.1 3) Обратиться к профессиональным гадалкам а пока, при исходных данных, можно повторить только ответ: Dimitry SibiryakovNTFS оптимизирована для хранения большого количества файлов. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:39 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev>> Максим Н >> Несколько сотен тысяч файлов, все <=2 Кб... > 100 000 x 2kb = 200 000 kb = 200 Mb - совсем не много Про размер кластера слышал что-нибудь?.. ;-) -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:41 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим Н...На счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде. В Windows (NTFS) в атрибутах файла есть галочка "сжимать содержимое для экономии места на диске". При таком уровне знаний, можно порекомендовать попытаться просто найти человека который может: a) выдать рекомендации и сделать настройку b) обеспечить дальнейшую поддержку (например когда настройки слетят и ошибки начнут повторяться). IMHO ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:42 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraПро размер кластера слышал что-нибудь?.. про NTFS читал что нибудь? обменялись комплиментами? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:44 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev> про NTFS читал что нибудь? Сказать, про какую это файловую систему?.. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
-- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 17:49 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirra... И.....При чем тут кластеры? ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:03 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev> И.....При чем тут кластеры? А какое слово непонятно из Files size , Allocated size , Cluster size и/или Files slack ?.. -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:04 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
IMHO А исходный вопрос топикастера достаточно сложен: 1. Не понятно, что это за "картографический сервер" Соответственно: Не понятны рекомендации разработчика картографического сервера. Если это например ArcGIS, то такие рекомендации быть должны - им и нужно следовать 2. Несколько сотен тысяч файлов, все <=2 Кб, разбросаны по папкам вложенности от 3-5. В целом это не проблема (см. выше). 3. все <=2 Кб А вот это уже странно: 3a - Что это за тейлы такие? 3б - NTFS может хранит мелкие файлы (вроде <1K) специальным образом, внутри MFT. Можно высказать _предположение_, что возникает ненормально большая нагрузка на MFT. Диск пустой, а MFT все забито под завязку (и возможно жутко фрагментировано). Нужно смотреть. 4. 7z упаковывает такое дело в ~40 раз. Все чудесатее и чудесатее. (C) Что это за тейлы такие? Обычно тейлы хранится в PNG, т.е. уже в сжатом формате. 5. Версия Windows не приведена. Разбивка на диске не приведена. Все остальное - так же не приведено 6. При знания автора, отсылать его в реестр.... Потом вообще компьютер не загрузится ))) etc..etc... В общем, вопросов огромное кол-во. А начинать надо с пункта 1. "рекомендации производителя картографического софта". IMHO & AFAIK Да и вообще: Приумножая знания - приумножаем скорбь (C) Эклизиаст ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:06 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraА какое слово непонятно из Files size , Allocated size , Cluster size и/или Files slack ?.. 1. Непонятно, какое это отношение имеет к вопросу автора. 2. Ну и в NTFS "все не так однозначно" (C) дочь офицера ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:08 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, 1. очевидно это набор векторных и растровых картинок и текстовых файлов. 3. Тейпы - это те мелкие "квадратики" разных масштабов, из которых формируется карта. Ты наверняка видел их (и их прорисовку) и на телефоне и в гугл/яндекс maps. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:12 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
p.s. собственно сейчас сам разрабатываю "картографический сервис" на базе Oracle Map Viewer. Такими проблема, как у автора топика - вообще не парюсь. Т.к. такой проблемы нет p.p.s. до этого (8 лет назад) разрабатывал систему КАМИС . Где спокойно хранили десятки-сотню тысяч изображений музейных предметов в одной папке. В случае формата JTIP (пирамидальный jpeg, jpeg tailed piramidales как-то так по французки), изображение = папка с десятком-сотней файлов (тейлов). Никаких проблем нет ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:15 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, как бы "картография" ТС сбивает с толку. Пусть идёт на SASGis и там спрашивает. Windows тут абсолютно не при чём. __________________________ Как хранить много мини-файлов и размеры кластера обсуждалось много-много-много-много раз, и ищо раз, много-много, много раз :) ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:22 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirra Про размер кластера слышал что-нибудь?.. ;-)Если опираться на объективные данные, а не на эвристику "диспетчеров файлов", то на NTFS мелкие файлы не занимают ни одного кластера. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 18:52 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Gator... 1. Если файлы действительно очень маленькие - возможно MFT превратилось в помойку. Но это нужно смотреть. И ставить нормальный дефрагментатор дисков (не то убожество, что после топора M$ /отсечение всего нужного/ в Windows вошло). 2. Я бы первым делом полез править реестр. 3. Не понятно, как разбит диск. Даже тот же пресловутый размер кластера (хотя для производительности это дело десятое). 4. Откуда взялись такие файлы - не очень понятно. Обычно там PNG (не сжимаются). 5. Таскание между серверами - дело сложное. Обычно тейлы это просто кеш, который сервер должен (десять раз ха) уметь пересчитывать. Просто так копировать их с места на место - это очень странно, там наверное какие-то еще движения нужно делать. С Oracle Map Viewer например "все не так однозначно". До сих пор нифига не понимаю, как он тейловый кэшь чистит, все время матюгаюсь. 6. Ну и какое оборудование... В принципе, сейчас есть относительно недорогие (домашняя версия до 10 т.р.) SSD-устройства, которые должны "просто летать" (если конечно от полета не перегорят). При объемах ТС, меньше 1 Gb, вполне можно и нормальную железку воткнуть. etc...etc...etc... Ну и при такой специфической задаче, под нее явно должен быть бюджет ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 19:00 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим НДа, раз в месяц примерно, но схем много очень.На предыдущей работе я участвовал в эксплуатации ИС с бОльшим файловым хранилищем - более миллиона (пользовательских) файлов в паре сотен гигабайт. После того, как разработчики вычистили косяки многопоточного доступа - проблемы на прикладном уровне исчезли. Проблем на уровне файловой системы - не было. Правда, в нашем случае некритично время доступа к файлам, но при адекватном хранилище оно будет укладываться в единицы-десятки миллисекунд без каких-либо дополнительных усилий. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 19:03 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Если опираться на объективные данные, а не на /эвристику/ "диспетчеров файлов", то на NTFS /мелкие/ файлы не занимают ни одного кластера. Объективые - это куда?.. Размер папки и по сведениям FAR'а, и по сведениям Свойств папки от M$ - идентичны и кратны... См. выше Allocated и File size... -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 20:17 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraРазмер папки и по сведениям FAR'а, и по сведениям Свойств папки от M$ - идентичны и кратны...Это означает лишь то, что оба они используют одинаковую эвристику См. выше Allocated и File size...Уже демонстрировал, но повторю ещё раз: D(isk)U(sage) Руссиновича и (штатный) fsutil Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35.
"Хаки" типа жёстких ссылок или/и разреженных (sparse) файлов не использовались - сначала создаём файлы нулевого размера, а потом при-copy-рываем к каждому по сто байт. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 22:26 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorovто на NTFS мелкие файлы не занимают ни одного кластера.МFT, ясен пень, витает в облаках и кластеры не занимает. Как и служебные журналы, права etc ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 22:28 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev...Я разве спорю? Я про Эх, ррраз (да што ты), да ишшшо раз (да што ты)... . ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 22:33 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Уже демонстрировал, но повторю ещё раз: > + D(isk)U(sage) Руссиновича и (штатный) fsutil Вася, ты извини, но... Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9.
Или ты мне что-то другое, про какие-то фокусы с обнулениями говорить хочешь?.. У меня там файлы от 120Б до 82КиБ... Большинство: меньше кластера... Из них: большая часть порядка 512Б... .... fsutil, к сожалению умеет только за весь диск говорить, а не за каталог... -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 22:45 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirrafsutil, к сожалению умеет только за весь диск говорить, а не за каталог...Не надо считать меня совсем тупым. Тест, разумеется, не делался на системном разделе и, разумеется, был единственным писателем. Так что все изменения числа свободных кластеров являются результатом работы с файлами в одном-единственном каталоге. P.S. Даже если бы NTFS не умела оптимизировать хранение мелких файлов, миллион кластеров стандартного размера в четыре килобайта это меньше четырёх гигабайт дискового пространства. По сегодняшним временам это не тот объём, оптимизацией использования которого надо срочно заняться. Тем более, что ТС озвучил на порядок меньшее число файлов. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 22:58 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Тест, разумеется, не делался на системном разделе и, разумеется, был единственным писателем. Ну при чём тут вымышленные и высосаные тесты?.. Я тебе показываю результат реального своего каталога, где реальный размер файлов отличается от занятого в 4 с гаком раза... ЗЫ. Никто никого никем не называет... Ты мне просто пытаешься сферического коня какого-то втюхать, а я тебе показываю реальность, данную мне в ощущениях... ЗЗЫ. Если правильно помню, то на старом реальном диске я ставил кластер 512Б... Но там с большими файлами стали быть проблемы... -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 23:03 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraНу при чём тут вымышленные и высосаные тесты?..При том, что они имеет гораздо лучше соотносятся с ситуацией ТС, чем демонстрация результатов работы эвристики на произвольно взятом каталоге.Я тебе показываю результат реального своего каталога, где реальный размер файлов отличается от занятого в 4 с гаком раза...Прибавляем к ненулевому размеру каждого файла половину размера кластера, нацело делим на размер кластера и умножаем результат на размер кластера. Для файлов нулевого размера ставим размер кластера. Суммируем и должны получить то, что выдаёт d(isk)u(sage). Для не очень большого суммарного размера файлов можно проделать исключительно штатным cmd.exe. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 23:19 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
zirraЕсли правильно помню, то на старом реальном диске я ставил кластер 512Б... Но там с большими файлами стали быть проблемы...Яркий, кстати, пример вредности преждевременной оптимизации. P.S. NTFS это вам не HPFS ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 23:20 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov> Яркий, кстати, пример вредности преждевременной оптимизации. > P.S. NTFS это вам не HPFS Ну, тут я ничего ляпать не буду, т.к. с оным не пришлось работать ни разу... Но когда "диски были маленькими", для msg у меня был отдельный мелкий дисочек с 512Б... Вполне экономило, пока траффик от поинтов не заставил его прибить и перенести всё на общий диск... .... Вообще, ТСу понадавали тут кучу вариантов, пусть сам тестирует уже́!.. Лучше него же - всё равно никто не справится... ;-) -- Vladimir A.Bakhvaloff Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2014, 23:32 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev1. Если файлы действительно очень маленькие - возможно MFT превратилось в помойку. Но это нужно смотреть. И ставить нормальный дефрагментатор дисковЯ бы не сказал, что contig "надо ставить": contig -v C:\$Mft Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25.
В частности, уже нельзя простым способом необратимо раздуть MFT. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 01:18 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
В принципе с хранением такого количества, не должно быть проблем. Вот архивировать такое количество, или просто скопировать по сети - тоже не проблема, а просто очень долго, и это надо делать в рабочее время, дабы заполнить весь свой день копированием Максим НСоответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками.Вот здесь неплохо бы подробнее, что такое "обновление"? Записать десяток новых файлов, стереть десяток старых - не должно быть проблем. Максим ННа счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде.Так приложение под виндой или под *nix? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 10:00 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
S.G.В принципе с хранением такого количества, не должно быть проблем. Вот архивировать такое количество, или просто скопировать по сети - тоже не проблема, а просто очень долго, и это надо делать в рабочее время, дабы заполнить весь свой день копированием Максим НСоответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками.Вот здесь неплохо бы подробнее, что такое "обновление"? Записать десяток новых файлов, стереть десяток старых - не должно быть проблем. Максим ННа счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде.Так приложение под виндой или под *nix? Все под виндой. Обновление - это залить архивчик с 3-4 сотнями тысяч тайлов, мегабайт на 800. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 10:17 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Тайлы это png-файлы, размером ровно в 1,79 Кб. Про 40 раз не шучу, могу пруф сделать (возможно это связано с тем, что есть однотипные файлы, одинаковые в разных подпапках). Попробовал ужать один png-файл в 7z, он стал размером в 331 байт. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 10:21 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим НПопробовал ужать один png-файл в 7z, он стал размером в 331 байт. Для пнг и оптимизаторы есть, до двух раз "ужимают". ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 10:26 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
wadmanДля пнг и оптимизаторы есть, до двух раз "ужимают".не факт, что потом они "склеются" в карту ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 11:36 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Чего мне вообще нужно - максимально оптимизировать работу с такими файлами, т.к. когда 20 Мб архив распаковывается на 800 Мб (это чистый размер, не "на диске") это по моему не нормально, даже если сменю размер кластера с 4 Кб на 2 Кб навряд ли ситуация кардинально изменится. Причем такая распаковка 7z-архива зачастую сваливается с ошибкой "Insufficient system resources exist to complete the requested service". Чтобы копирование тайлов с одного сервака на другой (такая необходимость иногда возникает) не выполнялось 2-3 дня как сейчас. Документацию геосервера читаю, ответа пока не нашел. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 12:06 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Можно раздельно подходить к разным проблемам и ошибки, а не сваливать все в одну кучу? Максим НЧего мне вообще нужно - максимально оптимизировать работу с такими файлами, Оптимизация - это процесс зависящий от критериев, что и зачем оптимизируется. Максим Нт.к. когда 20 Мб архив распаковывается на 800 Мб (это чистый размер, не "на диске") это по моему не нормально Почему это не нормально? Вам для "картографического сервера" жалко купить 1 SSD-диск не очень большого объема? У меня дома _отдельный_ SSD диск куплен _специально_ под игрушку Lineage 2 за 2 тыс. рублей. И я вообще не парюсь, сколько и чего там занято. Работает и хорошо... нафиг трогать.... Если у Вас нет 2-10 тыс. рублей на диск... что тут посоветовать... Максим Ндаже если сменю размер кластера с 4 Кб на 2 Кб навряд ли ситуация кардинально изменится а ЗАЧЕМ ее менять? Максим НПричем такая распаковка 7z-архива зачастую сваливается с ошибкой "Insufficient system resources exist to complete the requested service". Единственная и первая конкретика в данной теме. 7z не пользуюсь, нормальные архиваторы падать на мой взгляд не должны. Чье это сообщение и чья ошибка (архиватора или ОС) не глядя на систему сказать сложно. Максим НЧтобы копирование тайлов с одного сервака на другой (такая необходимость иногда возникает) не выполнялось 2-3 дня как сейчас. Вторая конкретика. Только, как Вы умудряетесь копировать < 1G информации за 2-3 дня и причем тут ХРАНЕНИЕ файлов - для меня загадка. Заархивировали файлы на одном компьютере _нормальным_ и более менее стандартным архиватором (7z я таким не считаю). Скопировали архив. Разархивировали. Если операция частая и "картографический сервер" реально нужен, купить _выделенный_ SSD диск 64-128 Gb для хранения тейлов за <10 000 руб, на мой взгляд можно себе позволить. IMHO & AFAIK ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 15:02 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Про "Insufficient system resources exist to complete the requested service" при дисковых операциях информации в Инет полно. Но все опять упирается что никакой конкретики Вы не сообщили и вытягивать ее из Вас через форум это достаточно бредово. Так же как давать рекомендации по правке реестра, плохо понимая, что на Вашем компьютере происходит на самом деле. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 15:36 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Ситуация осложняется тем, что данная система работает на 30 совершенно разных серваках, разбросанных по всей Необъятной у клиентов. Поэтому просто так взять и поставить SSD диск не получится, так же как и покопаться в логах и трейсах, т.к. все выполняется только через местных администраторов, официальные письма и т.д. Leonid KudryavtsevОптимизация - это процесс зависящий от критериев, что и зачем оптимизируется. Было интересно услышать Бест Практис. Leonid KudryavtsevВторая конкретика. Только, как Вы умудряетесь копировать < 1G информации за 2-3 дня и причем тут ХРАНЕНИЕ файлов - для меня загадка. Бывают ситуации, когда нужно перенести ВСЕ тайлы на новый сервак например, или на новый диск (средний размер 100 Гб). ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 17:06 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим Нкогда 20 Мб архив распаковывается на 800 Мб (это чистый размер, не "на диске") это по моему не нормальноВас пугает степень сжатия?! Т.е. "автор думал, когда текст писАл", хорошо сделал свою работу, но вы всё равно недовольны??? Как-то даже не знаю, что и сказать ...Причем такая распаковка 7z-архива зачастую сваливается с ошибкой "Insufficient system resources exist to complete the requested service"Попробуйте что-нибудь изменить. Способ упаковки, версию, архиватор.Чтобы копирование тайлов с одного сервака на другой (такая необходимость иногда возникает) не выполнялось 2-3 дня как сейчасКопирование состоит из трёх этапов - открытия (создания) файла, собственно копирования данных и, возможно атрибутов, закрытия файлов. Длительность первой и третьей фазы от размера файлов не зависит. Поэтому, когда копируется один файл размером в гигабайт - упираемся в пропускную способность, когда миллион файлов по килобайту - во время, слабо зависящее от пропускной способности, но сильно зависящее от задержек (латентности) канала передачи данных. При озвученных вами размерах отдельного файла и суммарном их размере получается около полумиллиона файлов. Я бы сказал, что два-три дня - много. Где-то в разы, но не на порядок. Это если используется именно копирование. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 17:06 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим НСитуация осложняется тем, что данная система работает на 30 совершенно разных серваках, разбросанных по всей Необъятной у клиентов. Поэтому просто так взять и поставить SSD диск не получится, так же как и покопаться в логах и трейсах, т.к. все выполняется только через местных администраторов, официальные письма и т.д.Научитесь делить зоны ответственности. Преамбула: если вы не являетесь аутсорсером, который администрирует систему клиента, не надо пытаться выполнять работу системного администратора - хреновому не поможете, хорошего - разозлите. Амбула: Либо делаем тестовые системы нескольких конфигураций, оптимально их настраиваем, снимаем характеристики и выдаём клиенту параметры и результат, как ориентиры, либо просто сообщаем, что "система с такими-то параметрами обеспечивает такие-то результаты". Дальше уже пусть клиент решает - готов ли он заплатить деньги за своих хотелки.Бывают ситуации, когда нужно перенести ВСЕ тайлы на новый сервак например, или на новый диск (средний размер 100 Гб).Если, опять-таки, опираться на средний размер в два килобайта, то сто гигабайт это примерно пятьдесят миллионов файлов. Я бы сказал, что два-три дня в такой ситуации - хороший результат. Особенно при копировании через сеть. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 17:17 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. SidorovЕсли, опять-таки, опираться на средний размер в два килобайта, то сто гигабайт это примерно пятьдесят миллионов файлов. Я бы сказал, что два-три дня в такой ситуации - хороший результат. Особенно при копировании через сеть. Что a) отличается от заявленных автором сотни тысяч файлов в первом сообщении b) копировать настолько мелкие файлы через сеть, это самоубийство и дэбилизм. Запаковали, архив перенесли, разпаковали. c) Когда мне в свое время нужно было копировать много файлов на одном диске, я даже специальные плагины под FAR ставил. Т.к. ждать пока все пофайлово скопируется даже десяток минут, мне было влом. Если кто-то хочет копировать по два-три дня и неделями. Ну что же... Ctrl-C, Ctrl-V и пусть наслаждается... Каждый сам себе мазохист Ну и подводя итоги: a) Автор хочет от нас услышать Бест Практикс и создание документации администратора, рекомендаций по выбору железа, рекомендаций по настройке ОС и железа и так далее - работа в общем то платная и _сильно_ платная b) Собственно геоинформационной системой у автора в конторе никто не занимается. Судя по постам ТС, он и жнец и на трубе дудец (все от Unix до Windows, Oracle, Postgress, Java, Net etc) - успехов c) Такие системы должны стоить не просто дорого, а очень дорого. - см. п.1 Не говоря уже о том, что пошла х.з. какая страница темы, а до сих пор не сказана ни версия Windows , ни название картографического софта , ни размещение по дискам , ни конфигурацию железа , ни реальных проблем и ошибок etc..etc..etc... Если все запихали в RAID-5, свалили на системный диск, работают методом Ctrl-C, Ctr-V в эклорере и так далее. Помойка она и есть помойка. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 17:43 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
ТС, написал на почту ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 17:57 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsevb) копировать настолько мелкие файлы через сеть, это самоубийство и дэбилизм. Запаковали, архив перенесли, разпаковали.Дебилизм - именно архивировать: суммарное время на упаковку-распаковку существенно превысит время копирования, плюс - потребуется дополнительное место и время на работу с архивом.Каждый сам себе мазохистОсетра категоричности урежьте. Или, хотя бы сообщите (максимальные) число и объём копируемых вами данных. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 18:20 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Basil A. Sidorov, Да нет никакой категоричности. Вы спросили, как "оптимизировать". Логично ожидать, что оптимизируется то, в чем есть проблемы. Пока, Вы назвали только 2-3 проблемы и то _совершенно_ из _разных_ областей. 1. Ошибка возникающая при разархивации 7z - х.з. с чем связанная 2. Долгое время копирования - опять таки без деталей возможно что-то еще, пропустил Проблема то у Вас в чем? Гигабайт файлов в течении 2-х дней скопировать не можете? (пара сотен тыс. файлов, по 2 k) Для Windows и NTFS кол-во файлов проблемой обычно не являются. Вообще. Оптимальное хранение зависит от используемого софта (так и не названного) и решаемых задач (пока названо только копирование файлов за 2-3 дня). Или, хотя бы сообщите (максимальные) число и объём копируемых вами данных. Дома 3 Tb винчестер с порнyхой. Раз там лежат, значит когда-то скопировал. И что? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 19:05 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
На самом деле, сорри за тон. Настроения нет. Голова с похмелья болит. Да и жить скучно. Файлы у меня копируются быстро ))), т.ч. заняться не чем. Вот на форумах и троллю ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
19.06.2014, 19:20 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Я в своих прогах для этих целей держу БД на DB2 и в BLOBе файлы(текстовые в CLOBe). Удобно бэкап делать. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.06.2014, 11:48 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Максим Н, Решил данную проблему так (под IIS). Тайловое покрытие на крупных масштабных уровнях - это действительно куча сжатых (png) мелких файлов, которые в файловой системе хранятся с большими накладными расходами. Дык, объединял их по смежности (в квадрате по координатам) в файлы приличного размера, в начале файла тупой индекс для доступа к элементом (мелкие файлики имеют разный размер). Далее, под веб-сервер (у меня для IIS использовалось ISAPI) писалось не сложное расширение для доступа по URL к отдельному PNG файлику. Эффект был потрясающий - место хранения на диске уменьшилось на порядок. Но, все это конечно применимо для покрытия, когда имя файла (и путь к нему) это по сути координаты кусочка на карте. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.04.2019, 21:24 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
Вот и я похвастаюсь. Написал пару функций в PowerShell. Они собирают данные о файлах: имя, директорию, даты создания/изменения, размер и самое главное хэш. И кладут всё это в базку на скуле. Таким образом, собрав данные о десятках тысяч файлов, смог прочистить их по дубликатам хэша. Около 100Гиг освободилось. Если интересно кому-то, могу поделиться. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.04.2019, 18:57 |
|
Как правильно хранить огромное количество мелких файлов?
|
|||
---|---|---|---|
#18+
SandalTree, reivent the wheel? https://docs.microsoft.com/ru-ru/windows-server/storage/data-deduplication/overview ... |
|||
:
Нравится:
Не нравится:
|
|||
14.04.2019, 19:45 |
|
|
start [/forum/topic.php?all=1&fid=26&tid=1492477]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
164ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
81ms |
get tp. blocked users: |
2ms |
others: | 12ms |
total: | 299ms |
0 / 0 |