powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / Windows [игнор отключен] [закрыт для гостей] / Как правильно хранить огромное количество мелких файлов?
58 сообщений из 58, показаны все 3 страниц
Как правильно хранить огромное количество мелких файлов?
    #38673251
Максим Н
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Несколько сотен тысяч файлов, все <=2 Кб, разбросаны по папкам вложенности от 3-5.
7z упаковывает такое дело в ~40 раз. Однако хранить на диске нужно именно в таком открытом виде, чтобы приложение могло читать (это тайлы для картографического сервера).
Соответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками.
Как можно оптимизировать хранение и операции обновления-удаления-переименования такого вида файлов?
Файловые контейнеры, специализированные ФС и т.д.?

ПС

На счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673268
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
С чем вообще связано обновление этих самых тайлов?
Регулярно переснимаются соответствующие участки местности или что?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673273
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим Н> Несколько сотен тысяч файлов, все <=2 Кб, разбросаны по папкам вложенности от 3-5.
> 7z упаковывает такое дело в ~40 раз. Однако хранить на диске нужно именно в таком открытом виде, чтобы приложение могло читать (это тайлы для картографического сервера).
Создать VHD с compressed NTFS...

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673277
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим НФайловые контейнеры, специализированные ФС и т.д.?
NTFS оптимизирована для хранения большого количества файлов.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673285
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraСоздать VHD с compressed NTFS...Нахрена это надо-то?
Для мелких и уже несжимаемых файлов? Диск на 80Гб утилизировать?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673292
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Нахрена это надо-то?
> Для мелких и /уже несжимаемых/ файлов? Диск на 80Гб утилизировать?
Чтобы удобнее переносить было в одном контейнере, как архив... ;-)

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673297
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirra Чтобы удобнее переносить было в одном контейнере, как архив... ;-)Я про осмысленность компрессии.

P.S. Про "архив" - тоже непонятно.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673326
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Я про осмысленность компрессии.
> P.S. Про "архив" - тоже непонятно.
Ну, компрессия - к слову пришлось...
А остальное: у меня, например, старая фидошная база в msg валяется...
Не десятки тысяч мелких файлов, но один десяток тысяч - точно есть...
Всё лежит в VHD, который подключается при старте...
Мне вполне удобно пользоваться этим в таком виде, что я этот файл могу оттараканить в любую винду, подключить его и пользоваться и там...

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673343
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraМне вполне удобно пользоваться этим в таком виде, что я этот файл могу оттараканить в любую винду, подключить его и пользоваться и там...Только мне кажется, что даже если владельцу картографического сервера потребуется что-то и куда-то тягать, то он (при минимальной адекватности) воспользуется несколько более другими средствами, чем виртуальный диск в файле-контейнере?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673345
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Только мне кажется, что даже если владельцу картографического сервера потребуется что-то и куда-то тягать, то он (при минимальной адекватности) воспользуется несколько более другими средствами, чем
> виртуальный диск в файле-контейнере?
Надо у ТС спросить...
Зачем использовать ХШ, если можно просто подождать ЕГО ответа?.. ;)))

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673361
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraЗачем использовать ХШ, если можно просто подождать ЕГО ответа?.. ;)))Ключевая фраза моего возражения - "даже если".
Вероятная причина заблуждений ТС - "7z сжимает в сорок раз".
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673363
Максим Н
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. SidorovС чем вообще связано обновление этих самых тайлов?
Регулярно переснимаются соответствующие участки местности или что?
Да, раз в месяц примерно, но схем много очень.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673385
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим ННесколько сотен тысяч файлов, все <=2 Кб...
100 000 x 2kb = 200 000 kb = 200 Mb - совсем не много
Максим НСоответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками.

Разбираться. Что значит очень медленно? Что значит ресурсозатратно? Какие ошибки?
Максим НКак можно оптимизировать хранение и операции обновления-удаления-переименования такого вида файлов?...

1) Читать доки, разбираться
2) Кого-то нанять, кто может выполнить п.1
3) Обратиться к профессиональным гадалкам

а пока, при исходных данных, можно повторить только ответ:
Dimitry SibiryakovNTFS оптимизирована для хранения большого количества файлов.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673392
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev>> Максим Н
>> Несколько сотен тысяч файлов, все <=2 Кб...
> 100 000 x 2kb = 200 000 kb = 200 Mb - совсем не много
Про размер кластера слышал что-нибудь?.. ;-)

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673393
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим Н...На счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде.
В Windows (NTFS) в атрибутах файла есть галочка "сжимать содержимое для экономии места на диске".

При таком уровне знаний, можно порекомендовать попытаться просто найти человека который может:
a) выдать рекомендации и сделать настройку
b) обеспечить дальнейшую поддержку (например когда настройки слетят и ошибки начнут повторяться).

IMHO
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673395
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraПро размер кластера слышал что-нибудь?..

про NTFS читал что нибудь?

обменялись комплиментами?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673405
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev> про NTFS читал что нибудь?
Сказать, про какую это файловую систему?..
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
г================= Quick view ==============17:45
¦                                               ¦
¦ Folder "MAIL"                                 ¦
¦                                               ¦
¦ Contains:                                     ¦
¦                                               ¦
¦ Folders          3                            ¦
¦ Files            4120                         ¦
¦ Files size       8 612 305                    ¦
¦ Allocated size   34 751 056 (403%)            ¦
¦                                               ¦
¦ Cluster size     8 192                        ¦
¦ Files slack      26 138 101 (75%)             ¦
¦ MFT overhead     650 (0%)                     ¦
¦-----------------------------------------------¦
¦MAIL                                           ¦
L===============================================-

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673432
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirra...
И.....При чем тут кластеры?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673435
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev> И.....При чем тут кластеры?
А какое слово непонятно из Files size , Allocated size , Cluster size и/или Files slack ?..

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673438
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IMHO А исходный вопрос топикастера достаточно сложен:
1. Не понятно, что это за "картографический сервер"
Соответственно: Не понятны рекомендации разработчика картографического сервера. Если это например ArcGIS, то такие рекомендации быть должны - им и нужно следовать

2. Несколько сотен тысяч файлов, все <=2 Кб, разбросаны по папкам вложенности от 3-5.
В целом это не проблема (см. выше).

3. все <=2 Кб
А вот это уже странно:
3a - Что это за тейлы такие?
3б - NTFS может хранит мелкие файлы (вроде <1K) специальным образом, внутри MFT. Можно высказать _предположение_, что возникает ненормально большая нагрузка на MFT. Диск пустой, а MFT все забито под завязку (и возможно жутко фрагментировано). Нужно смотреть.

4. 7z упаковывает такое дело в ~40 раз.
Все чудесатее и чудесатее. (C)
Что это за тейлы такие? Обычно тейлы хранится в PNG, т.е. уже в сжатом формате.

5. Версия Windows не приведена. Разбивка на диске не приведена. Все остальное - так же не приведено
6. При знания автора, отсылать его в реестр.... Потом вообще компьютер не загрузится )))

etc..etc...

В общем, вопросов огромное кол-во. А начинать надо с пункта 1. "рекомендации производителя картографического софта". IMHO & AFAIK

Да и вообще: Приумножая знания - приумножаем скорбь (C) Эклизиаст
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673442
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraА какое слово непонятно из Files size , Allocated size , Cluster size и/или Files slack ?..

1. Непонятно, какое это отношение имеет к вопросу автора.
2. Ну и в NTFS "все не так однозначно" (C) дочь офицера
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673451
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev,
1. очевидно это набор векторных и растровых картинок и текстовых файлов.
3. Тейпы - это те мелкие "квадратики" разных масштабов, из которых формируется карта.

Ты наверняка видел их (и их прорисовку) и на телефоне и в гугл/яндекс maps.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673456
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
p.s. собственно сейчас сам разрабатываю "картографический сервис" на базе Oracle Map Viewer. Такими проблема, как у автора топика - вообще не парюсь. Т.к. такой проблемы нет
p.p.s. до этого (8 лет назад) разрабатывал систему КАМИС . Где спокойно хранили десятки-сотню тысяч изображений музейных предметов в одной папке. В случае формата JTIP (пирамидальный jpeg, jpeg tailed piramidales как-то так по французки), изображение = папка с десятком-сотней файлов (тейлов). Никаких проблем нет
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673470
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev, как бы "картография" ТС сбивает с толку. Пусть идёт на SASGis и там спрашивает.
Windows тут абсолютно не при чём.
__________________________
Как хранить много мини-файлов и размеры кластера обсуждалось
много-много-много-много раз, и ищо раз, много-много, много раз :)
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673518
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirra Про размер кластера слышал что-нибудь?.. ;-)Если опираться на объективные данные, а не на эвристику "диспетчеров файлов", то на NTFS мелкие файлы не занимают ни одного кластера.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673527
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Gator...
1. Если файлы действительно очень маленькие - возможно MFT превратилось в помойку. Но это нужно смотреть. И ставить нормальный дефрагментатор дисков (не то убожество, что после топора M$ /отсечение всего нужного/ в Windows вошло).
2. Я бы первым делом полез править реестр.
3. Не понятно, как разбит диск. Даже тот же пресловутый размер кластера (хотя для производительности это дело десятое).
4. Откуда взялись такие файлы - не очень понятно. Обычно там PNG (не сжимаются).
5. Таскание между серверами - дело сложное. Обычно тейлы это просто кеш, который сервер должен (десять раз ха) уметь пересчитывать. Просто так копировать их с места на место - это очень странно, там наверное какие-то еще движения нужно делать. С Oracle Map Viewer например "все не так однозначно". До сих пор нифига не понимаю, как он тейловый кэшь чистит, все время матюгаюсь.
6. Ну и какое оборудование... В принципе, сейчас есть относительно недорогие (домашняя версия до 10 т.р.) SSD-устройства, которые должны "просто летать" (если конечно от полета не перегорят). При объемах ТС, меньше 1 Gb, вполне можно и нормальную железку воткнуть.

etc...etc...etc... Ну и при такой специфической задаче, под нее явно должен быть бюджет )))
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673530
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим НДа, раз в месяц примерно, но схем много очень.На предыдущей работе я участвовал в эксплуатации ИС с бОльшим файловым хранилищем - более миллиона (пользовательских) файлов в паре сотен гигабайт.
После того, как разработчики вычистили косяки многопоточного доступа - проблемы на прикладном уровне исчезли.
Проблем на уровне файловой системы - не было.
Правда, в нашем случае некритично время доступа к файлам, но при адекватном хранилище оно будет укладываться в единицы-десятки миллисекунд без каких-либо дополнительных усилий.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673593
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Если опираться на объективные данные, а не на /эвристику/ "диспетчеров файлов", то на NTFS /мелкие/ файлы не занимают ни одного кластера.
Объективые - это куда?..
Размер папки и по сведениям FAR'а, и по сведениям Свойств папки от M$ - идентичны и кратны...
См. выше Allocated и File size...

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673653
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraРазмер папки и по сведениям FAR'а, и по сведениям Свойств папки от M$ - идентичны и кратны...Это означает лишь то, что оба они используют одинаковую эвристику См. выше Allocated и File size...Уже демонстрировал, но повторю ещё раз:
D(isk)U(sage) Руссиновича и (штатный) fsutil
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
Files:        1
Directories:  1
Size:         100 bytes
Size on disk: 4 096 bytes
Свободных кластеров:              0x000000000301ec41

Files:        11
Directories:  1
Size:         100 bytes
Size on disk: 45 056 bytes
Свободных кластеров:              0x000000000301ec40 : -1 * 4096 = -4096

Files:        11
Directories:  1
Size:         1 100 bytes
Size on disk: 45 056 bytes
Свободных кластеров:              0x000000000301ec40
====================================================

Files:        1
Directories:  1
Size:         100 bytes
Size on disk: 4 096 bytes
Свободных кластеров:              0x000000000301ec41

Files:        100001
Directories:  1
Size:         100 bytes
Size on disk: 409 604 096 bytes
Свободных кластеров:              0x000000000301d87f : -5058 * 4096 = -20717568

Files:        100001
Directories:  1
Size:         10 000 100 bytes
Size on disk: 409 604 096 bytes
Свободных кластеров:              0x000000000301d87f
Эвристика может ошибаться на порядок.
"Хаки" типа жёстких ссылок или/и разреженных (sparse) файлов не использовались - сначала создаём файлы нулевого размера, а потом при-copy-рываем к каждому по сто байт.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673655
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorovто на NTFS мелкие файлы не занимают ни одного кластера.МFT, ясен пень, витает в облаках и кластеры не занимает. Как и служебные журналы, права etc
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673658
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev...Я разве спорю?
Я про
Эх, ррраз (да што ты), да ишшшо раз (да што ты)... .
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673665
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Уже демонстрировал, но повторю ещё раз:
> + D(isk)U(sage) Руссиновича и (штатный) fsutil
Вася, ты извини, но...
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
G:\VHDs\DU>du.exe E:\Mail\GE\Jam\MAIL\

Du v1.5 - report directory disk usage
Copyright (C) 2005-2013 Mark Russinovich
Sysinternals - www.sysinternals.com

Files:        4120
Directories:  4
Size:         8.612.305 bytes
Size on disk: 36.380.672 bytes
Где правда-то?..
Или ты мне что-то другое, про какие-то фокусы с обнулениями говорить хочешь?..
У меня там файлы от 120Б до 82КиБ...
Большинство: меньше кластера...
Из них: большая часть порядка 512Б...
....
fsutil, к сожалению умеет только за весь диск говорить, а не за каталог...

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673673
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirrafsutil, к сожалению умеет только за весь диск говорить, а не за каталог...Не надо считать меня совсем тупым.
Тест, разумеется, не делался на системном разделе и, разумеется, был единственным писателем.
Так что все изменения числа свободных кластеров являются результатом работы с файлами в одном-единственном каталоге.

P.S. Даже если бы NTFS не умела оптимизировать хранение мелких файлов, миллион кластеров стандартного размера в четыре килобайта это меньше четырёх гигабайт дискового пространства.
По сегодняшним временам это не тот объём, оптимизацией использования которого надо срочно заняться.
Тем более, что ТС озвучил на порядок меньшее число файлов.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673674
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Тест, разумеется, не делался на системном разделе и, разумеется, был единственным писателем.
Ну при чём тут вымышленные и высосаные тесты?..
Я тебе показываю результат реального своего каталога, где реальный размер файлов отличается от занятого в 4 с гаком раза...

ЗЫ. Никто никого никем не называет...
Ты мне просто пытаешься сферического коня какого-то втюхать, а я тебе показываю реальность, данную мне в ощущениях...
ЗЗЫ. Если правильно помню, то на старом реальном диске я ставил кластер 512Б... Но там с большими файлами стали быть проблемы...

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673685
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraНу при чём тут вымышленные и высосаные тесты?..При том, что они имеет гораздо лучше соотносятся с ситуацией ТС, чем демонстрация результатов работы эвристики на произвольно взятом каталоге.Я тебе показываю результат реального своего каталога, где реальный размер файлов отличается от занятого в 4 с гаком раза...Прибавляем к ненулевому размеру каждого файла половину размера кластера, нацело делим на размер кластера и умножаем результат на размер кластера.
Для файлов нулевого размера ставим размер кластера.
Суммируем и должны получить то, что выдаёт d(isk)u(sage).
Для не очень большого суммарного размера файлов можно проделать исключительно штатным cmd.exe.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673687
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
zirraЕсли правильно помню, то на старом реальном диске я ставил кластер 512Б... Но там с большими файлами стали быть проблемы...Яркий, кстати, пример вредности преждевременной оптимизации.

P.S. NTFS это вам не HPFS
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673697
Фотография zirra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov> Яркий, кстати, пример вредности преждевременной оптимизации.
> P.S. NTFS это вам не HPFS
Ну, тут я ничего ляпать не буду, т.к. с оным не пришлось работать ни разу...
Но когда "диски были маленькими", для msg у меня был отдельный мелкий дисочек с 512Б...
Вполне экономило, пока траффик от поинтов не заставил его прибить и перенести всё на общий диск...
....
Вообще, ТСу понадавали тут кучу вариантов, пусть сам тестирует уже́!..
Лучше него же - всё равно никто не справится... ;-)

--
Vladimir A.Bakhvaloff
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673725
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsev1. Если файлы действительно очень маленькие - возможно MFT превратилось в помойку. Но это нужно смотреть. И ставить нормальный дефрагментатор дисковЯ бы не сказал, что contig "надо ставить":
contig -v C:\$Mft
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
Contig v1.7 - Makes files contiguous
Copyright (C) 1998-2012 Mark Russinovich
Sysinternals - www.sysinternals.com

------------------------
Processing C:\$Mft:
Scanning file...
C:\$Mft is already in 1 fragment.
------------------------
Processing C:\$Mft::$BITMAP:
Scanning file...
Scanning disk...
File is 11 physical clusters in length.
File is in 4 fragments.

Found a free disk block at 12655070 of length 12 for entire file.
Moving 11 clusters at file offset cluster 0 to disk cluster 12655070
File size: 43520 bytes
Fragments before: 4
Fragments after : 1
------------------------
Summary:
     Number of files processed   : 2
     Number of files defragmented: 1
     Average fragmentation before: 2.5 frags/file
     Average fragmentation after : 1 frags/file
P.S. Это всё к тому, что MS вполне себе допилила NTFS до вполне себе рабочего состояния.
В частности, уже нельзя простым способом необратимо раздуть MFT.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673878
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В принципе с хранением такого количества, не должно быть проблем. Вот архивировать такое количество, или просто скопировать по сети - тоже не проблема, а просто очень долго, и это надо делать в рабочее время, дабы заполнить весь свой день копированием

Максим НСоответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками.Вот здесь неплохо бы подробнее, что такое "обновление"? Записать десяток новых файлов, стереть десяток старых - не должно быть проблем.

Максим ННа счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде.Так приложение под виндой или под *nix?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673889
Максим Н
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
S.G.В принципе с хранением такого количества, не должно быть проблем. Вот архивировать такое количество, или просто скопировать по сети - тоже не проблема, а просто очень долго, и это надо делать в рабочее время, дабы заполнить весь свой день копированием

Максим НСоответственно обновление такого хозяйства происходит очень медленно и ресурсозатратно, часто сопровождается ошибками.Вот здесь неплохо бы подробнее, что такое "обновление"? Записать десяток новых файлов, стереть десяток старых - не должно быть проблем.

Максим ННа счет Windows еще не знаю, но под *nix вроде есть ФС, которая хранит файлы в сжатом виде, но доступны они в обычном виде.Так приложение под виндой или под *nix?

Все под виндой.

Обновление - это залить архивчик с 3-4 сотнями тысяч тайлов, мегабайт на 800.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673896
Максим Н
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тайлы это png-файлы, размером ровно в 1,79 Кб.
Про 40 раз не шучу, могу пруф сделать (возможно это связано с тем, что есть однотипные файлы, одинаковые в разных подпапках).
Попробовал ужать один png-файл в 7z, он стал размером в 331 байт.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38673904
Фотография wadman
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим НПопробовал ужать один png-файл в 7z, он стал размером в 331 байт.
Для пнг и оптимизаторы есть, до двух раз "ужимают".
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674009
Фотография Gator
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
wadmanДля пнг и оптимизаторы есть, до двух раз "ужимают".не факт, что потом они "склеются" в карту
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674075
Максим Н
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Чего мне вообще нужно - максимально оптимизировать работу с такими файлами,
т.к. когда 20 Мб архив распаковывается на 800 Мб (это чистый размер, не "на диске") это по моему не нормально, даже если сменю размер кластера с 4 Кб на 2 Кб навряд ли ситуация кардинально изменится. Причем такая распаковка 7z-архива зачастую сваливается с ошибкой "Insufficient system resources exist to complete the requested service".
Чтобы копирование тайлов с одного сервака на другой (такая необходимость иногда возникает) не выполнялось 2-3 дня как сейчас.
Документацию геосервера читаю, ответа пока не нашел.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674427
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Можно раздельно подходить к разным проблемам и ошибки, а не сваливать все в одну кучу?
Максим НЧего мне вообще нужно - максимально оптимизировать работу с такими файлами,

Оптимизация - это процесс зависящий от критериев, что и зачем оптимизируется.
Максим Нт.к. когда 20 Мб архив распаковывается на 800 Мб (это чистый размер, не "на диске") это по моему не нормально

Почему это не нормально? Вам для "картографического сервера" жалко купить 1 SSD-диск не очень большого объема?

У меня дома _отдельный_ SSD диск куплен _специально_ под игрушку Lineage 2 за 2 тыс. рублей. И я вообще не парюсь, сколько и чего там занято. Работает и хорошо... нафиг трогать....

Если у Вас нет 2-10 тыс. рублей на диск... что тут посоветовать...
Максим Ндаже если сменю размер кластера с 4 Кб на 2 Кб навряд ли ситуация кардинально изменится

а ЗАЧЕМ ее менять?

Максим НПричем такая распаковка 7z-архива зачастую сваливается с ошибкой "Insufficient system resources exist to complete the requested service".

Единственная и первая конкретика в данной теме.

7z не пользуюсь, нормальные архиваторы падать на мой взгляд не должны. Чье это сообщение и чья ошибка (архиватора или ОС) не глядя на систему сказать сложно.
Максим НЧтобы копирование тайлов с одного сервака на другой (такая необходимость иногда возникает) не выполнялось 2-3 дня как сейчас.

Вторая конкретика. Только, как Вы умудряетесь копировать < 1G информации за 2-3 дня и причем тут ХРАНЕНИЕ файлов - для меня загадка.

Заархивировали файлы на одном компьютере _нормальным_ и более менее стандартным архиватором (7z я таким не считаю). Скопировали архив. Разархивировали.

Если операция частая и "картографический сервер" реально нужен, купить _выделенный_ SSD диск 64-128 Gb для хранения тейлов за <10 000 руб, на мой взгляд можно себе позволить.

IMHO & AFAIK
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674470
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Про "Insufficient system resources exist to complete the requested service" при дисковых операциях информации в Инет полно. Но все опять упирается что никакой конкретики Вы не сообщили и вытягивать ее из Вас через форум это достаточно бредово. Так же как давать рекомендации по правке реестра, плохо понимая, что на Вашем компьютере происходит на самом деле.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674572
Максим Н
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ситуация осложняется тем, что данная система работает на 30 совершенно разных серваках, разбросанных по всей Необъятной у клиентов. Поэтому просто так взять и поставить SSD диск не получится, так же как и покопаться в логах и трейсах, т.к. все выполняется только через местных администраторов, официальные письма и т.д.

Leonid KudryavtsevОптимизация - это процесс зависящий от критериев, что и зачем оптимизируется.
Было интересно услышать Бест Практис.

Leonid KudryavtsevВторая конкретика. Только, как Вы умудряетесь копировать < 1G информации за 2-3 дня и причем тут ХРАНЕНИЕ файлов - для меня загадка.
Бывают ситуации, когда нужно перенести ВСЕ тайлы на новый сервак например, или на новый диск (средний размер 100 Гб).
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674573
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим Нкогда 20 Мб архив распаковывается на 800 Мб (это чистый размер, не "на диске") это по моему не нормальноВас пугает степень сжатия?!
Т.е. "автор думал, когда текст писАл", хорошо сделал свою работу, но вы всё равно недовольны???
Как-то даже не знаю, что и сказать ...Причем такая распаковка 7z-архива зачастую сваливается с ошибкой "Insufficient system resources exist to complete the requested service"Попробуйте что-нибудь изменить. Способ упаковки, версию, архиватор.Чтобы копирование тайлов с одного сервака на другой (такая необходимость иногда возникает) не выполнялось 2-3 дня как сейчасКопирование состоит из трёх этапов - открытия (создания) файла, собственно копирования данных и, возможно атрибутов, закрытия файлов.
Длительность первой и третьей фазы от размера файлов не зависит.
Поэтому, когда копируется один файл размером в гигабайт - упираемся в пропускную способность, когда миллион файлов по килобайту - во время, слабо зависящее от пропускной способности, но сильно зависящее от задержек (латентности) канала передачи данных.
При озвученных вами размерах отдельного файла и суммарном их размере получается около полумиллиона файлов.
Я бы сказал, что два-три дня - много. Где-то в разы, но не на порядок. Это если используется именно копирование.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674594
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Максим НСитуация осложняется тем, что данная система работает на 30 совершенно разных серваках, разбросанных по всей Необъятной у клиентов. Поэтому просто так взять и поставить SSD диск не получится, так же как и покопаться в логах и трейсах, т.к. все выполняется только через местных администраторов, официальные письма и т.д.Научитесь делить зоны ответственности.
Преамбула: если вы не являетесь аутсорсером, который администрирует систему клиента, не надо пытаться выполнять работу системного администратора - хреновому не поможете, хорошего - разозлите.
Амбула: Либо делаем тестовые системы нескольких конфигураций, оптимально их настраиваем, снимаем характеристики и выдаём клиенту параметры и результат, как ориентиры, либо просто сообщаем, что "система с такими-то параметрами обеспечивает такие-то результаты".
Дальше уже пусть клиент решает - готов ли он заплатить деньги за своих хотелки.Бывают ситуации, когда нужно перенести ВСЕ тайлы на новый сервак например, или на новый диск (средний размер 100 Гб).Если, опять-таки, опираться на средний размер в два килобайта, то сто гигабайт это примерно пятьдесят миллионов файлов.
Я бы сказал, что два-три дня в такой ситуации - хороший результат. Особенно при копировании через сеть.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674631
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. SidorovЕсли, опять-таки, опираться на средний размер в два килобайта, то сто гигабайт это примерно пятьдесят миллионов файлов.
Я бы сказал, что два-три дня в такой ситуации - хороший результат. Особенно при копировании через сеть.

Что
a) отличается от заявленных автором сотни тысяч файлов в первом сообщении
b) копировать настолько мелкие файлы через сеть, это самоубийство и дэбилизм. Запаковали, архив перенесли, разпаковали.
c) Когда мне в свое время нужно было копировать много файлов на одном диске, я даже специальные плагины под FAR ставил. Т.к. ждать пока все пофайлово скопируется даже десяток минут, мне было влом. Если кто-то хочет копировать по два-три дня и неделями. Ну что же... Ctrl-C, Ctrl-V и пусть наслаждается... Каждый сам себе мазохист

Ну и подводя итоги:
a) Автор хочет от нас услышать Бест Практикс и создание документации администратора, рекомендаций по выбору железа, рекомендаций по настройке ОС и железа и так далее - работа в общем то платная и _сильно_ платная
b) Собственно геоинформационной системой у автора в конторе никто не занимается. Судя по постам ТС, он и жнец и на трубе дудец (все от Unix до Windows, Oracle, Postgress, Java, Net etc) - успехов
c) Такие системы должны стоить не просто дорого, а очень дорого. - см. п.1

Не говоря уже о том, что пошла х.з. какая страница темы, а до сих пор не сказана ни версия Windows , ни название картографического софта , ни размещение по дискам , ни конфигурацию железа , ни реальных проблем и ошибок etc..etc..etc...

Если все запихали в RAID-5, свалили на системный диск, работают методом Ctrl-C, Ctr-V в эклорере и так далее. Помойка она и есть помойка.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674654
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ТС, написал на почту
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674679
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Leonid Kudryavtsevb) копировать настолько мелкие файлы через сеть, это самоубийство и дэбилизм. Запаковали, архив перенесли, разпаковали.Дебилизм - именно архивировать: суммарное время на упаковку-распаковку существенно превысит время копирования, плюс - потребуется дополнительное место и время на работу с архивом.Каждый сам себе мазохистОсетра категоричности урежьте.
Или, хотя бы сообщите (максимальные) число и объём копируемых вами данных.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674726
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov,
Да нет никакой категоричности. Вы спросили, как "оптимизировать". Логично ожидать, что оптимизируется то, в чем есть проблемы.

Пока, Вы назвали только 2-3 проблемы и то _совершенно_ из _разных_ областей.

1. Ошибка возникающая при разархивации 7z - х.з. с чем связанная
2. Долгое время копирования - опять таки без деталей
возможно что-то еще, пропустил

Проблема то у Вас в чем? Гигабайт файлов в течении 2-х дней скопировать не можете? (пара сотен тыс. файлов, по 2 k)

Для Windows и NTFS кол-во файлов проблемой обычно не являются. Вообще. Оптимальное хранение зависит от используемого софта (так и не названного) и решаемых задач (пока названо только копирование файлов за 2-3 дня).
Или, хотя бы сообщите (максимальные) число и объём копируемых вами данных.
Дома 3 Tb винчестер с порнyхой. Раз там лежат, значит когда-то скопировал. И что?
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38674737
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
На самом деле, сорри за тон. Настроения нет. Голова с похмелья болит.

Да и жить скучно. Файлы у меня копируются быстро ))), т.ч. заняться не чем. Вот на форумах и троллю )))
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #38678299
Андрей Васильевич
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я в своих прогах для этих целей держу БД на DB2 и в BLOBе файлы(текстовые в CLOBe). Удобно бэкап делать.
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
Как правильно хранить огромное количество мелких файлов?
    #39800973
nikichale
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Максим Н,

Решил данную проблему так (под IIS). Тайловое покрытие на крупных масштабных уровнях - это действительно куча сжатых (png) мелких файлов, которые в файловой системе хранятся с большими накладными расходами. Дык, объединял их по смежности (в квадрате по координатам) в файлы приличного размера, в начале файла тупой индекс для доступа к элементом (мелкие файлики имеют разный размер). Далее, под веб-сервер (у меня для IIS использовалось ISAPI) писалось не сложное расширение для доступа по URL к отдельному PNG файлику. Эффект был потрясающий - место хранения на диске уменьшилось на порядок. Но, все это конечно применимо для покрытия, когда имя файла (и путь к нему) это по сути координаты кусочка на карте.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #39801100
Фотография SandalTree
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот и я похвастаюсь.
Написал пару функций в PowerShell.
Они собирают данные о файлах: имя, директорию, даты создания/изменения, размер и самое главное хэш.
И кладут всё это в базку на скуле.

Таким образом, собрав данные о десятках тысяч файлов, смог прочистить их по дубликатам хэша.
Около 100Гиг освободилось.

Если интересно кому-то, могу поделиться.
...
Рейтинг: 0 / 0
Как правильно хранить огромное количество мелких файлов?
    #39801109
Siemargl
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
58 сообщений из 58, показаны все 3 страниц
Форумы / Windows [игнор отключен] [закрыт для гостей] / Как правильно хранить огромное количество мелких файлов?
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]