синхронизация базы с другим харнилищем(файловая система) / Разработка информационных систем

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / синхронизация базы с другим харнилищем(файловая система)

3 сообщений из 3, страница 1 из 1

синхронизация базы с другим харнилищем(файловая система)

#38524921

alex564657498765453

Участник

Сообщения: 1 942

Рейтинг: 0 / 0

Пишу сюда, так как вопрос на уровне идеи работы с базой, а не реализации.

что у нас есть - у нас есть два хранища, база и файловая система. содержимое Юфайла(юзера) храниться в серии мелких файлов разкиданых по разным серверам. Метаинформация о Юфайле и данные для сборки Юфайла из физических на шдд в БД.

и возникает серьёзная делема, как быть при удалении.

СТРУКТУРА БАЗЫ ОПУСКАЯ информационные поля.

FILES(idfile as PK, ...)

NODES(idnode as PK, ...)

CHUNKS(idchunk as PK,number,FK_idfile, FK_idnode1, FK_idnode1, FK_idnode1 )

обяснение.
Файл разбиваеться на части пронумерованные(chunks.number), каждую которую сохраняем трижды(на трёх разных серверах) - fk_idnode(1|2|3)

ТРУДНОСТИ.
у нас трижды ссылка на одну таблицу - денормализация, выбрал потому что

---нормализация привела бы к увеличению размера физического таблицы.

---вто же время, при сохранении нового файла мы делая вставку знаем все три номера нод куда сохранили копии. при выборке данных - нам всегда нужны все три поля.(дабы если пропадёт связь или сильно замедлиться передача - тутже продолжить тянуть кусочек с другого сервера, это как факт и уже реализовано)
другими словами, имея дело с чанком, нам всегда нужны все три ссылки на ноды.

одна из задач - получить все файлы которые должны быть на данной ноде.

при нормализованой структуре(nodes, chunk_2_nodes, chunks запрос был бы

(LET @idnode=5)

Код: sql

1.
2.
3.
4.

select ... 
from chunk_2_nodes join chunks on (chunks.idchunk = chunk_2_nodes.fk_idchunk)

where chunk_2_nodes.fk_idnode=@idnode

при денормализованой

Код: sql

1.
2.
3.
4.
5.
6.
7.

select ...
from chunks

where c
hunks.fk_idnode1 = @idnode OR 
chunks.fk_idnode2 = @idnode OR 
chunks.fk_idnode3 = @idnode

ну и я пощитал что никчему постоянно делать джоин лишний при выборке.
лучше я при даной(менее частой задаче) буду делать юнион индекс(вывод на основании плана выполнения запроса)

ЗАДАЧА.
стоит задача - 100%надёжно удалить файл из системы
-удалить из базы
-стереть всю с шдд на всех нодах.

ТЕКУЩЕЕ РЕШЕНИЕ. из базы удаляем данные по файлам, по чанкам каскадно.
периодически каждая нода сравнивает снимок базы с сканом файловой системы, и ищет различия.
файл есть на шдд - нету в базе = мусор=делете
файла нет на шдд - есть в базе = потеря = востановить.

но понимаете в чом дело.
при большом обёме, (200 млн файлов - чанков 2 млрд=файлов на шдд) делать часто снимки файловой системы и базы, сравнивать - дело будет накладное мне кажеться (для базы прежде всего)

с другой стороны , хочеться добиться надёжности этого процеса.
ведь в теории, пока даных нету в базе, но ещо не удалили с шдд, может появиться новый файл, который появиться после создания снимка базы, но до реальных удалений с шдд, с именем - совпадающим с удалёным. тоесть процес поиск муссора, найдет эти файлы на шдд как мусор, но реально это уже куски нового файла, и уже не мусор.

у меня идея одна, но мне кажеться это глупо.

1)при удалении файлов мы их маркируем лишь на удаление.
2)каждая нода получает список файлов из базы, помеченых на удаление(файл + номер кусочка файла) - удаляет у себя на шдд, и в базе ставит вкачестве ссылки на ноду размещения нулл.

и так каждая нода повытерав киски на себе файлов предназначеных на удаление, вкачесве ссылки на ноду хранения ставит нулл.

3) все чанки для которых fk_idnode1 is null AND fk_idnode2 is null and fk_idnode3 is null - удалить.

4)все файлы , для которых нету чанков удалить.

это исключает появление новых файлов с именами совпадающими со старыми, и гарантирует безошибочность данного процеса. Но это ёмкий процесс. или я зря смущаюсь?!

Прошу помочь советом, как вообще люди организуют в подобных случаях синхроные удаления.

ЗЫ
при вставке тоже проблема синхронности - данные в базе появляються сразу, а физически кусочки файла раскидывають на сервера попоже, но решаеться сейчас тем, что сборщик муссора для анализа на шдд и в базе берёт только файлы созданные болле трёх часов назад.
файлы на шдд, всегда принудительно получают время модификации такоеже как и в базе в таблице файлы.

хотя конечно хотелось бы и это разрулить болле мудро.

вцелом задача такая, как добиться синхронности метаданных в базе, с реальностью на шдд.

...

Рейтинг:

0 / 0

13.01.2014, 18:55

| Ответить | Цитировать | Написать

синхронизация базы с другим харнилищем(файловая система)

#38524939

alex564657498765453

Участник

Сообщения: 1 942

Рейтинг: 0 / 0

alex564657498765453,

выше допущена ошибка, нащот появления нового файла с такимже именем - это уже решено.

а задача 100% надёжного способа стирания данных по другому, изза

1 - не делать полные сканы хранищ постоянно , хочеться более точечно работать по удалению муссора

2 - в процесе получения снимков и сравнении, как практика показала, возможна ошибка - используеться куча юниксовых утилит, и вот нечаянно поудаляли лишние файлы.

поэтому и хочеться пойти по пути.
файлы не удалять а потом фулсканы и сравнения.
а помечать, и потом удалять "синхронно"

...

Рейтинг:

0 / 0

13.01.2014, 19:03

| Ответить | Цитировать | Написать

синхронизация базы с другим харнилищем(файловая система)

#38525223

_мод

Гость

alex564657498765453вцелом задача такая, как добиться синхронности метаданных в базе, с реальностью на шдд.
Можно хранить файлы в БД

...

Рейтинг:

0 / 0

14.01.2014, 09:41

| Ответить | Цитировать | Написать

3 сообщений из 3, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=33&msg=38525223&tid=1547627]:	0ms
get settings:	8ms
get forum list:	19ms
check forum access:	4ms
check topic access:	4ms
track hit:	67ms
get topic data:	12ms
get forum data:	3ms
get page messages:	47ms
get tp. blocked users:	1ms
others:	251ms

total:	416ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы