Дерево в памяти / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Дерево в памяти

24 сообщений из 24, страница 1 из 1

Дерево в памяти

#39238802

д0k

Гость

Имеем некое небольшое деревцо ( максимум 1024 ключа),
ключи которого могут иметь разную длину могут редактироваться.

Его нужно разместить непрерывном участке памяти длиной 2к,4к, 8к, 16к, таким образом,
что бы узлы были связаны через смещения в этом участке памяти.

подскажите варианты алгоритма и литературу.

зы отвечаю на вопрос :
- зачем ?
- что бы дерево целяком ложилось в кеш процессора.

...

Рейтинг:

0 / 0

19.05.2016, 10:01:08

| Ответить | Цитировать | Написать

Дерево в памяти

#39238804

Akina

Участник

Откуда: Зеленоград, Москва, Россия

Сообщения: 20 644

Рейтинг: 0 / 0

д0kключи которого могут иметь разную длинуОграничения на эту длину имеются?

д0kчто бы узлы были связаны через смещения в этом участке памятиЭту фразу поподробнее...

д0kподскажите варианты алгоритмаМожет, посмотреть в сторону нагруженного дерева?
А вообще рекомендации сильнейшим образом зависят от того, что с этим деревом делают. Вряд ли нужно только хранить, редактировать, и при этом не искать, не сортировать и т.п...

...

Рейтинг:

0 / 0

19.05.2016, 10:10:05

| Ответить | Цитировать | Написать

Дерево в памяти

#39238834

д0k

Гость

Akinaд0kключи которого могут иметь разную длинуОграничения на эту длину имеются?

Минимум 1 байт , максимум 1 К.

Можно держать фиксированную длину но мне жалко кеш процессора....

д0kчто бы узлы были связаны через смещения в этом участке памятиЭту фразу поподробнее...
[/quote]

Указатели на узлы должны храниться как смещение от начала 2к,4к, 8к, 16к блока в котром лежит дерево.

д0kд0kподскажите варианты алгоритмаМожет, посмотреть в сторону нагруженного дерева?
А вообще рекомендации сильнейшим образом зависят от того, что с этим деревом делают. Вряд ли нужно только хранить, редактировать, и при этом не искать, не сортировать и т.п...

Основная задача нужно быстро парсить поток получаемый по сети или из файла.
Побить поток на поля , а потом при необходимости ( попадания в if в зависимосити от данных присутствующих в потоке) некоторые поля
побить на субполя итд ....
Разложить поток в структуры и массивы и собрать их в дерево для последующего быстрого поиска
по значениям полей и поиска похожих сообщений по критерию.

Например , есть пачка ХМL сообщений,
по факту поступления следющего сообщения нужно вреальном режиме времени найти
все ранее пришедшие, в которых некоторые теги равны тегам пришедшего сообщения.
Количество ранее пришедших миллионы и сотни миллионов.
Дерево которое будет индексировать поиск сообщений тема отдельного топика
мне сейчас нужно разложить само сообщение по полям в дерево, что бы потом
это дерево подключать к узлам дерева более высокго уровня( чистому индексу по тегам).
У меня протокол не XML.

...

Рейтинг:

0 / 0

19.05.2016, 10:37:15

| Ответить | Цитировать | Написать

Дерево в памяти

#39238858

д0k

Гость

д0kчто бы узлы были связаны через смещения в этом участке памяти
Akina
Эту фразу поподробнее...

Указатели на узлы должны храниться как смещение от начала 2к,4к, 8к, 16к блока в котром лежит дерево.

[/quot]

Опять же отвечаю на вопрос:
-зачем ?
- что бы блок с деревцом можно было с минимальными затратами выгузить дерево на диск
и считать обратно.

...

Рейтинг:

0 / 0

19.05.2016, 10:52:43

| Ответить | Цитировать | Написать

Дерево в памяти

#39238878

YesSql

Гость

д0kИмеем некое небольшое деревцо ( максимум 1024 ключа),
ключи которого могут иметь разную длину могут редактироваться.

Его нужно разместить непрерывном участке памяти длиной 2к,4к, 8к, 16к, таким образом,
что бы узлы были связаны через смещения в этом участке памяти.

подскажите варианты алгоритма и литературу.

зы отвечаю на вопрос :
- зачем ?
- что бы дерево целяком ложилось в кеш процессора.
В твоем случае деревцо преобразуется в массив смещений отсортированный по ключу.

...

Рейтинг:

0 / 0

19.05.2016, 11:05:58

| Ответить | Цитировать | Написать

Дерево в памяти

#39238889

д0k

Гость

Если кого интересует предметная область,
цифровая обработка сигналов,
разложение потока для последующей обработки преобразованием фурье,
поиска и иследования множественных отраженных сигналов в спектральной характиристике.

Главная глобальная задача всей этой затеи -
фильтрация множественно отраженных сигналов в потоке.

...

Рейтинг:

0 / 0

19.05.2016, 11:14:06

| Ответить | Цитировать | Написать

Дерево в памяти

#39238902

д0k

Гость

YesSqlд0kИмеем некое небольшое деревцо ( максимум 1024 ключа),
ключи которого могут иметь разную длину могут редактироваться.

Его нужно разместить непрерывном участке памяти длиной 2к,4к, 8к, 16к, таким образом,
что бы узлы были связаны через смещения в этом участке памяти.

подскажите варианты алгоритма и литературу.

зы отвечаю на вопрос :
- зачем ?
- что бы дерево целяком ложилось в кеш процессора.
В твоем случае деревцо преобразуется в массив смещений отсортированный по ключу.

мне нужно не массив а дерево .

Но идею я понял , с определенной позиции
массив должен становиться 2 мерным , потом 3-мерным и
возвращаясь обратно в одномерный , к концу массива.
То есть нужны некие метаданные для алгоритма,
что бы он участок одномерного массива начал воспринимать
как многомерный массив.

...

Рейтинг:

0 / 0

19.05.2016, 11:21:46

| Ответить | Цитировать | Написать

Дерево в памяти

#39238915

YesSql

Гость

д0kYesSqlпропущено...

В твоем случае деревцо преобразуется в массив смещений отсортированный по ключу.

мне нужно не массив а дерево .

Но идею я понял , с определенной позиции
массив должен становиться 2 мерным , потом 3-мерным и
возвращаясь обратно в одномерный , к концу массива.
То есть нужны некие метаданные для алгоритма,
что бы он участок одномерного массива начал воспринимать
как многомерный массив.
Нет. ты не понял.

...

Рейтинг:

0 / 0

19.05.2016, 11:29:53

| Ответить | Цитировать | Написать

Дерево в памяти

#39238918

д0k

Гость

YesSqlд0kпропущено...

мне нужно не массив а дерево .

Но идею я понял , с определенной позиции
массив должен становиться 2 мерным , потом 3-мерным и
возвращаясь обратно в одномерный , к концу массива.
То есть нужны некие метаданные для алгоритма,
что бы он участок одномерного массива начал воспринимать
как многомерный массив.
Нет. ты не понял.

расшифруй.

...

Рейтинг:

0 / 0

19.05.2016, 11:32:39

| Ответить | Цитировать | Написать

Дерево в памяти

#39238938

Leonid Kudryavtsev

Участник

Сообщения: 9 300

Рейтинг: 0 / 0

1. Обычное B-Tree. Или я что-то не понимаю.
https://ru.wikipedia.org/wiki/B-дерево

2. Если все в памяти и кол-во элементов не большое - не очень понятно, нафига дерево. Возьмите например HashTable
"максимум 1024 ключа", "2к,4к, 8к, 16к"

по факту поступления следющего сообщения нужно вреальном режиме времени найти
все ранее пришедшие, в которых некоторые теги равны тегам пришедшего сообщения.
Количество ранее пришедших миллионы и сотни миллионов.
Дерево которое будет индексировать поиск сообщений тема отдельного топика
мне сейчас нужно разложить само сообщение по полям в дерево, что бы потом
это дерево подключать к узлам дерева более высокго уровня( чистому индексу по тегам).

Если действительно важна скорость и компактность, я бы на начальном этапе использовал что-то типа HashTable, когда все данные получены, потом бы эти данные упаковывал в что-то более компактное, например SortedArray и искал двоичным поиском.

...

Рейтинг:

0 / 0

19.05.2016, 11:44:33

| Ответить | Цитировать | Написать

Дерево в памяти

#39238942

YesSql

Гость

д0kYesSqlпропущено...

Нет. ты не понял.

расшифруй.
Вернемся к твоему первому посту. Если ты хочешь разместить все в одном участке памяти то к твоему блоку данных добавляется массив смешений на твои структуры в этом блоке данных. Затем этот массив сортируется по ключам твоих структур. И вуаля доступ к твоим структурам через этот массив O(log N) - такой же как и у дерева, и все лежит в одном участке памяти.

...

Рейтинг:

0 / 0

19.05.2016, 11:49:00

| Ответить | Цитировать | Написать

Дерево в памяти

#39238948

д0k

Гость

Leonid Kudryavtsev1. Обычное B-Tree. Или я что-то не понимаю.
https://ru.wikipedia.org/wiki/B-дерево

2. Если все в памяти и кол-во элементов не большое - не очень понятно, нафига дерево. Возьмите например HashTable
"максимум 1024 ключа", "2к,4к, 8к, 16к"

по факту поступления следющего сообщения нужно вреальном режиме времени найти
все ранее пришедшие, в которых некоторые теги равны тегам пришедшего сообщения.
Количество ранее пришедших миллионы и сотни миллионов.
Дерево которое будет индексировать поиск сообщений тема отдельного топика
мне сейчас нужно разложить само сообщение по полям в дерево, что бы потом
это дерево подключать к узлам дерева более высокго уровня( чистому индексу по тегам).

Если действительно важна скорость и компактность, я бы на начальном этапе использовал что-то типа HashTable, когда все данные получены, потом бы эти данные упаковывал в что-то более компактное, например SortedArray и искал двоичным поиском.

Как многопроходный алгоритм - да, этот вариант можно рассматривать.
Но мне нужен одно проходный с заглядываеным в хвост
большого буфера для поиска тегов.

Но давайте, всетаки не будем забегать наперед и сконецентрируемся на алгоритмах
создания дерева в блоке памяти , так как это сабжевый вопрос топика.

...

Рейтинг:

0 / 0

19.05.2016, 11:52:33

| Ответить | Цитировать | Написать

Дерево в памяти

#39238967

д0k

Гость

YesSqlд0kпропущено...

расшифруй.
Вернемся к твоему первому посту. Если ты хочешь разместить все в одном участке памяти то к твоему блоку данных добавляется массив смешений на твои структуры в этом блоке данных. Затем этот массив сортируется по ключам твоих структур. И вуаля доступ к твоим структурам через этот массив O(log N) - такой же как и у дерева, и все лежит в одном участке памяти.

Если естественный ключ , то да.
а если нужно сурагантый?
когда поля нужно классифицировать тегами ?

Для каждого тега заводить свой массив?

зы Спасибо за идеи , я пока возьму таймаут на подумать
и более глубоко посмотреть в предметную область задачи.

...

Рейтинг:

0 / 0

19.05.2016, 12:15:37

| Ответить | Цитировать | Написать

Дерево в памяти

#39238975

YesSql

Гость

[quot д0k]YesSqlпропущено...

Если естественный ключ , то да.
а если нужно сурагантый?
когда поля нужно классифицировать тегами ?

Для каждого тега заводить свой массив?

зы Спасибо за идеи , я пока возьму таймаут на подумать
и более глубоко посмотреть в предметную область задачи.
Ты сам себе противоречишь. Ранее ты говорил что нужно делать лукап в другом буфере, а теперь ты говоришь что у тебя ключи суррогатные......
Таймаут на подумать - хорошая идея.

...

Рейтинг:

0 / 0

19.05.2016, 12:22:46

| Ответить | Цитировать | Написать

Дерево в памяти

#39238997

д0k

Гость

[quot YesSql]д0kпропущено...

Ты сам себе противоречишь. Ранее ты говорил что нужно делать лукап в другом буфере, а теперь ты говоришь что у тебя ключи суррогатные......
Таймаут на подумать - хорошая идея.

нет , не противоречу 19192303 ....
д0kРазложить поток в структуры и массивы и собрать их в дерево для последующего быстрого поиска
по значениям полей и поиска похожих сообщений по критерию.

Критерий похожести и тегирование будет задаваться в формуле преобразования фурье.
Искомый сигнал может быть смещен по спектру и учитывать или не учитывать грамоники ,
его числовое выражение в потоке данных в большенстве случаев поиска будет разным.

...

Рейтинг:

0 / 0

19.05.2016, 12:42:52

| Ответить | Цитировать | Написать

Дерево в памяти

#39239048

schi

Участник

Откуда: Москва

Сообщения: 2 274

Рейтинг: 0 / 0

д0k- что бы дерево целяком ложилось в кеш процессора.

А зачем ? У вас уникальная операционная система, которая гарантирует выделение процессора исключительно вашей задаче на протяжении ее выполнения ?

...

Рейтинг:

0 / 0

19.05.2016, 13:15:31

| Ответить | Цитировать | Написать

Дерево в памяти

#39239057

д0k

Гость

schiд0k- что бы дерево целяком ложилось в кеш процессора.

А зачем ? У вас уникальная операционная система, которая гарантирует выделение процессора исключительно вашей задаче на протяжении ее выполнения ?

Операционная система - обычная

...

Рейтинг:

0 / 0

19.05.2016, 13:20:40

| Ответить | Цитировать | Написать

Дерево в памяти

#39239083

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

преждевременной оптимизацией пахнет...

...

Рейтинг:

0 / 0

19.05.2016, 13:41:55

| Ответить | Цитировать | Написать

Дерево в памяти

#39239342

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

д0kНапример , есть пачка ХМL сообщений,
по факту поступления следющего сообщения нужно вреальном режиме времени найти
все ранее пришедшие, в которых некоторые теги равны тегам пришедшего сообщения.
Количество ранее пришедших миллионы и сотни миллионов.
Дерево которое будет индексировать поиск сообщений тема отдельного топика
мне сейчас нужно разложить само сообщение по полям в дерево, что бы потом
это дерево подключать к узлам дерева более высокго уровня( чистому индексу по тегам).
У меня протокол не XML.
Док. Мне кажется тут нужна Марковская сеть. И промоделировать первый раз
твой трафик на ней. А потом на основании данных по узлам и переходам сделать
твоё чудесное дерево.

...

Рейтинг:

0 / 0

19.05.2016, 16:36:58

| Ответить | Цитировать | Написать

Дерево в памяти

#39239414

softwarer

Участник

Откуда: 127.0.0.1

Сообщения: 51 965

Рейтинг: 0 / 0

д0kподскажите варианты алгоритма и литературу.
1. Разбить данные узла на часть постоянного размера (родитель, дети итп) и переменного (ключ)
2. Части постоянного размера укладывать с начала выделенного блока, идентифицируя индексом
3. Части переменного размера укладывать с конца выделенного блока
4. Вести список свободных областей, соответственно его корректируя

...

Рейтинг:

0 / 0

19.05.2016, 17:29:08

| Ответить | Цитировать | Написать

Дерево в памяти

#39239744

д0k

Гость

Изопропилпреждевременной оптимизацией пахнет...

Еще нет никакой оптимизации, это проектные исследования,
в процессе написания ТЗ.
Попытка нарисовать пазлы, которые потом будут складиваться
в готовое решение, точных формул в точном виде тоже еще нет.
Пока есть только конечная цель, понимание общий принципов ее достижения
и попытка оценить требуемые инвестиции.

...

Рейтинг:

0 / 0

20.05.2016, 09:58:59

| Ответить | Цитировать | Написать

Дерево в памяти

#39239748

д0k

Гость

maytonд0kНапример , есть пачка ХМL сообщений,
по факту поступления следющего сообщения нужно вреальном режиме времени найти
все ранее пришедшие, в которых некоторые теги равны тегам пришедшего сообщения.
Количество ранее пришедших миллионы и сотни миллионов.
Дерево которое будет индексировать поиск сообщений тема отдельного топика
мне сейчас нужно разложить само сообщение по полям в дерево, что бы потом
это дерево подключать к узлам дерева более высокго уровня( чистому индексу по тегам).
У меня протокол не XML.
Док. Мне кажется тут нужна Марковская сеть. И промоделировать первый раз
твой трафик на ней. А потом на основании данных по узлам и переходам сделать
твоё чудесное дерево.

Спасибо , полезная инфа.

...

Рейтинг:

0 / 0

20.05.2016, 10:00:51

| Ответить | Цитировать | Написать

Дерево в памяти

#39239761

д0k

Гость

softwarerд0kподскажите варианты алгоритма и литературу.
1. Разбить данные узла на часть постоянного размера (родитель, дети итп) и переменного (ключ)
2. Части постоянного размера укладывать с начала выделенного блока, идентифицируя индексом
3. Части переменного размера укладывать с конца выделенного блока
4. Вести список свободных областей, соответственно его корректируя

Блоки данных в СУБД informix по похожему принципу организованы.

1. заголовок с метаданными ( п4)
2. строки( row) таблицы ( п2) .
3. массив смещений начала строк внутри блока,
который растет навстречу строкам ( п3).

Индекс массива есть последний байт(ы) rowid,
что позволяет играться перемещением строк в рамках блока
без изменения метаданных за его пределами.

Я похожий принцип хочу заложить в организацию хранения по сабжу.

Но мне вместо массива нужно дерево , которое должно описывать
не телько сортировку, а и иерархию зависимостей родитель-дети.

...

Рейтинг:

0 / 0

20.05.2016, 10:15:45

| Ответить | Цитировать | Написать

Дерево в памяти

#39240036

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

20.05.2016, 13:55:11

| Ответить | Цитировать | Написать

24 сообщений из 24, страница 1 из 1

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Дерево в памяти

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&fpage=29&tid=1340713]:	0ms
get settings:	9ms
get forum list:	20ms
check forum access:	4ms
check topic access:	4ms
track hit:	55ms
get topic data:	11ms
get forum data:	4ms
get page messages:	76ms
get tp. blocked users:	2ms
others:	249ms

total:	434ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы