быстрый индекс большого объема данных / C++

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / C++ [игнор отключен] [закрыт для гостей] / быстрый индекс большого объема данных

4 сообщений из 4, страница 1 из 1

быстрый индекс большого объема данных

#33781796

dakdark

Гость

Есть задача:
Написать быстрый индекс большого куска данных(1-40 mb). Данные- любой файл на вашем жёстком диске. Индекс должен позволять быстро проверить наличие подфрагмента, т.е задача поиска подстроки.Но требования:
1. Требования к памяти (6-10)n (короче,дерево не рулит)
2. Динамическое создание по мере прохождения файла (вперёд не смотрим)
3. Возможность на каждом шаге найти все одинаковые строки длинной L
4. Возможность реализации скользящего окна по блоку (т.е индексируем последнии 10 mb)

Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.

P.s если что не понятно, спрашивайте, прокоментирую

...

Рейтинг:

0 / 0

08.06.2006, 19:08:33

| Ответить | Цитировать | Написать

быстрый индекс большого объема данных

#33782038

neskif

Участник

Сообщения: 2 686

Рейтинг: 0 / 0

dakdarkЕсть задача:
Написать быстрый индекс большого куска данных(1-40 mb). Данные- любой файл на вашем жёстком диске. Индекс должен позволять быстро проверить наличие подфрагмента, т.е задача поиска подстроки.Но требования:
1. Требования к памяти (6-10)n (короче,дерево не рулит)
2. Динамическое создание по мере прохождения файла (вперёд не смотрим)
3. Возможность на каждом шаге найти все одинаковые строки длинной L
4. Возможность реализации скользящего окна по блоку (т.е индексируем последнии 10 mb)

Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.

P.s если что не понятно, спрашивайте, прокоментирую
Как платить будешь ?

...

Рейтинг:

0 / 0

08.06.2006, 22:56:59

| Ответить | Цитировать | Написать

быстрый индекс большого объема данных

#33782073

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

dakdark
Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.

Не поверишь! Я-бы в жизни не догадался!

Вообще, такие вопросы лучше задавать на http://forum.compression.ru:8080/

...

Рейтинг:

0 / 0

08.06.2006, 23:23:45

| Ответить | Цитировать | Написать

быстрый индекс большого объема данных

#33782303

dakdark

Гость

mayton dakdark
Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.

Не поверишь! Я-бы в жизни не догадался!

Вообще, такие вопросы лучше задавать на http://forum.compression.ru:8080/

Не поверишь! Туда зайти я бы не догадался.
Только,вот, обсуждается реализация алгоритма, а точнее структур данных, обеспечивающих данные характеристики. Интересен сам вопрос решения данной задачи. Так кто-нибудь может что-то предложить. Ну там список с промежуточными ссылками, patrical tree, binary tree, heap search, dynamic binary array.... А полем структурка типа

Код: plaintext

1.
2.
3.

struct Cell{
  char* str; // ссылка на слово в обрабатываемом массиве
  char line;  // линии уровня схожести
};

Если использовать DBA(dynamic binary array), то скорость выполнения всего перечисленного где-то 500-1000 Kb/s.

Но хотелось услышать какие-то предложения :)

...

Рейтинг:

0 / 0

09.06.2006, 08:56:23

| Ответить | Цитировать | Написать

4 сообщений из 4, страница 1 из 1

Форумы / C++ [игнор отключен] [закрыт для гостей] / быстрый индекс большого объема данных

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=57&msg=33782073&tid=2031058]:	0ms
get settings:	9ms
get forum list:	19ms
check forum access:	5ms
check topic access:	5ms
track hit:	66ms
get topic data:	13ms
get forum data:	4ms
get page messages:	50ms
get tp. blocked users:	2ms
others:	236ms

total:	409ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы