powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / быстрый индекс большого объема данных
4 сообщений из 4, страница 1 из 1
быстрый индекс большого объема данных
    #33781796
dakdark
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Есть задача:
Написать быстрый индекс большого куска данных(1-40 mb). Данные- любой файл на вашем жёстком диске. Индекс должен позволять быстро проверить наличие подфрагмента, т.е задача поиска подстроки.Но требования:
1. Требования к памяти (6-10)n (короче,дерево не рулит)
2. Динамическое создание по мере прохождения файла (вперёд не смотрим)
3. Возможность на каждом шаге найти все одинаковые строки длинной L
4. Возможность реализации скользящего окна по блоку (т.е индексируем последнии 10 mb)

Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.

P.s если что не понятно, спрашивайте, прокоментирую
...
Рейтинг: 0 / 0
быстрый индекс большого объема данных
    #33782038
neskif
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dakdarkЕсть задача:
Написать быстрый индекс большого куска данных(1-40 mb). Данные- любой файл на вашем жёстком диске. Индекс должен позволять быстро проверить наличие подфрагмента, т.е задача поиска подстроки.Но требования:
1. Требования к памяти (6-10)n (короче,дерево не рулит)
2. Динамическое создание по мере прохождения файла (вперёд не смотрим)
3. Возможность на каждом шаге найти все одинаковые строки длинной L
4. Возможность реализации скользящего окна по блоку (т.е индексируем последнии 10 mb)

Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.

P.s если что не понятно, спрашивайте, прокоментирую
Как платить будешь ?
...
Рейтинг: 0 / 0
быстрый индекс большого объема данных
    #33782073
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
dakdark
Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.


Не поверишь! Я-бы в жизни не догадался!

Вообще, такие вопросы лучше задавать на http://forum.compression.ru:8080/
...
Рейтинг: 0 / 0
быстрый индекс большого объема данных
    #33782303
dakdark
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mayton dakdark
Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3.


Не поверишь! Я-бы в жизни не догадался!

Вообще, такие вопросы лучше задавать на http://forum.compression.ru:8080/

Не поверишь! Туда зайти я бы не догадался.
Только,вот, обсуждается реализация алгоритма, а точнее структур данных, обеспечивающих данные характеристики. Интересен сам вопрос решения данной задачи. Так кто-нибудь может что-то предложить. Ну там список с промежуточными ссылками, patrical tree, binary tree, heap search, dynamic binary array.... А полем структурка типа
Код: plaintext
1.
2.
3.
struct Cell{
  char* str; // ссылка на слово в обрабатываемом массиве
  char line;  // линии уровня схожести
};

Если использовать DBA(dynamic binary array), то скорость выполнения всего перечисленного где-то 500-1000 Kb/s.

Но хотелось услышать какие-то предложения :)
...
Рейтинг: 0 / 0
4 сообщений из 4, страница 1 из 1
Форумы / C++ [игнор отключен] [закрыт для гостей] / быстрый индекс большого объема данных
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]