|
|
|
быстрый индекс большого объема данных
|
|||
|---|---|---|---|
|
#18+
Есть задача: Написать быстрый индекс большого куска данных(1-40 mb). Данные- любой файл на вашем жёстком диске. Индекс должен позволять быстро проверить наличие подфрагмента, т.е задача поиска подстроки.Но требования: 1. Требования к памяти (6-10)n (короче,дерево не рулит) 2. Динамическое создание по мере прохождения файла (вперёд не смотрим) 3. Возможность на каждом шаге найти все одинаковые строки длинной L 4. Возможность реализации скользящего окна по блоку (т.е индексируем последнии 10 mb) Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3. P.s если что не понятно, спрашивайте, прокоментирую ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2006, 19:08 |
|
||
|
быстрый индекс большого объема данных
|
|||
|---|---|---|---|
|
#18+
dakdarkЕсть задача: Написать быстрый индекс большого куска данных(1-40 mb). Данные- любой файл на вашем жёстком диске. Индекс должен позволять быстро проверить наличие подфрагмента, т.е задача поиска подстроки.Но требования: 1. Требования к памяти (6-10)n (короче,дерево не рулит) 2. Динамическое создание по мере прохождения файла (вперёд не смотрим) 3. Возможность на каждом шаге найти все одинаковые строки длинной L 4. Возможность реализации скользящего окна по блоку (т.е индексируем последнии 10 mb) Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3. P.s если что не понятно, спрашивайте, прокоментирую Как платить будешь ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2006, 22:56 |
|
||
|
быстрый индекс большого объема данных
|
|||
|---|---|---|---|
|
#18+
dakdark Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3. Не поверишь! Я-бы в жизни не догадался! Вообще, такие вопросы лучше задавать на http://forum.compression.ru:8080/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.06.2006, 23:23 |
|
||
|
быстрый индекс большого объема данных
|
|||
|---|---|---|---|
|
#18+
mayton dakdark Если кто не догадался, речь идёт об реализации словаря для LZ77, типа как в LZMA Игоря Павлова, но с меньшими затратами памяти и возможностью из пункта 3. Не поверишь! Я-бы в жизни не догадался! Вообще, такие вопросы лучше задавать на http://forum.compression.ru:8080/ Не поверишь! Туда зайти я бы не догадался. Только,вот, обсуждается реализация алгоритма, а точнее структур данных, обеспечивающих данные характеристики. Интересен сам вопрос решения данной задачи. Так кто-нибудь может что-то предложить. Ну там список с промежуточными ссылками, patrical tree, binary tree, heap search, dynamic binary array.... А полем структурка типа Код: plaintext 1. 2. 3. Если использовать DBA(dynamic binary array), то скорость выполнения всего перечисленного где-то 500-1000 Kb/s. Но хотелось услышать какие-то предложения :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.06.2006, 08:56 |
|
||
|
|

start [/forum/topic.php?fid=57&msg=33782073&tid=2031058]: |
0ms |
get settings: |
5ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
253ms |
get topic data: |
11ms |
get forum data: |
4ms |
get page messages: |
40ms |
get tp. blocked users: |
2ms |
| others: | 220ms |
| total: | 556ms |

| 0 / 0 |
