Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
Есть ли какой-либо более менее широко признанный формат хранения словарных списков - достаточно компактный и достаточно эффективный? То есть - как решается задача использования и хранения функциональной связи (туда и обратно!) между рядом натуральных чисел и алфавитно упорядоченным набором ... ммм ... лексических единиц? Типа того, что можно изобразить таблицей: id Word 1 аа 2 ААА 3 ааааа 4 Аал 5 АБ 6 Аба 7 Абабково 8 Абабурово 9 Абага 10 Абагайтуй 11 Абагур 12 Абагурской 13 Абагурт 14 Абадзехская 15 Абаевский 16 абажур 17 абажура 18 абажурам 19 абажурами 20 абажурах 21 абажуре 22 абажуров 23 абажуром 24 абажуру ... ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 15:50 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
Все зависит от того какие обьемы данных ты будешь держать в словаре (стоит-ли расчитывать на использование оперативной памяти) и какие требования к времени доступа к элементу словаря (от этого будет зависеть выбор структуры данных (хеш-таблица, слоистые списки, пирамида, Б-дерево и.т.д) ). Еще важно определится с целевой технологией. В наше время писать код с нуля уже не считается "рулезом". Рациональнее было-бы поискать подходящую СУБД. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 16:16 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
maytonВсе зависит от того какие обьемы данных ты будешь держать в словаре (стоит-ли расчитывать на использование оперативной памяти) - разве не видно (по приведенному образцу), что до "я" там очччень далеко? А вот - поместится ли эта байда в оперативной памяти - вопрос хороший! Зависит ведь еще и от ЭФФЕКТИВНОСТИ примененного функционала! mayton... и какие требования к времени доступа к элементу словаря ...- понятно какие: как можно быстрее, и лучше - даром! ;-) mayton...(от этого будет зависеть выбор структуры данных (хеш-таблица, слоистые списки, пирамида, Б-дерево и.т.д)- хеш-таблица, вроде, не катит, если я хочу, чтобы номера шли "поряд"??? maytonРациональнее было-бы поискать подходящую СУБД.- "поискать подходящую" - дык, я потому и спрашиваю! А "поискать подходящую СУБД" - нет, это уже понятно, это, кажется мне - лишь оценка эффективности решения СНИЗУ: посмотрите, ведь идущие подряд слова очень мало друг от друга отличаются ... а СУБД-технология, ИМХО, не сможет этим "воспользоваться" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 16:31 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
Добавление к последнему абзацу : сопсно, я и хочу чтобы номера шли "подряд" (в лексически упорядоченном списке "слов"), чтобы можно было ВОСПОЛЬЗОВАТЬСЯ указанным обстоятельством! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 16:33 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
Иван FXS Добавление к последнему абзацу : сопсно, я и хочу чтобы номера шли "подряд" (в лексически упорядоченном списке "слов"), чтобы можно было ВОСПОЛЬЗОВАТЬСЯ указанным обстоятельством! Для реализации подобных вещей в СУБД есть индексы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 16:40 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
tru55, скажу Вам по секрету: я знаю, что в СУБД есть индексы . Только я почему-то уверен, что - для решения ДАННОЙ КОНКРЕТНОЙ задачи - таблица-с-индексом это не лучшее решение, а только - оценка СНИЗУ (сорри за повтор) ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 16:56 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
Иван разве не видно (по приведенному образцу), что до "я" там очччень далеко? Ммм... нет. Абсолютно не видно! Иван А вот - поместится ли эта байда в оперативной памяти - вопрос хороший! Словарь Ожегова ИМХО в 128 МБ поместится запросто. Иван понятно какие: как можно быстрее, и лучше - даром! ;-) Хм... Иван хеш-таблица, вроде, не катит, если я хочу, чтобы номера шли "поряд"??? Тогда подойдет Б-дерево! Иван А "поискать подходящую СУБД" - нет, это уже понятно, это, кажется мне - лишь оценка эффективности решения СНИЗУ: посмотрите, ведь идущие подряд слова очень мало друг от друга отличаются ... а СУБД-технология, ИМХО, не сможет этим "воспользоваться" Ну уж если мы взяли тяжелую артиллерию.. То можно попробовать СУБД Oracle (ты не дрожишь от страха?). 1) Создать индексно-организованную таблицу с ключем из лексической единицы. 2) Для экономии места сжать таблицу (это предусмотрено в Oracle) Кстати... вопрос. Все-таки интересно узнать на каком языке программирования ты собираешся это делать? Может там уже есть готовые библиотеки для структур данных (прим. если C++ то STL, если Java - то Collections). Это сильно-бы облегчило наше взаимодействие. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 16:59 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
maytonВсе-таки интересно узнать на каком языке программирования ты собираешся это делать? Может там уже есть готовые библиотеки для структур данных (прим. если C++ то STL, если Java - то Collections). Это сильно-бы облегчило наше взаимодействие. - потупя взор, смущенно ковыряя пол носком ботинка: я вааще-то на MS Acces лабаю ... Так что можно: "тяжелую артиллерию... СУБД Oracle" ... того ... не надо, а? Я сопсно и спросил - про ФОРМАТЫ (то бишь - алгоритмы), а не про ГОТОВЫЕ РЕШЕНИЯ ... mayton Иван разве не видно (по приведенному образцу), что до "я" там очччень далеко? Ммм... нет. Абсолютно не видно!- ок, говорю открытым текстом: там уже за 1 300 000 строк ... maytonТогда подойдет Б-дерево! - возможно ... в качестве ЭКСПЕРНОЙ рекомендации - готов принять! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 17:19 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
Иван на MS Acces лабаю ... То есть на встронном VBasic? Я почему спрашиваю.... Большинство алгоритмов имеют "процедурную" природу то есть если ты решишь их реализовывать то потребуется язык подходящий для этой цели. Иван Так что можно: "тяжелую артиллерию... СУБД Oracle" ... того ... не надо, а? Ну.. не надо так не надо Иван там уже за 1 300 000 строк ... Каким образом они туда попадают? Операторы набивают? Иван в качестве ЭКСПЕРНОЙ рекомендации - готов принять! Достаточно будет принять то что говорят Кнут, Дейкстра, Вирт и прочие столпы программирования. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 17:40 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
maytonТо есть на встронном VBasic? Я ... Большинство алгоритмов имеют "процедурную" природу ... потребуется язык подходящий для этой цели.- дык, VB он и есть - процедурный. mayton Ивантам уже за 1 300 000 строк ... Каким образом они туда попадают? Операторы набивают? - нет, конечно ... в смысле - не только не "набивают", но и - не "Операторы". Сначала - из многоразных словарей, а потом - из парсинга реальных текстов. Была такая тема: Индекс , он же - хранилище (строк) ; сейчас - продолжение тойже ПРИМЕРНО оперы ... Нюансы, правда, поменялись ... думаю - в лучшую сторону. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2004, 17:53 |
|
||
|
Q: общепризнаный стандарт хранения словарей?
|
|||
|---|---|---|---|
|
#18+
ИванFXS дык, VB он и есть - процедурный ИМХО VB не очень подходит для реализации алгоритмов и структур данных. Я не говорю что на нем сделать что-то невозмножно. Нет. Возможно. Но затратится на это больше усилий чем при программировании того-же Б-Дерева на С++(CBuilder) или Pascal(Delphi). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.12.2004, 10:17 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=32835618&tid=1348008]: |
0ms |
get settings: |
11ms |
get forum list: |
17ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
79ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
64ms |
get tp. blocked users: |
2ms |
| others: | 269ms |
| total: | 466ms |

| 0 / 0 |
