powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Q: общепризнаный стандарт хранения словарей?
11 сообщений из 11, страница 1 из 1
Q: общепризнаный стандарт хранения словарей?
    #32835227
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть ли какой-либо более менее широко признанный формат хранения словарных списков - достаточно компактный и достаточно эффективный?

То есть - как решается задача использования и хранения функциональной связи (туда и обратно!) между рядом натуральных чисел и алфавитно упорядоченным набором ... ммм ... лексических единиц?

Типа того, что можно изобразить таблицей:
id Word
1 аа
2 ААА
3 ааааа
4 Аал
5 АБ
6 Аба
7 Абабково
8 Абабурово
9 Абага
10 Абагайтуй
11 Абагур
12 Абагурской
13 Абагурт
14 Абадзехская
15 Абаевский
16 абажур
17 абажура
18 абажурам
19 абажурами
20 абажурах
21 абажуре
22 абажуров
23 абажуром
24 абажуру
... ...
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835306
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Все зависит от того какие обьемы данных ты будешь держать в словаре (стоит-ли расчитывать на использование оперативной памяти) и какие требования к времени доступа к элементу словаря (от этого будет зависеть выбор структуры данных (хеш-таблица, слоистые списки, пирамида, Б-дерево и.т.д) ).

Еще важно определится с целевой технологией. В наше время писать код с нуля уже не считается "рулезом". Рациональнее было-бы поискать подходящую СУБД.
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835357
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
maytonВсе зависит от того какие обьемы данных ты будешь держать в словаре (стоит-ли расчитывать на использование оперативной памяти) - разве не видно (по приведенному образцу), что до "я" там очччень далеко?
А вот - поместится ли эта байда в оперативной памяти - вопрос хороший!
Зависит ведь еще и от ЭФФЕКТИВНОСТИ примененного функционала!

mayton... и какие требования к времени доступа к элементу словаря ...- понятно какие: как можно быстрее, и лучше - даром! ;-)

mayton...(от этого будет зависеть выбор структуры данных (хеш-таблица, слоистые списки, пирамида, Б-дерево и.т.д)- хеш-таблица, вроде, не катит, если я хочу, чтобы номера шли "поряд"???

maytonРациональнее было-бы поискать подходящую СУБД.- "поискать подходящую" - дык, я потому и спрашиваю!
А "поискать подходящую СУБД" - нет, это уже понятно, это, кажется мне - лишь оценка эффективности решения СНИЗУ: посмотрите, ведь идущие подряд слова очень мало друг от друга отличаются ... а СУБД-технология, ИМХО, не сможет этим "воспользоваться"
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835364
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добавление к последнему абзацу : сопсно, я и хочу чтобы номера шли "подряд" (в лексически упорядоченном списке "слов"), чтобы можно было ВОСПОЛЬЗОВАТЬСЯ указанным обстоятельством!
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835385
tru55
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXS Добавление к последнему абзацу : сопсно, я и хочу чтобы номера шли "подряд" (в лексически упорядоченном списке "слов"), чтобы можно было ВОСПОЛЬЗОВАТЬСЯ указанным обстоятельством!


Для реализации подобных вещей в СУБД есть индексы
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835444
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
tru55, скажу Вам по секрету: я знаю, что в СУБД есть индексы .

Только я почему-то уверен, что - для решения ДАННОЙ КОНКРЕТНОЙ задачи - таблица-с-индексом это не лучшее решение, а только - оценка СНИЗУ (сорри за повтор) ...
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835453
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван
разве не видно (по приведенному образцу), что до "я" там очччень далеко?

Ммм... нет. Абсолютно не видно!
Иван
А вот - поместится ли эта байда в оперативной памяти - вопрос хороший!

Словарь Ожегова ИМХО в 128 МБ поместится запросто.
Иван
понятно какие: как можно быстрее, и лучше - даром! ;-)

Хм...
Иван
хеш-таблица, вроде, не катит, если я хочу, чтобы номера шли "поряд"???

Тогда подойдет Б-дерево!
Иван
А "поискать подходящую СУБД" - нет, это уже понятно, это, кажется мне - лишь оценка эффективности решения СНИЗУ: посмотрите, ведь идущие подряд слова очень мало друг от друга отличаются ... а СУБД-технология, ИМХО, не сможет этим "воспользоваться"

Ну уж если мы взяли тяжелую артиллерию.. То можно попробовать СУБД Oracle (ты не дрожишь от страха?).
1) Создать индексно-организованную таблицу с ключем из лексической единицы.
2) Для экономии места сжать таблицу (это предусмотрено в Oracle)

Кстати... вопрос. Все-таки интересно узнать на каком языке программирования ты собираешся это делать? Может там уже есть готовые библиотеки для структур данных (прим. если C++ то STL, если Java - то Collections). Это сильно-бы облегчило наше взаимодействие.
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835507
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
maytonВсе-таки интересно узнать на каком языке программирования ты собираешся это делать? Может там уже есть готовые библиотеки для структур данных (прим. если C++ то STL, если Java - то Collections). Это сильно-бы облегчило наше взаимодействие.
- потупя взор, смущенно ковыряя пол носком ботинка: я вааще-то на MS Acces лабаю ... Так что можно: "тяжелую артиллерию... СУБД Oracle" ... того ... не надо, а?

Я сопсно и спросил - про ФОРМАТЫ (то бишь - алгоритмы), а не про ГОТОВЫЕ РЕШЕНИЯ ...

mayton Иван
разве не видно (по приведенному образцу), что до "я" там очччень далеко?

Ммм... нет. Абсолютно не видно!- ок, говорю открытым текстом: там уже за 1 300 000 строк ...

maytonТогда подойдет Б-дерево! - возможно ... в качестве ЭКСПЕРНОЙ рекомендации - готов принять!
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835577
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван
на MS Acces лабаю ...

То есть на встронном VBasic? Я почему спрашиваю.... Большинство алгоритмов имеют "процедурную" природу то есть если ты решишь их реализовывать то потребуется язык подходящий для этой цели.
Иван
Так что можно: "тяжелую артиллерию... СУБД Oracle" ... того ... не надо, а?

Ну.. не надо так не надо
Иван
там уже за 1 300 000 строк ...

Каким образом они туда попадают? Операторы набивают?
Иван
в качестве ЭКСПЕРНОЙ рекомендации - готов принять!

Достаточно будет принять то что говорят Кнут, Дейкстра, Вирт и прочие столпы программирования.
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32835618
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
maytonТо есть на встронном VBasic? Я ... Большинство алгоритмов имеют "процедурную" природу ... потребуется язык подходящий для этой цели.- дык, VB он и есть - процедурный.

mayton Ивантам уже за 1 300 000 строк ...
Каким образом они туда попадают? Операторы набивают?
- нет, конечно ... в смысле - не только не "набивают", но и - не "Операторы". Сначала - из многоразных словарей, а потом - из парсинга реальных текстов.

Была такая тема: Индекс , он же - хранилище (строк) ; сейчас - продолжение тойже ПРИМЕРНО оперы ... Нюансы, правда, поменялись ... думаю - в лучшую сторону.
...
Рейтинг: 0 / 0
Q: общепризнаный стандарт хранения словарей?
    #32838340
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ИванFXS
дык, VB он и есть - процедурный

ИМХО VB не очень подходит для реализации алгоритмов и структур данных. Я не говорю что на нем сделать что-то невозмножно. Нет. Возможно. Но затратится на это больше усилий чем при программировании того-же Б-Дерева на С++(CBuilder) или Pascal(Delphi).
...
Рейтинг: 0 / 0
11 сообщений из 11, страница 1 из 1
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Q: общепризнаный стандарт хранения словарей?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]