|
|
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
улучшил: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.07.2009, 09:42 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Наконец, допустим есть таблица продаж (очень упрощенно) Код: plaintext 1. 2. 3. 4. 5. 6. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.07.2009, 12:00 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Nafесть табличка, типа есть группы в них группы или товары (как файлы-папки)Не самая подходящая аналогия, IMHO. Не стоит смешивать группы и товары в одной таблице. Этим, как минимум, усложняется проверка корректности данных. Например, группа может оказаться потомком товара, да и иерархичность товара вызывает сомнения. Хранение иерархии "методом Селко" может показаться привлекательным чисто теоретически, но, как показала практика, он больше вызывает проблем, чем их решает. Разумеется, никто не может помешать проверить это утверждение самому. Какой метод выбрать взамен него, трудно сказать однозначно. Для некоторых задач вполне достаточно стандартной пары (ID, ParentID) и рекурсивных запросов. Иерархия групп товаров - вещь, как минимум, очень неудобная, хотя бы по причине "жёсткости". В данном случае, IMHO, стоило бы применить "теговый" подход, когда к товару можно "прицепить" какие угодно теги, каждый из которых представляет собой ссылку на некий классификатор, в том числе и иерархический, если возникнет острая необходимость. Т.е., классический вариант связи M:N, реализованный через дополнительную таблицу, где с одной стороны товары, а с другой - теги(ссылки на классификаторы). Такой подход позволит строить "визуальные" иерархии, наиболее уместные в конкретной ситуации или для конкретного пользователя простым выбором последовательности тегов. Например, сначала по производителям, а потом по видам продукции, а можно наоборот, сначала по видам продукции, а потом по производителям. P.S. Хотелось бы отметить, что на практике, IMHO, часто тяготеют к иерархическим структурам, где их наличие совершенно неоправданно. "Истинных" иерархий, подобно генеалогическому дереву, на практике не так уж и много. В таких случаях обычно подразумеваются, что все элементы этой иерархии однотипны. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.07.2009, 14:00 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
ChAХранение иерархии "методом Селко" может показаться привлекательным чисто теоретически, но, как показала практика, он больше вызывает проблем, чем их решает. Хмм... голословное утверждение. Знаю как минимум два случая из личной практики, когда применение метода Селко избавило от необходимости приобретения дорогущего железа. При этом сложность добавления/удаления/изменения данных для процедур, которые с этим деревом работали, ни как не изменилась. Вместо корявых и медленных циклов / курсоров / CTE для выборки данных из деревянной структуры, были написаны однопроходные запросы и построены индексы. При этом, скорость работы увеличилась на несколько порядков, а нагрузка на железо упала в несколько раз. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.08.2009, 23:51 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Roman S. Golubinголословное утверждение.Роман, могу ответить в том же духе, твои примеры тоже являются голословным утверждением. Дабы избегать ненужного эпатажа и сосредоточиться на сути, предлагаю в дальнейшем исключить подобные формулировки. Мои утверждения основаны на моей практике, твои на твоей, давай исходить из этого. Roman S. GolubinЗнаю как минимум два случая из личной практики, когда применение метода Селко избавило от необходимости приобретения дорогущего железа. При этом сложность добавления/удаления/изменения данных для процедур, которые с этим деревом работали, ни как не изменилась.Разумеется, если использовать метод вложенных множеств(Селко) в качестве альтернативы дилетантским решениям, то не исключаю, что он может выиграть по некоторым пунктам. Но от его родового проклятия, пересчёта и модификации LR-значений, в среднем затрагивающих до половины узлов дерева, увы, не избавиться. Если использовать большую разреженность значений, чтобы снизить объем модификаций, то мы теряем некоторые преимущества, которые даёт непрерывность LR-последовательности, при этом дополнительная проверка на предмет нахождения внутри псевдофиксированных границ остаётся. Даже для простейшего поиска всех потомков узла необходимо использовать слияние, для получения по идентификатору узла его LR-значений, чтобы выбрать потомков, чьи LR-значения находятся внутри LR-границ предка. Причем сами LR-значения мы не можем использовать в качестве ключа в связи с их потенциальной изменчивостью. Поиск всех предков листа приводит к сканированию всех узлов дерева, что с учётом потенциальной перестройки дерева при модификации может породить немало проблем. То же самое произойдёт при попытке вычислить уровень листа. Слишком часто используется between, что мешает использованию merge- и hash-алгоритмов при различных выборках. Да и с индексом есть проблемы, так как у нас для каждого узла есть 2 совершенно независимых друг от друга значения. В результате, польза от индекса (L,R) невелика, а использование 2 отдельных индексов по L и R сервером запросто игнорируется с точки зрения IO. Дешевле сделать seek+scan по какому-либо одному из них. Roman S. GolubinВместо корявых и медленных циклов / курсоров / CTE для выборки данных из деревянной структуры, были написаны однопроходные запросы и построены индексы. При этом, скорость работы увеличилась на несколько порядков, а нагрузка на железо упала в несколько раз.Я тоже видел много ужасных реализаций, но это говорит лишь об уровне их авторов. Тем более, что ты упомянул создание индексов, исключение курсоров. Так зачем же противопоставлять заведомо плохую реализацию работы с деревом и метод вложенных множеств, который при реализации тем же программистом мог бы точно так же, если не хуже, похоронить сервер ? Цикла в случае стандартных (ID, ParentID) может и не избежать, но без курсоров можно запросто обойтись, этот способ был предложен в BOL еще к MS SQL версии 4.21. Почти уверен, что нормальная реализация такого подхода не сильно бы уступала методу вложенных множеств. В случае неглубоких деревьев(2-3 уровня, что нередко бывает на практике) не думаю, что CTE принципиально проигрывает методу вложенных множеств при "правильных" индексах. Впрочем, это моё голословное, умозрительное, утверждение, сам экспериментов не ставил. Если есть обратная статистика, а ещё лучше, воспроизводимый пример, то был бы рад ознакомиться. IMO, метод вложенных множеств может использоватся в случае не очень больших и редкоизменяющихся деревьев. Лично я исключил его из своей практики, предпочитаю развёртывание иерархии в дополнительных полях и/или таблицах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.08.2009, 02:22 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
ChA, По поводу использования LR в качестве ключа - это жестко :) Я использовал все ту же старую модель ID/ParentID в связке с LR - индекс позволяет выбрать пару с помощью Seek. И да, в обоих случаях имелось очень большое, основательно развлетвленное и не очень активно (примерно 2-3 раза в час) изменяющееся дерево, управление структурой которого было отдано пользователям. При этом затык производительности был именно на получении потомков / путей к корню - множество поисковых запросов через web. Перед началом перехода на метод Селко рядом стоял костыль в виде отдельного сервера Oracle, на котором курсоры (по непонятной мне причине - ни разу не пользовался ораклом ) работали на порядок быстрее, чем на MS SQL. На этом оракле и крутилось дерево. На счет ужасности реализации - не знаю, как все это было реализовано до того, как перестало хватать железа и был установлен оракловый сервер - история об этом умалчивает :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.08.2009, 03:11 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
а вы еще добавте одно поле "уровень иерархии", оно может и лишнее но поможет Вам и сейчас и в будующем. CREATE TABLE GOOD ( --товары ID Integer NOT NULL, --первичный ключ LEFTBOUND Integer NOT NULL, RIGHTBOUND Integer NOT NULL, PARENT Integer,--сылка на группу владельца, для первого уровня NULL NAME Varchar(50) NOT NULL, --наименование группы или товара ISGROUP Integer NOT NULL --признак группы: 0,1 LEVEL Integer NOT NULL ); ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.09.2009, 16:14 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Борис Бритваа вы еще добавте одно поле "уровень иерархии", оно может и лишнее но поможет Вам и сейчас и в будующем. CREATE TABLE GOOD ( --товары ID Integer NOT NULL, --первичный ключ LEFTBOUND Integer NOT NULL, RIGHTBOUND Integer NOT NULL, PARENT Integer,--сылка на группу владельца, для первого уровня NULL NAME Varchar(50) NOT NULL, --наименование группы или товара ISGROUP Integer NOT NULL --признак группы: 0,1 LEVEL Integer NOT NULL );возможно, но в тоже время оно легко вычисляется ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.09.2009, 16:31 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Naf, c таким же успехом Вы можетесказать, что поля PARENT и ISGROUP - излишества) и вообще табличку надо нормализовать) Вам не кажется что для таких запрросов используется подход, который позволяет оптимизировать время выполнения запроса, и позволяет строить интутивно понятные с первого взгляда простые запосы. Представляете себе запрос такого вида как Вы предложили хотя бы для 5 измерений? =) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.09.2009, 11:37 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Подумайте, может Вам в условии JOIN юзать BETWEEN и тогда будет удобней? SELECT GOOD.NAME, SUM( SALE.AMOUNT ) AS AMOUNT FROM GOOD LEFT OUTER JOIN SALE ON ( SALE.GOOD BETWEEN GOOD.LEFTBOUND AND GOOD.RIGHTBOUND) GROUP BY GOOD.NAME ORDER BY GOOD.LEFTBOUND ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.09.2009, 12:18 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Борис БритваNaf, c таким же успехом Вы можетесказать, что поля PARENT и ISGROUP - излишества) и вообще табличку надо нормализовать) Вам не кажется что для таких запрросов используется подход, который позволяет оптимизировать время выполнения запроса, и позволяет строить интутивно понятные с первого взгляда простые запосы. Представляете себе запрос такого вида как Вы предложили хотя бы для 5 измерений? =)нормализовать можно, но денормализация специально внесена для ускорения выборок ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.09.2009, 15:30 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Борис БритваПодумайте, может Вам в условии JOIN юзать BETWEEN и тогда будет удобней? SELECT GOOD.NAME, SUM( SALE.AMOUNT ) AS AMOUNT FROM GOOD LEFT OUTER JOIN SALE ON ( SALE.GOOD BETWEEN GOOD.LEFTBOUND AND GOOD.RIGHTBOUND) GROUP BY GOOD.NAME ORDER BY GOOD.LEFTBOUNDмне не нужны все товары, а только которые есть в SALE. Да и сортировки требуемой нет ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.09.2009, 15:32 |
|
||
|
Иерархия
|
|||
|---|---|---|---|
|
#18+
Naf, у меня с сортировкой все в порядке. Может у Вас в данных неправильно указаны левые и правые границы? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.09.2009, 16:17 |
|
||
|
|

start [/forum/topic.php?fid=32&msg=36174384&tid=1543092]: |
0ms |
get settings: |
7ms |
get forum list: |
17ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
50ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
63ms |
get tp. blocked users: |
1ms |
| others: | 201ms |
| total: | 357ms |

| 0 / 0 |
