|
|
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
Имеется ввиду не создание кластера серверов. А именно операция кластеризации над данными. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.08.2011, 20:14 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
Вы еще поясните что вы подразумеваете под кластеризацией. Просто такая операция есть практически во всех СУБД, но это видно не то, что вы хотите. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.08.2011, 23:58 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
WarstoneПросто такая операция есть практически во всех СУБД Вы говорите про GROUP BY? Warstoneно это видно не то, что вы хотите. Ну вот например через алгоритм k-средних. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.08.2011, 13:30 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
Mindzor, Оно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.08.2011, 13:47 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
MindzorВы говорите про GROUP BY?Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.08.2011, 14:50 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
WarstoneMindzorВы говорите про GROUP BY?Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо. А что это означает вкратце? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.08.2011, 16:48 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
CLUSTER ON INDEXWarstoneпропущено... Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо. А что это означает вкратце? http://www.postgresql.org/docs/9.0/static/sql-cluster.html Если коротко - физически расположить данные в таблице по индексу. Таким образом увеличивается вероятность попадания в страницу смежных (по этому индексу) данных. Но это 99% не то что вы спрашиваете. Именно по этому я и прошу уточнить. Так как под понятием кластеризация может крыться дофига чего. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.08.2011, 18:07 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
kDnZPMindzor, Оно? Да. Но тут как я понял уже готовая реализация. А мне желательно бы код какой-нибудь переносимой процедуры чтобы можно было на любой СУБД реализовать. Warstone, да скорее всего это не то... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.08.2011, 20:53 |
|
||
|
Реально реализовать кластеризацию данных средствами СУБД?
|
|||
|---|---|---|---|
|
#18+
Mindzor, Все зависит от требований. Если нужна кластеризация с редко изменяемым критериями кластеров (то есть кластеры статичны во времени), то это может почти любой инструмент датамайнинга. KXen (платный), Oracle data miner (платный), SAS (платный), RapidMiner (бесплатный), R (бесплатный). Они вроде бы все могут для построенных кластеров выдать условия отнесения элементов к нему типа if (field1 >= 1 and field1 <= 2 and ... and fieldN <= 100) then claster1 else if .... Это все легко в SQL копируется (а иногда даже нужный SQL генерится автоматом) и в дальнейшем можно простым запросом раскидывать данные по кластерам. Если же кластеры не статичны и нужно постоянно переобучать модель, то можно пользоваться либо встроенным в Teradata кластеризатором (модуль датамайнинга, докупается отдельно, генерится через GUI), либо аналогичным в Oracle (Oracle data miner = PL/SQL-пакеты + GUI, может работать без GUI, если самому написать вызов PL/SQL процедур). И второй вариант - взять RapidMiner, нарисовать в нем процесс датамайнинга, сохранить его в jar (если там этого нет автоматом, то руками вроде можно было сделать) и потом этот jar-ик выполнять на сервере БД по расписанию или по событию. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.08.2011, 15:18 |
|
||
|
|

start [/forum/topic.php?fid=56&msg=37417732&tid=2015424]: |
0ms |
get settings: |
7ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
169ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
44ms |
get tp. blocked users: |
1ms |
| others: | 232ms |
| total: | 486ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...