Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Реально реализовать кластеризацию данных средствами СУБД? / 10 сообщений из 10, страница 1 из 1
03.08.2011, 20:14
    #37379508
Mindzor
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
Имеется ввиду не создание кластера серверов. А именно операция кластеризации над данными.
...
Рейтинг: 0 / 0
03.08.2011, 23:58
    #37379675
Warstone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
Вы еще поясните что вы подразумеваете под кластеризацией. Просто такая операция есть практически во всех СУБД, но это видно не то, что вы хотите.
...
Рейтинг: 0 / 0
04.08.2011, 13:30
    #37380441
Mindzor
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
WarstoneПросто такая операция есть практически во всех СУБД
Вы говорите про GROUP BY?

Warstoneно это видно не то, что вы хотите.
Ну вот например через алгоритм k-средних.
...
Рейтинг: 0 / 0
04.08.2011, 13:47
    #37380471
kDnZP
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
Mindzor, Оно?
...
Рейтинг: 0 / 0
04.08.2011, 14:50
    #37380667
Warstone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
MindzorВы говорите про GROUP BY?Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо.
...
Рейтинг: 0 / 0
04.08.2011, 16:48
    #37380988
CLUSTER ON INDEX
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
WarstoneMindzorВы говорите про GROUP BY?Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо.
А что это означает вкратце?
...
Рейтинг: 0 / 0
04.08.2011, 18:07
    #37381167
Warstone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
CLUSTER ON INDEXWarstoneпропущено...
Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо.
А что это означает вкратце? http://www.postgresql.org/docs/9.0/static/sql-cluster.html
Если коротко - физически расположить данные в таблице по индексу. Таким образом увеличивается вероятность попадания в страницу смежных (по этому индексу) данных. Но это 99% не то что вы спрашиваете. Именно по этому я и прошу уточнить. Так как под понятием кластеризация может крыться дофига чего.
...
Рейтинг: 0 / 0
05.08.2011, 20:53
    #37383073
Mindzor
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
kDnZPMindzor, Оно?
Да. Но тут как я понял уже готовая реализация. А мне желательно бы код какой-нибудь переносимой процедуры чтобы можно было на любой СУБД реализовать.

Warstone, да скорее всего это не то...
...
Рейтинг: 0 / 0
30.08.2011, 15:18
    #37417713
R.Alexandr
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
Mindzor,

Все зависит от требований. Если нужна кластеризация с редко изменяемым критериями кластеров (то есть кластеры статичны во времени), то это может почти любой инструмент датамайнинга. KXen (платный), Oracle data miner (платный), SAS (платный), RapidMiner (бесплатный), R (бесплатный). Они вроде бы все могут для построенных кластеров выдать условия отнесения элементов к нему типа
if (field1 >= 1 and field1 <= 2 and ... and fieldN <= 100) then claster1
else if ....

Это все легко в SQL копируется (а иногда даже нужный SQL генерится автоматом) и в дальнейшем можно простым запросом раскидывать данные по кластерам.

Если же кластеры не статичны и нужно постоянно переобучать модель, то можно пользоваться либо встроенным в Teradata кластеризатором (модуль датамайнинга, докупается отдельно, генерится через GUI), либо аналогичным в Oracle (Oracle data miner = PL/SQL-пакеты + GUI, может работать без GUI, если самому написать вызов PL/SQL процедур). И второй вариант - взять RapidMiner, нарисовать в нем процесс датамайнинга, сохранить его в jar (если там этого нет автоматом, то руками вроде можно было сделать) и потом этот jar-ик выполнять на сервере БД по расписанию или по событию.
...
Рейтинг: 0 / 0
30.08.2011, 15:23
    #37417732
R.Alexandr
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Реально реализовать кластеризацию данных средствами СУБД?
упс, пнул дохлый тред.
сорри.
...
Рейтинг: 0 / 0
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Реально реализовать кластеризацию данных средствами СУБД? / 10 сообщений из 10, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]