powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Реально реализовать кластеризацию данных средствами СУБД?
10 сообщений из 10, страница 1 из 1
Реально реализовать кластеризацию данных средствами СУБД?
    #37379508
Mindzor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Имеется ввиду не создание кластера серверов. А именно операция кластеризации над данными.
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37379675
Фотография Warstone
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вы еще поясните что вы подразумеваете под кластеризацией. Просто такая операция есть практически во всех СУБД, но это видно не то, что вы хотите.
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37380441
Mindzor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
WarstoneПросто такая операция есть практически во всех СУБД
Вы говорите про GROUP BY?

Warstoneно это видно не то, что вы хотите.
Ну вот например через алгоритм k-средних.
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37380471
kDnZP
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mindzor, Оно?
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37380667
Фотография Warstone
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MindzorВы говорите про GROUP BY?Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо.
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37380988
CLUSTER ON INDEX
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
WarstoneMindzorВы говорите про GROUP BY?Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо.
А что это означает вкратце?
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37381167
Фотография Warstone
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
CLUSTER ON INDEXWarstoneпропущено...
Нет, в частности в postgreSQL есть команда CLUSTER ON INDEX, но 90% что это не то, что вам надо.
А что это означает вкратце? http://www.postgresql.org/docs/9.0/static/sql-cluster.html
Если коротко - физически расположить данные в таблице по индексу. Таким образом увеличивается вероятность попадания в страницу смежных (по этому индексу) данных. Но это 99% не то что вы спрашиваете. Именно по этому я и прошу уточнить. Так как под понятием кластеризация может крыться дофига чего.
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37383073
Mindzor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
kDnZPMindzor, Оно?
Да. Но тут как я понял уже готовая реализация. А мне желательно бы код какой-нибудь переносимой процедуры чтобы можно было на любой СУБД реализовать.

Warstone, да скорее всего это не то...
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37417713
R.Alexandr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Mindzor,

Все зависит от требований. Если нужна кластеризация с редко изменяемым критериями кластеров (то есть кластеры статичны во времени), то это может почти любой инструмент датамайнинга. KXen (платный), Oracle data miner (платный), SAS (платный), RapidMiner (бесплатный), R (бесплатный). Они вроде бы все могут для построенных кластеров выдать условия отнесения элементов к нему типа
if (field1 >= 1 and field1 <= 2 and ... and fieldN <= 100) then claster1
else if ....

Это все легко в SQL копируется (а иногда даже нужный SQL генерится автоматом) и в дальнейшем можно простым запросом раскидывать данные по кластерам.

Если же кластеры не статичны и нужно постоянно переобучать модель, то можно пользоваться либо встроенным в Teradata кластеризатором (модуль датамайнинга, докупается отдельно, генерится через GUI), либо аналогичным в Oracle (Oracle data miner = PL/SQL-пакеты + GUI, может работать без GUI, если самому написать вызов PL/SQL процедур). И второй вариант - взять RapidMiner, нарисовать в нем процесс датамайнинга, сохранить его в jar (если там этого нет автоматом, то руками вроде можно было сделать) и потом этот jar-ик выполнять на сервере БД по расписанию или по событию.
...
Рейтинг: 0 / 0
Реально реализовать кластеризацию данных средствами СУБД?
    #37417732
R.Alexandr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
упс, пнул дохлый тред.
сорри.
...
Рейтинг: 0 / 0
10 сообщений из 10, страница 1 из 1
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Реально реализовать кластеризацию данных средствами СУБД?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]