Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
26.02.2021, 02:26
|
|||
---|---|---|---|
Питон, кластеризация |
|||
#18+
Народ, помогите, плз! Питон. Есть набор данных ( ексел, данные по 200+ клиентам, потребление элекртоэнергии, шаг - 15 мин, данные за два года. Те. 96 строк * 365*2*200+ колонок. Индекс - дата, те 21-01-20 00:00:00, 21-01-20 00:15:00 и тд. Надо: 1. разбить на кластеры, k-means, вроде сделала с elbow method. для этого усреднила до суток, получилось 96 строк, индекс только время Как посчитать количество клиентов в каждом кластере? Для каждого кластера также нарисовать график с каздым клиентом +центроид. 2. Для одного только клиента разбить два года опять на кластеры. Здесь надо определить кол-во дней в каждом кластере. желательно использовать силуэт никак не понимаю, как считать их :( спасибо большое ... |
|||
:
Нравится:
Не нравится:
|
|||
|
26.02.2021, 02:46
|
|||
---|---|---|---|
Питон, кластеризация |
|||
#18+
Апдейт - я как-то докумекала посчитать для первой задачи ( решила, что кластеров, например, 5 ): kmeans = KMeans(n_clusters = 5, init = 'k-means++', random_state = 42) y_kmeans = kmeans.fit_predict(X). потом если посчитать collections.Counter(y_kmeans), он дает кол-во нулей, единиц и пр. скажите, это правильно? но дальше, с графиками, затык полный :( ... |
|||
:
Нравится:
Не нравится:
|
|||
|
|
start [/forum/topic.php?fid=23&mobile=1&tid=1459511]: |
0ms |
get settings: |
11ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
35ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
43ms |
get tp. blocked users: |
2ms |
others: | 12ms |
total: | 136ms |
0 / 0 |