|
Питон, кластеризация
|
|||
---|---|---|---|
#18+
Народ, помогите, плз! Питон. Есть набор данных ( ексел, данные по 200+ клиентам, потребление элекртоэнергии, шаг - 15 мин, данные за два года. Те. 96 строк * 365*2*200+ колонок. Индекс - дата, те 21-01-20 00:00:00, 21-01-20 00:15:00 и тд. Надо: 1. разбить на кластеры, k-means, вроде сделала с elbow method. для этого усреднила до суток, получилось 96 строк, индекс только время Как посчитать количество клиентов в каждом кластере? Для каждого кластера также нарисовать график с каздым клиентом +центроид. 2. Для одного только клиента разбить два года опять на кластеры. Здесь надо определить кол-во дней в каждом кластере. желательно использовать силуэт никак не понимаю, как считать их :( спасибо большое ... |
|||
:
Нравится:
Не нравится:
|
|||
26.02.2021, 02:26 |
|
Питон, кластеризация
|
|||
---|---|---|---|
#18+
Апдейт - я как-то докумекала посчитать для первой задачи ( решила, что кластеров, например, 5 ): kmeans = KMeans(n_clusters = 5, init = 'k-means++', random_state = 42) y_kmeans = kmeans.fit_predict(X). потом если посчитать collections.Counter(y_kmeans), он дает кол-во нулей, единиц и пр. скажите, это правильно? но дальше, с графиками, затык полный :( ... |
|||
:
Нравится:
Не нравится:
|
|||
26.02.2021, 02:46 |
|
|
start [/forum/topic.php?fid=23&msg=40048814&tid=1459511]: |
0ms |
get settings: |
12ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
38ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
45ms |
get tp. blocked users: |
2ms |
others: | 268ms |
total: | 400ms |
0 / 0 |