powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / э-э-э- ... кластеризация "на формулах"
8 сообщений из 8, страница 1 из 1
э-э-э- ... кластеризация "на формулах"
    #36743462
exp98
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Думал, куда поместить))
В общем, недавно мне понадобилось срочно выполнить небольшой кластерный анализ.
Не было ничего удобного, за полчаса в инете не нашёл быстро чего нить лёгкого. Так появился этот файл. Надеюсь окажется полезным не только для кластеризации, но и как возможность попрограммировать, файл не для лентяев))

Сделано полностью на формулах.
Ограничения. Диапазон надо править в формулах - сейчас он на 100 строк.
Колич-во итераций ограничено кол-вом столбцов в екселе - сколько предполагается, итераций, столько копий надо предварительно наплодить.
Начальные центры кластеров надо сперва задать. Автоматизация выбора начальных кластеров - довольно трудоёмка, а этот файл отладил за пол дня
Рассматривается одномерное множество, но переделать на несколько координат - не проблема.
Из программных улучшений - вместо дублирования столбцов разрешить циклические ссылки.

Сами решайте, брать/не брать.
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36743494
Фотография -O_o-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
exp98,
Интерсно, осталось только в кластерном аналезе разобраться
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36743657
exp98
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
-O_o-, здесь реализован простейший вариант, а разбираться надо тому, кто хочет что-то подобное сделать. Мало-мальски сложный варинат прид1тся рисовать в макросах. Кому нужно попользоваться, разбираться в анализе необязательно.

И ещё конечно недостаток, что если данных много - миллион - то ексел на формулах ведь не потянет?
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36743679
Фотография vikttur
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Что это и с чем его едят - не знаю и мне, наверное, не нужно.
Маленькая капля дегтя. В столбце Е ссылка на диапазон до сотой строки, а в С9 формула, отличающаяся от верхних ( =$B$2 ). Т.е. в зависимости от количества значений столбца D нужно протягивать формулы? Где же здесь автоматизация?
Если так (в C5 ):
=ЕСЛИ(D4="";"";ЕСЛИ(D5="";$B$2;СРЗНАЧ(D4:D5))) ?

В формулы ВПР тоже желательно добавить проверку на #Н/Д для протягивания вниз.
Но это мои догадки. Может, ткак есть, так и надо.
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36743684
Фотография -O_o-
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
exp98-O_o-, здесь реализован простейший вариант, а разбираться надо тому, кто хочет что-то подобное сделать. Мало-мальски сложный варинат прид1тся рисовать в макросах. Кому нужно попользоваться, разбираться в анализе необязательно.

И ещё конечно недостаток, что если данных много - миллион - то ексел на формулах ведь не потянет?
Конечно не потянет ))) не хватит строк как минимум в 2003 ) А так потянет конечно )))
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36745171
exp98
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vikttur, даже не капля дёгтя, а молекула ))
Большая бочка дёгтя - это то, что для использования начальные центры кластеров придётся задавать ручками в столбце "Е". Альтернативой будет, если задать случайные значения на отрезке от В1 до В2.
Другая бочка дёгтя - это что количество кластеров надо угадать либо последовательно запускать для 2-х, 3-х, 4-х и т.д. кластеров, а потом выбрать лучший вариант исходя из экспертного мнения.

Насчёт твоих предложений - всё верно, не хотел возиться, надо было поскорее сделать.
Для ВПР() проверку? Я думаю, что если ошибок нет, то проверка не нужна, в какой-нибудь диапазон число всегда должно попасть.

Ещё бочка - сортировка необходима в столбцах Д1, Д2 ..., чтоб ВПР() корректно работала. Увы(( Если начальные центры в столбце Е1 выбраны неудачно или случайно, то сортировка по возрастанию необходима.

Большущая бочка - постоянное кол-во кластеров. Не всегда заранее известно сколько их. Желательно в ходе алгоритма, чтоб это число менялось. Регулируется просто - например задать минимальное / максим-ое расстояние между центрами кластеров. Существуют и другие способы. Вряд ли на формулах легко удастся ((

В итоге, я думаю, что обкатав на формулах, несложно будет это перевести на макросы, просто в формулах легче отлаживаться.
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36745471
fortik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
exp98
Другая бочка дёгтя - это что количество кластеров надо угадать либо последовательно запускать для 2-х, 3-х, 4-х и т.д. кластеров, а потом выбрать лучший вариант исходя из экспертного мнения.

Если начальные центры в столбце Е1 выбраны неудачно или случайно, то сортировка по возрастанию необходима.

Желательно в ходе алгоритма, чтоб это число менялось.


как-то это на подгонку модели к данным смахивает. overfitting.
...
Рейтинг: 0 / 0
э-э-э- ... кластеризация "на формулах"
    #36752594
exp98
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
fortik
как-то это на подгонку модели к данным смахивает. overfitting.

смахивает, но не есть подгонка )
Модель не догма, а инструмент. Сам по себе выбор модели - ба-а-льшой волюнтаризм.
Если есть возможность посмотреть результат, его следует посмотреть и критически оценить. При необходимости сменить модель - такова жизнь.
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / э-э-э- ... кластеризация "на формулах"
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]