|
|
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Здравствуйте! Стоит задача разработать модель прогнозирования продаж. Механика отгрузок у компания такая, что через день отгружает продукцию по магазинам, при этом получает возвраты от не реализованных на полках. Продажа = Отгрузки - Возвраты. Имеются исторические данные по SKU по месячно. Модель прогнозирования заключается в том, что по каждой SKU строятся разные регрессионные модели, определяется прогноз, расчет в ретроспективе, определения для каждой модели регрессии ошибку (например, коэффициент детерминации) и подбирается та модель, которая имеет наименьшую ошибку, следовательно, исходя из этого делается прогноз. Прогноз делается от 1 до 12 месяцев. Но есть но. Перед тем как запустить такой прогноз, необходимо нормализовать данные, то есть в какие то месяца есть вспышки или спады за счет акции, сезонности, новое SKU, SKU, которое прекращает выпуск. Это резкие приросты и спады значительно сдвигают прогноз. Во вложенном файле для примера, представил несколько условных данных по SKU. Для нормирования использовал три показателя "Медиана за три месяца", "Медиана за 5 месяцев" и " Скользящая средняя за 3 месяца". В excel-ом файле можно посмотреть прописанные формулы. Каждый показатель по своему сглаживает. Обратите внимание, при выборе какого либо SKU варианты сглаживания отличаются друг от друга. Затрудняюсь определить, какое сглаживание лучше использовать. Возникает вопрос. Для данной ситуации, для данной механики отгрузок как более правильно сглаживать? Важно учесть, что какие то прогнозируемые месяцы не акционные, и не сезонные, а какие то - акционные и сезонные. Но там где акции, сезонность не возможно приблизительно спрогнозировать прирост. Если брать прирост с прошлого года, то не всегда может совпасть с эмпирическими данными. Рынок не предсказуемый. Какой показатель лучше использовать для сглаживания, где потом будет производится прогноз? Как лучше написать (или дописать) формулу? Сглаживание должно быть такое, чтобы чтобы нужная информация не размылась. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.04.2017, 15:43 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
У тебя формулы неправильные, ты будущее захватываешь, оно неизвестно на момент расчета. Например считаешь август, а он входит в расчет, где-то даже сентябрь захватываешь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.04.2017, 15:59 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Я захватывал и будущее, зависит от адекватности модели. Главное, чтобы данные были, например оценочные. Если брать только прошлоое, мы всегда запаздываем, брать тольок будущее - бежать впереди паравоза. А при "плавающих средних" краевые эффекты всегда будут. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.04.2017, 16:21 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ferzmikk, давненько не брал я в руки шашек ... Чё надо прогнозироват? ценеу или объёмы? в шт или $ ? Непонятно другое: такие вопросы должны возникать в аналитическом отделе, а не у программиста. Эффект акции надо отсеять предварительно. Если никто не знает, как его измерять, то у вас акция оценивается эмоционально: "она удалась! ажиотаж был огромный!" Если кратко, то см. передаточная функция . В принципе случайные всплески во временных рядых действительно можо сглаживать (медиана - один из таких). Я для продаж пользовался ядерным (спец. весовым) сглаживателем и, как сказал выше, захватывал непустое будущее. На мои интервальные прогнозы иногда делали ставки. Месячные точки - маловато будет, хотя бы по неделям. У меня были ежедневные. В продажах о-о-очень часто существует сезонность . Сезонность в продажах выделяется типовым методом -переводим в проценты по годам (пустоты заполняем как-нить разумно) - Изучаем кривульки. На 12 месяцах ярковыраженную сезонность спроса (годовой профиль) видно невооружённым глазом. Понедельный график уже поддаётся матметодам (50 точек - теоретический минимум, поэтому лучше недельный график): - вычитаем тренд -- как раз тот или иной усреднитель - если ндравится, переводим оставшуюся разницу в "множитель относительно тренда" - строим автокорреляционную кривую - Если точек много, то теперь сгладить - Изучаемм точки экстремумов. Первые из них могут характеризовать скрытые квазипериоды. - Всё в шоколаде, когда рисунки получаются красивыми, иначе - думать и принимать решение самому. Показатель? Ну, медиана - это грубый предсказатель, хотя и робастный )). Я бы ожидал, что она - плановый показатель, а не прогноз. И для цены, не для объёмов. Максмум правдоподобия вполне подойдёт из простых способов. Попроще будет, если для начала прикинуться экспертом в области и задавать веса для каждой пары (показатель, период). Я не знаю, чем собственно вызвано требование, чтобы для каждого единицы свой сглаживатель. Можно кластеризовать магазины (т.е. схожесть) по %-му профилю ассортимента. Подробнее в одном посте невозможно. Опять же, неизвестно взаимодействие с магазами, мож это ваши филиалы, тогда обычно всё планируется. Неплохо ещё и определиться с подходом: смотрим на магаз как на чёрный ящик, смотрим на клиентскую базу как "вытягиватель" спроса для магазов и т.п. В связи с последним общий экономич прогноз для населения страны не помешает (например кризисы 1999, 2009, 2014-17) - заглянуть в доходы-расходы по регионам Госстата, в темпы убыли населения и т.п. если уж совсем долгосрочно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.04.2017, 17:14 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
По порядку exp98ferzmikk, Чё надо прогнозироват? ценеу или объёмы? в шт или $ ? Продажи, Шт. Непонятно другое: такие вопросы должны возникать в аналитическом отделе, а не у программиста.Я аналитик-программист. С экономическим образованием Эффект акции надо отсеять предварительно. Недавно ввели подобное поле с привязкой SKU, времени и ТТ. Отображает в каком то анализируемом периоде SKU акционно или нет. То есть булевый тип. Достаточно ли это поле будет для анализа с целью отсеивания? Или нужно будет еще какое нибудь вспомогательное поле? Месячные точки - маловато будет, хотя бы по неделям. У меня были ежедневные.Возможно сделать по недельно. А возможно по дням, только отгрузки у нас несколько раз в неделю, например, вт, чт, сб. А бывает на какое, что на какой то неделе в какой то день отгрузки не было. Или на какую то неделю в пн была отгрузка. Такие логические нюансы тоже надо учесть, иначе будут сдвиги в прогнозах. В продажах о-о-очень часто существует сезонность . Сезонность в продажах выделяется типовым методом -переводим в проценты по годам (пустоты заполняем как-нить разумно)Как это проценты по годам? Я не знаю, чем собственно вызвано требование, чтобы для каждого единицы свой сглаживатель. Можно кластеризовать магазины (т.е. схожесть) по %-му профилю ассортимента. Варианты кластеризации: 1. Вообще ТТ группируем по объемам продажах (включая конкурентов) для основной категории товаров. 2. А также для каждой ТТ привязывается список SKU (просто список, не важно сколько шт по каждому SKU), которые надо отгрузить. 3. Тип (формат) ТТ 4. Автозаказ или нетПодробнее в одном посте невозможно. Опять же, неизвестно взаимодействие с магазами, мож это ваши филиалы, тогда обычно всё планируется.Магазины не наши, мы поставляем. Неплохо ещё и определиться с подходом: смотрим на магаз как на чёрный ящик, смотрим на клиентскую базу как "вытягиватель" спроса для магазов и т.п. В связи с последним общий экономич прогноз для населения страны не помешает (например кризисы 1999, 2009, 2014-17) - заглянуть в доходы-расходы по регионам Госстата, в темпы убыли населения и т.п. если уж совсем долгосрочно.Как вариант возможно, но вопрос в другом, скорость сбора данных, качество обработки, полнота, достоверность и т.д. В идеале хотелось бы реализовать прогноз как нейронную сеть. Но для начала надо разобраться с нормализацией данных. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.04.2017, 16:14 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Здесь Ваши вопросы, чтоб и другие могли высказаться. Я буду постепенно, т.к. сразу всё не успею или не смогу. ferzmikkПродажи, Шт. Недавно ввели подобное поле с привязкой SKU, времени и ТТ. Отображает в каком то анализируемом периоде SKU акционно или нет. То есть булевый тип. Достаточно ли это поле будет для анализа с целью отсеивания? Возможно сделать по недельно. А бывает на какое, что на какой то неделе в какой то день отгрузки не было. Как это проценты по годам? Варианты кластеризации: 1. Вообще ТТ группируем по объемам продажах (включая конкурентов) для основной категории товаров. 2. А также для каждой ТТ привязывается список SKU (просто список, не важно сколько шт по каждому SKU), которые надо отгрузить. 3. Тип (формат) ТТ 4. Автозаказ или нет Магазины не наши, мы поставляем. Как вариант возможно, но вопрос в другом, скорость сбора данных, качество обработки, полнота, достоверность и т.д. В идеале хотелось бы реализовать прогноз как нейронную сеть Забудьте вы все про нейронные сети!!! не в том месте хотите, начитались рекламы, панимаишь ли ... - булевый тип, достаточно ли? Я подразумевал отсеять объёмы, порождённые акцией, ане сами ску. По моему разумению акция, должна иметь концепцию. Рез-т акции нужно сравниь с запланированным рез-том. Т.к. сравнение подразумевает меру отличия, лично я не хочу переводить эмоциональные показатели в количественные. Что мы хотим: провести тест или это регулярка? рентабельность акции интересует? привлечь дополнительные продажи? привлечь новых клиентов? насколько, на один раз или надолго? Отсюда и показатели. Это, когда стоит задача анализа акций. Если нет, ну правильно, можно робастно сгладить и рассматривать это как случайную либо периодическую флуктуацию. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.04.2017, 17:19 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Уже и сомневаюсь, нужны ли мои сферические откровения в вакууме. Я могу только общё высказаться, подробности ваши мне неизвестны, и полностью автоматические прогнозы не люблю. -Как это проценты по годам? Ну доля периода в годовом объёме, что ли. Это более стабильная величина при схожем ассортименте. Акции м.б. разного формата, только вам знать, сгодится ли универсальная процедура обсчёта или нет. Обычно всякие потребительские акции больше заимствую будущий спрос нежели дают стабильный прирост продаж. - новинки ску, устаревшие и т.п. По классической модели ЖЦТ, находим условный период начальног рождения, стабильности, завершения. Например, 1-й месяц/2-й/3-й и вводим коэффициенты. -Как вариант возможно, но вопрос в другом, скорость сбора данных, качество обработки, полнота, достоверность и т.д. Во-первых, я не могу заставить)) Ведь это про Госстат? Один раз почитать полезно для общей картины. На таком уровне точность 15-20% достаточна, а населённость регионов, где клиенты - важна для удельных показателей. Но если ваш регион локальный, то мож и лишне ... Вам виднее, кто у вас задаёт обобщённый показател: Хочу в след. году на 15% больше! А за счёт чего? за счёт расширения клиентской базы или цен? Поинтересуйся возрастным распределением в стране и его динамикой - удивишься. - Достоверность? А альтернатива - СМИ типа московского мозгомойца или АОБС. Врёт, нет ли, динамика зато данных коррелирует. Например, ср. з/п (давно не смотрел), например 30 по стране. А, скажем, МВД заявит о 300 ярдах серой з/п - возьми да прибавь сам. К тому же там бывает используют опросный метод. - Показатель в шт. Ну не знаю, что там ТНП, ТПС, цемент, книги, гербалафа или нечто эксклюзивное. В конторе, где я проработал больше всего и откуда меня в течении часа выперли (там, где на меня пари заключали) с первых дней я нашёптывал нач-ку, что надо всё деньгами мерять, цену планировать (а не прогнозировать), а штуки рекомендовать, рентабельость соответственно. Видимо тот ещё дольше объяснялся с вышестоящими, те консультировались с консультантами, и к концу года на деньги перешли. В конце концов, если спрос есть всегда, а штук много, то деньгами проще манипулировать. Я уже писал, что не знаю вашу логистику, посредничество ли, производство ли. Если везти из Китая, то это неск. месяцев, значит заранее надо знать поставщика, а до того уже знать объёмы закупок, и куда сбагривать возвраты (пускать со скидками, давать в бонус, продавать по электричкам), и сколько их допустимо, и что там со складскими запасами, и сколько допустимо возвратов и т.п. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.04.2017, 18:39 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ferzmikk, по сглаживанию пример здесь ядро - перевёрнутая парабола 3/4(1-X^2) Для него доказана робастность и несмещённость оценки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.04.2017, 18:45 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ferzmikk, -А бывает , что на какой то неделе в какой то день отгрузки не было. Можно отслеживать удельную величину: отгрузка/день. Акция на них всё равно вылезет Есть вариант забыть про время и перейти к дискретным отсчётам: точка = факт отгрузки, но у меня это пока не ассоциируется со стандартными моделями. На это при желании прижётся потратить время, чтобы посмотреть, что из этого выйдет, мож каки-нить инварианты обнаружатся. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2017, 09:48 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
exp98Забудьте вы все про нейронные сети!!! не в том месте хотите, начитались рекламы, панимаишь ли ...Если я хочу в начале нормализовать данные, потом для каждой записи построить разные варианты прогнозов с проверочными коэффициентами, потом подбирается тот прогноз с наименьшей ошибкой и аналогично для остальных записей, то это и есть нейронная сеть. Или я ошибаюсь? - булевый тип, достаточно ли? Я подразумевал отсеять объёмы, порождённые акцией, ане сами ску. Ну я и подразумеваю, что отсекаются объемы от акции. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2017, 13:29 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Вот кстати, если ряд делать по дням, то пофиг ск. раз в неделю отгрузки. Тем более, что сглаживание умеет интерполировать, если взять достаточную окрестность. И да, её стоит брать НЕ кратной неделе: 11, 9 или 5 точек. Отыщу дома пример и дам картинку. А агрегировать рез-т по неделям. Но всё равно удельные характеристики полезно тоже смотреть: и кол-во поставок /нед и ср. объём за поставку. Распределение по ценовым диапазонам тоже полезно. Не имея данных точнее не сказать, а желания изучать чужие данные - сами понимаете сколько. Насчёт нейронных сетей - большое и жирное ХА)) Если под фразой "подбирается тот прогноз с наименьшей ошибкой" скрываются метод нейронных сетей, то да, они. Ежели же произвольный метод перебора либо спец.алгоритм, то фигвам. Надо понимать, что, если специально не постараться, то неполный перебор найдёт ЛОКАЛЬНЫЙ оптимум (его глобальность м.б. не гарантирована). Можено сравнить с методом Ньютона. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2017, 14:01 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ferzmikkМесячные точки - маловато будет, хотя бы по неделям. У меня были ежедневные.Возможно сделать по недельно. А возможно по дням, только отгрузки у нас несколько раз в неделю, например, вт, чт, сб. А бывает на какое, что на какой то неделе в какой то день отгрузки не было. Или на какую то неделю в пн была отгрузка. Такие логические нюансы тоже надо учесть, иначе будут сдвиги в прогнозах. Срок годности SKU какой? Если грузят три раза в неделю, то подозреваю что небольшой. ИМХО период усреднения надо меньше срока годности брать. Иначе проблема спрячется внутри усреднения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2017, 14:12 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Dima TСрок годности SKU какой? Если грузят три раза в неделю, то подозреваю что небольшой. ИМХО период усреднения надо меньше срока годности брать. Иначе проблема спрячется внутри усреднения.Основная категория товаров - 5 дней ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2017, 14:30 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
я имел дело с несъедобными вещами, так что эти нюансы от меня скрыты ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.04.2017, 16:07 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ММало картнок нашёл. Слева -- подневный прогноз, забыл перевернуть. Фактическая динамика - малиноввая линия, январь давнишнего года. Может показаться, чтоона хаотичная, однако она = сумме нескольких составляющих, в к-рых видны недельные циклы. Синяя линия - прогнозная (тут секрет в том, что прогноз уточняется по мере продаж) Близкая к ней тёмно-цианистая - сглаженная фактическая, усреднение по 11 точкам, с 20-го дня они расходятся. Кстати ведь никакая регрессия не заставит реальность ей подчиняться) Здесь нету, но на деле ввсегда видны всплески и провалы спроса в районе праздников. Этот эффект достаточно похож на эффект от акций. Когда есть почасовые данные, всё аналогично. справа -- другая предикция. Для 100 разнородных единиц на начальной стадии продаж, и не регрессией, а на основе простой формулы агрегирующих показателей, потому-то они все целочисленные. Но здесь не сама формула, здесь зависимость фактической продажи от величины стартового прогноза на стадии продаж ~2%. Внизу -- как может выглядеть распределение спроса в завис-сти от цены (шкала X нелинейная). Я это к тому, что горбатость может меняться туда-сюда, однако форма распределения остаётся узнаваемой. Благодаря этому и можно было грубо прогнозировать также и без регрессий. Как у вас, не знаю. Ну вот, мож что-то из этого вдруг поможет. Мне кажется , что надо подробнее рассмотреть отдельно на отгрузку и возврат. Они должны коррелировать и с небольшим сдвигом фазы, и подозреваю, чьо передаточная функция может помочь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.04.2017, 13:26 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Возникает вопрос ... там где акции, сезонность не возможно приблизительно спрогнозировать прирост. Если брать прирост с прошлого года, то не всегда может совпасть с эмпирическими данными. Рынок не предсказуемый. Предлагаю добавить рынку немного предсказуемости, но это конечно зависит от данных. У меня пока немного есть возможности, у кого игрушка - смартфон, а у меня эта самая предсказуемость, в к-рую я давно не играл. Как я понял наиболее непонятны 2 вопроса: оценка акций и очищенная динамика спроса, т.е. тот самы й рынок? Акции - отдельная фигня, конечно, если источник акций будет магаз, то тут стоит ещё подумать. А для рынка можно для упощения изменить постановку. Имеем сферический склад, на к-рый в "рваные" моменты времени поступает сферический товар. В промежутках со склада непрерывно идут отгрузки. Их динамика = - (очищенная динамика спроса). Т.о. в течение промежутка времени запас на складе непрерывно уменьшается (изменяется) до следующего момента времени. Остаток от предыдущей поставки = возврату. Если нет принципиальных возражений по постановке, то дальше всё достаточно просто. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.04.2017, 18:22 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ИМХО: 1. Надо добавить разрез магазинов и анализировать по каждому отдельно. Сделать рейтинг магазинов, вычислить те которые злоупотребляют возможностью вернуть просроченный товар. 2. Раз товар скоропортящийся, то учитывать дни недели: выходные и праздники, а также дни поставки, т.е. на сколько дней запас создается. Как понимаю это продукты питания, а по выходным и праздникам люди дома больше времени проводят, т.е. на выходные покупают больше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.04.2017, 19:11 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
exp98Вот кстати, если ряд делать по дням, то пофиг ск. раз в неделю отгрузки. Тем более, что сглаживание умеет интерполировать, если взять достаточную окрестность. И да, её стоит брать НЕ кратной неделе: 11, 9 или 5 точек. Почему не кратной неделе? А агрегировать рез-т по неделям.Думаю, по неделям будем достаточно Но всё равно удельные характеристики полезно тоже смотреть: и кол-во поставок /недВы имете в виду знаменателе число 7? и ср. объём за поставку.Чем полезен будет это показатель? Скажем, объемы поставок по SKU могут варьироваться. Распределение по ценовым диапазонам тоже полезно.Тогда методика прогноза по шт и в рублях будет немного отличаться. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 09:59 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Dima TИМХО: 1. Надо добавить разрез магазинов и анализировать по каждому отдельно.Так то логичнее возможно. Если потом просуммировать, то объемы могут отличаться, если прогнозировать в более крупные агрегаты (например, по городам, по типам ТТ и т.д.) Сделать рейтинг магазинов, вычислить те которые злоупотребляют возможностью вернуть просроченный товар.Для чего рейтинг? Для кластеризации? 2. Раз товар скоропортящийся, то учитывать дни недели: выходные и праздники, а также дни поставки, т.е. на сколько дней запас создается. Как понимаю это продукты питания, а по выходным и праздникам люди дома больше времени проводят, т.е. на выходные покупают больше.Бывает ситуация наоборот, смотря где находится ТТ в спальном раойне или там где бизнес центры. Но это характерно для расчета автозаказа. А тут прогнозируется на недели, на месяцы вперед. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 10:08 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ferzmikk, я магией не занимаюсь (хотя и интересуюсь тоже). Вообще я пока рассуждал по сетевым магазам, теперь думаю, что здесь ситуация другая. Для начала надо определиться, что улучшаем, чтб было что сравнивать (и с акциями аналогично). Не стоит сразу объять необъятное, нащупывание удачного метода, как раз удобно начать с "чистых" и понятных частных случаев, после чего может быть не останется непонятных. Или "сверху вниз", как сейчас я предполагаю, т.е. общие продажи, и один сферический склад. Как понял я, из входных данных имеем 2 временных ряда: поставки и отгрузки. Или продажи тоже на входе? Кстати не забыть бы про запаздывание учёта. Дата - это дата события или дата внесения в БД? Пока интересует пара рисунков из эксэла, надеюсь, что не секрет например: - точечная диаграмма зависимости числового ряда возвратов от ряда поставок - линейчатый график корреляционной функции Ф(dt)= коррел( X(t) ; Y(t+dt) ) , где t - дни, X() - поставки, Y() - ВВ, dt - сдвиг ВВ по дням Если на них не наблюдается достаточной детерминации, то мой ход мысли придётся менять. И может оказаться, что одним только прогнозом ничего не улучшить, и надо менять рабочие процессы. Например вдруг потом окажется, что на новую логистику уйдёт прорва бензина, к-рая перекроет всю экономию прогноза. Это вопрос не для одного только проргнозиста. Как имерять апостериорную ошибку прогноза, оборотом, валовой прибылью на всю контору - и хрен с ними с отдельными магазами, или прибылью, улучшенной равномерно по каждой "ячейке детализации"? и т.д. Неделя - это известный в торговле цикл. Интервал сгаживания взять другой, ну хотя бы чтоб периодические деффекты метода не принять за цикличность, тогда они скажутся не в каждом периоде. Вот ещё непонятно, точки отсчёта временного ряда возвратов наверняка не один в один с поставками. Интересуют и другие инварианты. Наверняка существует "недельный профиль" - устойчивое распределение чего-нить по дням недели, но это для конца уже, чтоб на плавную кривую накладывать. Обобщённо сперва на всю контору и на весь сферический магаз. Нечто аналогичное и для акций потом. Шт. vs rub - моё мнение, если это не поштучный эксклюзив, а массовый спрос типа ТПС, то удобнее прогнозировать рубли. Цену вы и так знаете, так что шт. потом вычисляются (с проверкой конечно на вшивость). - ср. объём за поставку/неделю - объемы поставок по SKU могут варьироваться У Вас кол-во поставок в неделю меняется, а так будет та самая нормализация. Пока всё, без фактических картинок ничего существеннее не скажу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 11:45 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
exp98Синяя линия - прогнозная (тут секрет в том, что прогноз уточняется по мере продаж)Уточняется по мере продаж это как? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 12:19 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
Придется потратить не мало времени на то, чтобы вспомнить курс статистики, методы, статистические показатели, почитать и по экспериментировать, учесть нюансы продукта, рынка, схема отгрузок и т. д. И понять какие поля необходимы и каким должен быть алгоритм для прогнозирования. А потом все запрограммировать и при этом в меню можно выбирать некие параметры. У каждой компании свои нюансы для прогнозирования. Понятно, что это дело не простое и длительное по времени: надо учесть не мало факторов, написать сложную математическую модель, максимально оцифрованная от конкретной практической ситуации, и со временем дополняющая, и важно еще учесть всевозможные риски. Для разработки модели следует определиться с необходимыми данными. Выгружаются данные как во вложенном файле. Там описана структура полей. По поводу каждого поля. 1. Поля как признаки "ТТ" и "SKU", "Дата" по умолчанию нужны. Надо учесть, что какие то SKU прекращают свой выпуск, какие появляются. Но у новой SKU историчности нету. Возможно, брать историчность той SKU, которая похожа по физическим свойствам на новое SKU. Но не факт, что будет отгружаться как подобная, даже если поддерживать промо о новинке. А если новая ТТ?!! То тут сложнее. Подбирать ту ТТ по физическим параметрам нет смысла. Магазин магазину рознь, и не важно сеть ли это. 2. Поле как признак"Акционный объем" хотим внедрить. Если отсеивать акционные объемы, то можно не использовать сглаживание против акционных объемов. Вопрос тут в другом, могут остаться значительные непонятные приросты, пустоты. То есть акционные объемы осекаются, и будет пусто, будто не было продаж. Это надо как то правильно учесть. Или в новом поле какую то логику прошить. 3. Поля как признаки"Тип ТТ", "Категория Объема" "Асортиментный список" как дополнительные для кластеризации. Единственно нужно определить порядок и сочетание кластеризации. Потом агрегация, например, если без кластера,то прогноз расчитывается по SKU и ТТ, потом суммируется по клиентам, по городам. Если с кластерами, то прогноз в каком то сильном кластере, потом суммируется по городам городам. Учел бы еще такой фактор как значимость и/или стабильность данных. То есть для значимости это ABC-анализ, а стабильность это XYZ-анализ. По каждому кластеру делать прогноз. А также убедиться что поле может иметь значительное различие между кластерами или нет. Например, если делать прогноз не по ТТ, а по ассортиментному списку, то может получиться так, что прогнозы между группами сильно отличаются или не сильно. Для того чтобы определить дает ли значительное различие от такого поля достаточно сравнить суммы прогнозируемых объемов? Хотя мне вспоминается из курса статистики t-различие. 4. Поле как мера "Продажи шт" по умолчанию нужно. Что касается включить меры "Отгрузки шт" и "Возвраты шт" можно попробовать. Только целесообразно ли. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 12:23 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
exp98ferzmikk, я магией не занимаюсь (хотя и интересуюсь тоже). Вообще я пока рассуждал по сетевым магазам, теперь думаю, что здесь ситуация другая.Есть и сетевые магазины-клиенты Как понял я, из входных данных имеем 2 временных ряда: поставки и отгрузки. Или продажи тоже на входе? Изначально брал Продажи. Вот думаю может лучше Отгрузки и возвраты Кстати не забыть бы про запаздывание учёта. Дата - это дата события или дата внесения в БД?Дата события ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 12:25 |
|
||
|
Вопрос по статистике
|
|||
|---|---|---|---|
|
#18+
ferzmikkУточняется по мере продаж это как? Каким способом, что ли? Завист же от метода прогноза. Например, думали что за квартал будет один объём, а глядь - за месяц лишь полмесяца. Тогда предполагаем, что надо корректировать прогноз/план на кв. либо весь, или же есть веские причины не делать этого. Если о рисунке, то я масштабировал исходную динамику с некоторыми поправками. Вспомним окончание 14-го года, очевидно же было, что случится обвал. Для новой ТТ есть хорошая концепция: типовая ТТ со всеми параметрами типовой. У кого-то есть более достоверные сведения о ней - милости просим. Есть хороший метод - тест, т.е. пробные поставки. Если ТТ сетевая, то у них там они сами по себе бывают типизированы. Со временем её тип переходит в другой. Ну и я-то служил внутри самой сети. Вся математика, что мы и Вы писали, сгодится, если есть, что улучшать. До сих пор неизвестно, что не устраивает, уменьшить ВВ ли, увеличить продажи ли и т.д. А глядя на одинокий временной ряд, можно предложить чё угодно. Посмотреть абстрактно - всё хорошо, рисуем тренд и тчк. Я как раз предположил попробовать отыскать какие-нить инварианты. Для начала на глазок. Метод главных компонент потом уже только применять. Да и все эти стат. проверки гипотез нафиг не нужны, если точность совокупности рабочих процессов не снизится ниже 20%. В первом посте Вы писали про непредсказуемость данных. На данных если - что именно не так предсказывается и насколько не так. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2017, 15:40 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=39445693&tid=1340416]: |
0ms |
get settings: |
7ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
186ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
62ms |
get tp. blocked users: |
1ms |
| others: | 213ms |
| total: | 501ms |

| 0 / 0 |
