
Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
26.01.2015, 08:21:20
|
|||
|---|---|---|---|
Фильтрация экстремальных данных |
|||
|
#18+
Нужно в некотором наборе чисел отбросить "сильно большие" данные, причем "сильно большие" понятие относительное остальных чисел. Например, есть магазин с некоторым ассортиментом товаров. Нужно найти средние продажи по товару за месяц. Но один или несколько товаров могли быть куплены большими партиями. Т.е. кто-то разово купил за раз столько, сколько обычно продаётся целый месяц, соответственно среднее считается неверно. Надо отбросить такие данные. Подскажите, в какую сторону копать, может кто знает название метода из мат. статистики, чтобы можно было погуглить. ЗЫ: задача регается на MS SQL Server 2008R2 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
26.01.2015, 08:26:02
|
|||
|---|---|---|---|
Фильтрация экстремальных данных |
|||
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
26.01.2015, 10:33:26
|
|||
|---|---|---|---|
Фильтрация экстремальных данных |
|||
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
26.01.2015, 12:16:09
|
|||
|---|---|---|---|
Фильтрация экстремальных данных |
|||
|
#18+
Dima T, Спасибо, я видимо матан забыл окончательно, раз даже про правило 3-х сигм забыл. В MSSQL даже есть статистические функции для вычисления среднеквадратического отклонения: STDEV, STDEVP FishHook, спасибо. Уже решил через среднеквадратическое отклонение. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=16&mobile=1&tid=1341104]: |
0ms |
get settings: |
7ms |
get forum list: |
17ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
56ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
42ms |
get tp. blocked users: |
2ms |
| others: | 200ms |
| total: | 346ms |

| 0 / 0 |
