|
|
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
простите за заголовок, не знаю, как еще это компактно описать. Суть: от дистрибьюторов приходят данные продаж в совершенно разных форматах. По этим данным затем необходимо построить ОЛАП-куб. Например, привычные нам факты: Client Product Date Amount SummaИванов Помидоры 2019.01.02 100 50Петров Огурцы 2019.02.03 200 30Сидоров Капуста 2019.03.04 150 80 у дистрибьюторов могут выглядеть так: Client Product 2019.01.01 2019.01.02 2019.01.03 ... 2019.02.01 2019.02.02 2019.02.03 ... 2019.03.04 Amount Иванов Помидоры 100 Summa Иванов Помидоры 50 Amount Петров Огурцы 200 Summa Петров Огурцы 30 Amount Сидоров Капуста 150 Summa Сидоров Капуста 80 И это еще далеко не самый трешовый вариант. К тому же наименования полей могут быть в совершенно свободном стиле. Состав и их порядок, естественно, тоже. Размер таблиц - сотни мегабайт текстовых данных (сотни тысяч строк, десятки полей) Подскажите, придумало ли человечество машинную обработку таких данных? Чтобы на выходе получить нормально заполненную т.фактов для анализа. Или необходимо сначала руками приводить все в человеческий вид? Краем уха слышал про DataMining. Но это кажется не то. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 02:47 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
Надо связываться с IT службой "дистрибьютора" и договариваться о формате передаваемых данных. Просто видимо у вас есть выход на некие отчетные формы, а надо копнуть глубже к первоисточнику. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 02:52 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
нуб987, Раз данные приходят, значит это кому-то нужно и кто-то об этом договаривался... Просто установите требуемый формат для тех, кто отправляет данные. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 02:55 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
нуб987, DataMining это не то, что вам нужно. И способа автоматически все сделать тоже нет. Или дистрибьюторы присылают данные в нужном формате, или вы сами их конвертите в нужный формат. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 02:56 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
КритикРаз данные приходят, значит это кому-то нужно и кто-то об этом договаривался... Просто установите требуемый формат для тех, кто отправляет данные. сейчас как раз занимаюсь этим. Проблема в том, что цепочка связей достаточно длинная. В нее, как принято, входят не совсем компетентные личности, но имеющие определенный статус. При этом чувствую себя дурачком, не знающим "очевидных для всех" вещей в век искусств.интеллекта. Вот и копаю параллельно на тему машинной обработки. А вдруг можно нажать одну кнопку... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 03:15 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
нуб987, На одну кнопку можно нажать, если предварительно обучить своего ИСИНа ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 10:28 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
Jurii, Юрий, вы там со своим когносом совсем с ума не сошли? Чжан Исин, более известен как Лэй - китайский певец и актёр, продюсер, модель, композитор, автор, писатель. Является главным танцором, вокалистом, саб-рэппером южнокорейско-китайской группы EXO. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 14:22 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
Критик, А при чем тут Когнос? К Когносу вроде вопросов нет, пока ничего лучшего в мире не появится для бюджетирования и BI. Термин ИСИН я взял из серии книг Этногенез. Более простую версию ИСИНа я обучаю последние 14 лет, этого достаточно для загрузки файлов разных форматов в хранилище, что требуется автору дискуссии. Более сложные ИСИНы, которые сами создают Хранилища данных, тоже не имеют к Когносу отношения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 19:32 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
нуб987простите за заголовок, не знаю, как еще это компактно описать. Суть: от дистрибьюторов приходят данные продаж в совершенно разных форматах. По этим данным затем необходимо построить ОЛАП-куб. Например, привычные нам факты: Client Product Date Amount SummaИванов Помидоры 2019.01.02 100 50Петров Огурцы 2019.02.03 200 30Сидоров Капуста 2019.03.04 150 80 у дистрибьюторов могут выглядеть так: Client Product 2019.01.01 2019.01.02 2019.01.03 ... 2019.02.01 2019.02.02 2019.02.03 ... 2019.03.04 Amount Иванов Помидоры 100 Summa Иванов Помидоры 50 Amount Петров Огурцы 200 Summa Петров Огурцы 30 Amount Сидоров Капуста 150 Summa Сидоров Капуста 80 И это еще далеко не самый трешовый вариант. К тому же наименования полей могут быть в совершенно свободном стиле. Состав и их порядок, естественно, тоже. Размер таблиц - сотни мегабайт текстовых данных (сотни тысяч строк, десятки полей) Подскажите, придумало ли человечество машинную обработку таких данных? Чтобы на выходе получить нормально заполненную т.фактов для анализа. Или необходимо сначала руками приводить все в человеческий вид? Краем уха слышал про DataMining. Но это кажется не то. Вот https://navicongroup.ru/our_solutions/solution.php?E_ID=3734 На входе разные отчеты от дистров, на выходе - olap куб с анализом всего этого ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2019, 23:39 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
JuriiКритик, А при чем тут Когнос? К Когносу вроде вопросов нет, пока ничего лучшего в мире не появится для бюджетирования и BI. Термин ИСИН я взял из серии книг Этногенез. Более простую версию ИСИНа я обучаю последние 14 лет, этого достаточно для загрузки файлов разных форматов в хранилище, что требуется автору дискуссии. Более сложные ИСИНы, которые сами создают Хранилища данных, тоже не имеют к Когносу отношения. Общепринятые термины - ИИ или искин, иногда говорят искинт, вы же выбрали самый нераспространенный. https://ru.m.wikipedia.org/wiki/Искин Ps судя по упомянутому возрасту, через пару лет ваш искин можно будет замуж выдавать ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.06.2019, 17:29 |
|
||
|
КУЧА разных данных
|
|||
|---|---|---|---|
|
#18+
2 Критик: Общепринятые термины - ИИ или искин, иногда говорят искинт, вы же выбрали самый нераспространенный. https://ru.m.wikipedia.org/wiki/Искин Если общепринятые термины не очень удачны, не звучат, или звучат несолидно (как искин ))), почему бы не ввести более удачный термин? Ps судя по упомянутому возрасту, через пару лет ваш искин можно будет замуж выдавать ) У меня нет искина, есть ИСИН ;) Он в годовалом возрасте мощнее, чем 1000 опытных 30-40 летних ИТ специалистов, поэтому возраст 16 лет не требуется для устройства ИСИНа на работу и для прочих дел ;) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.07.2019, 12:32 |
|
||
|
|

start [/forum/topic.php?fid=49&fpage=14&tid=1857560]: |
0ms |
get settings: |
10ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
38ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
43ms |
get tp. blocked users: |
1ms |
| others: | 13ms |
| total: | 134ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...