Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
29.08.2016, 14:42
|
|||
---|---|---|---|
ANN для классификации большого справочника товаров |
|||
#18+
Как обещал здесь Начали экспериментировать. Цель - раскидать плохо классифицированные товары по группам и брендам. Справочник - более 2500000 наименований (штрихкодов чуть больше, ибо некоторые позиции имеют более одного кода). Откровенно не классифицированных по группам ~900000, остальные позиции с некоторой вероятностью находятся не в тех группах, что надо. Всего групп ~2500 (многие лишние). Нейронная сеть: -- трехслойная -- на вход подаются слова из наименования (распарсенные и сваленные в словарь), часть лидирующих символов штрихкодов (только если валидные ean13, ean8, upc-a, upc-e) и, если есть, бренд. -- на выходе по одной соске на группу -- хидден-слой имеет размерность кратно больше, чем выход. Главные проблемы: -- даже такая дохлая сетка имеет очень большую размерность по синапсам - пришлось резать как можно -- невероятный тормоз при обучении (собственно, на процессе обучения пока и застряли) - едва 40000 наименований в час. Если не считать приведенных выше проблем, предварительные результаты внушают некоторый оптимизм - работает и как правило дает адекватную классификацию (анализировали предварительный выход перед подачей обучающего значения в процессе обучения). ... |
|||
:
Нравится:
Не нравится:
|
|||
|
|
start [/forum/topic.php?fid=33&tablet=1&tid=1547340]: |
0ms |
get settings: |
11ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
41ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
44ms |
get tp. blocked users: |
2ms |
others: | 268ms |
total: | 401ms |
0 / 0 |