Тяпничный поиск товаров по набору атрибутов / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Тяпничный поиск товаров по набору атрибутов

25 сообщений из 61, страница 2 из 3

все

Тяпничный поиск товаров по набору атрибутов

#39369291

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Akina mayton , давай посчитаем...

Список на 10к товаров. У каждого товара есть несколько характеристик (если посмотреть на том же яндекс-маркете, то в среднем у категории товара их там 20-30, редко более полусотни). К тому же крайне редко попадается характеристика с очень уж обширным диапазоном значений, лично я не видал ни одной, в которой количество значений превосходило бы 64 (или хотя бы приближалось к нему). Но если брать по максимуму... пусть 20к товаров по 50 характеристик, кодирование которых требует 64 битов, это получится порядка сотни мегабайт. Не самый большой объём. А с учётом того, что таблица строго RO - грузим копию таблицы в память, и вот тебе уже минус дисковая подсистема и прирост скорости.
Несколько дополнений. Действительно у товара обычно не более полусотни уникальных характеристик.
Но ваше предположение о том что в целой категории товаров (телевизоры, холодильники) 50 характеристик - неверно.
Технологии меняются каждые 2-3 года и новые характеристики добавляются к новым товарам (SmartTv=true),
а старые постепенно уходят (VGA разъем=true).

...

Рейтинг:

0 / 0

17.12.2016, 16:45:34

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369293

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Далее. Стопудово у тебя уже есть статистики. Нас интересуют две. Первая - это частота использования той или иной характеристики для фильтрации. Вторая - это селективность характеристики. Это я к чему? к тому, что индексировать по всем возможным совокупностям характеристик - занятие совершенно безнадёжное, но вот выделить основные группы, индексация которых даст значительный эффект (частая применимость и высокая селективность) нужно. Очень желательно, если данных хватит, выделить пары, а то и тройки, самых востребованных групп характеристик для составных индексов. Индекс из совокупности более чем 3 полей, мне кажется, будет маловостребован, и будет работать исключительно префиксом из 2-3 полей - а тогда нафига козе баян?
Я согласен насчет селективности. Но такую характеристику как частота использования мы никак не можем
детектировать. Собственно... это маркетинговая информация которая у нас появится уже в фазе эксплуатации
магазина. Поэтому сейчас мы не можем ее использовать как 100% надежного актора. Хотя заложить в поисковой
механизм популярные checkbox мы можем.

Далее. Индекс из более чем 3х полей - важен и нужен. Это я вам говорю как регулярный клиент магазинов электроники.
И поскольку мы не можем на данном этапе определить маркетинговые свойсвта (или преимущеста) одного атрибута
над другим то я все-таки предлагаю индексировать все.

...

Рейтинг:

0 / 0

17.12.2016, 16:51:07

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369295

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

AkinaЧто имеем в итоге. Работа чисто в памяти, индексный отбор достаточно высокой селективности, и всё это на сравнительно небольшом объёме данных. Не думаю, что скорость работы будет такова, что у посетителей будут поводы для недовольства, даже если использовать "младшие" СУБД (во всяком случае MySQL из лампы должен летать, хотя я бы рекомендовал собирать систему самостоятельно, а не ставить готовый комплекс, начальная настройка делается один раз), просто сервер БД нужно будет настроить должным образом, чтобы он не испытывал проблем ни с памятью под Memory-таблицы, кэш индексов и буферы сортировки, ни с количетсвом процессорного времени. А если претензии по скорости будут - то это будут претензии не к СУБД, а к другим компонентам системы.

Я не знаю - что значит собирать систему самостоятельно. Это - покупка VPS ? И установка вручную PHP, Apache, MySQL?

...

Рейтинг:

0 / 0

17.12.2016, 16:53:20

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369315

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

AkinaDima TХЗ за что его так не любят. План для простых запросов быстро строится.Планировщик - он один на инстанс сервера, и работает в одном потоке. При большом потоке запросов он запросто может стать узким местом.
Мой пример 20011643 можно к параметризованному свести, в итоге будет не более сотни видов запросов типа такого

Код: sql

1.
2.
3.
4.
5.
6.
7.

select tov_id from (
	select distinct tov_id from Attribute where val_id = @p1
		union all (select distinct tov_id from Attribute where val_id in (@p2, @p3))
		union all (select distinct tov_id from Attribute where val_id in (@p4, @p5, @p6))
	) T
	group by tov_id
	having count(*) = 3

т.е. при генерации запроса ставить сначала категории с одной галкой, затем с двумя и т.д.

PS Сразу не сообразил что cat_id в запросе лишний и дублировать его не надо в таблицу Attribute.

...

Рейтинг:

0 / 0

17.12.2016, 18:11:13

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369318

mini.weblab

Участник

Сообщения: 988

Рейтинг: 0 / 0

20011643
Если честно не вижу тормозов с классической реляционной структурой.
...
А дальше выбираем таким запросом

хорошая оптимизация. почти готовый продукшн

...

Рейтинг:

0 / 0

17.12.2016, 18:19:40

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369320

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TЕсли честно не вижу тормозов с классической реляционной структурой.
Накидал по-быстрому

ТаблицаОписаниеCategoryСправочник категорийValueЗначения внутри категорииTovarСправочник товаровAttributeПривязка товаров к значениям
Для ускорения выборок небольшая денормализация: продублировал cat_id из Value в Attribute

Хм... моя модель вышла более скромной. 3 таблицы. Где-то я просчитался?

...

Рейтинг:

0 / 0

17.12.2016, 18:21:34

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369322

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TА дальше выбираем таким запросом

Код: sql

1.
2.
3.
4.
5.
6.
7.

select tov_id from (
	select tov_id, cat_id from Attribute where val_id = 1
		union (select tov_id, cat_id from Attribute where val_id in (3, 5))
		union (select tov_id, cat_id from Attribute where val_id = 7)
	) T
	group by tov_id
	having count(*) = 3

Не думаю что с твоими объемами будет дольше 10 мс выборка идти. Тем более что запрос отлично параллелится.

Хм... из личного опыта. Запросы с group by ... having всегда работали тяжело и не в OLTP-стиле.

По поводу параллелизма. Для обыкновенных DBMS он остаётся мифом. Практически очень мало
запросов могут в explain plan выдать признаки параллелизма. Только Oracle при условии что
таблицы были создани о опцией partitioning или с хинтом +parallel могут генерировать запуск
map-reduce процессов для генерации выборки. Для других dbms - я не вкурсе но у меня
есть предположения что параллелизм остаёся несбыточной мечтой.

...

Рейтинг:

0 / 0

17.12.2016, 18:27:59

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369323

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TПро размер:
Предположим в среднем 50 атрибутов на товар, тогда по размеру Attribute получится примерно 500 000 записей, 16 байт на запись итого 8 Мб.

Можно затестить, надо только генератор данных сделать
Разрази меня гром. Я не понимаю как ты посчитал про 8 мегабайт. Здесь оценки можно уверенно дать
только после моделирования. Опции хранения - это самая загадочная часть dbms и здесь я-бы не стал
делать прогнозы.

По поводу генерации данных. Это больной вопрос. Забегая вперед я даже скажу что он на 60%-80% определяет
саму постановку. Тоесть эффективность решения нашей задачи не столько зависит от формул или технологий
сколько от гистограммы наших данных и характера нагрузки.

По сабжу я пока решил сделать так. Я нагуглил штук 10 магазинов стройматериалов и скачал их прайсы в виде
xls, и думаю что если их обработать и загрузить то будет вполне себе нормальный набор для тестов.

...

Рейтинг:

0 / 0

17.12.2016, 18:32:19

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369326

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TДавай прикинем: допустим очень дотошный пользователь натыкает фильтр по 10 категориям, под одну 80% товаров, под другую 20% и т.д. Думаю в среднем 30-50% товаров на категорию, тогда 10*50%=500% товаров в конечной выборке, или 10000*500% = 50 000 записей. Как-то ни разу не дофига.
В данной задаче я надеюсь что мы придем к мысли что нужен custom-алгоритм и структура данных для кеша
характеристик товаров. Но перед тем как мы к этому придем нужно сначала взять MySQL/PG и выжать ее как лимон.
Тоесть понять на какие цифры можно расчитывать. Для простоты будем считать что данные даже лежат в буферном
кеше блоков.

Тоесть даже дисковый IO мы уберем из нашей формулы.

...

Рейтинг:

0 / 0

17.12.2016, 18:36:13

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369330

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonХм... моя модель вышла более скромной. 3 таблицы. Где-то я просчитался?
Таблица PROD_ATTRS как понимаю у тебя не нормализована. Твой ATTR_NAME надо в отдельную таблицу ATTRIBUTES, а сюда ATTR_ID.
Раз по ТЗ все галочками, то ATTR_VALUE вообще не надо. У тебя два значения TRUE/FALSE, TRUE есть запись в PROD_ATTRS, FALSE - нет записи.

У меня Category это категории характеристик (Диагональ, Разрешение и т.д.) а у тебя как понимаю группа товаров (Телевизор, Холодильник и т.д.) это надо добавить для наполнения базы, но я это вообще не рассматривал, т.к. вопрос о поиске.

...

Рейтинг:

0 / 0

17.12.2016, 18:42:43

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369331

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dimitry SibiryakovЭто очень упрощает задачу. Главная таблица связи товаров с их характеристиками упрощается, поскольку значение характеристики представлено одним полем-ссылкой на справочник групп. Критерии в поисковом запросе сводятся к "Тип_характеристики=? and Группа_значения=?", что покрывается индексом. Отсутствие having в запросе позволяет нечёткий поиск по релевантности.
Хм... мне не очень нравится постановка нечеткого поиска. Я как клиент интернет магазинов
желаю точный поиск. К примеру я указал что я ищу зеркальный фотик где производитель никон
и матрица в 24 мегапиксела и я хочу получить список именно из этих позиций товара без всяких
посторонних похожих.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.

[x] Nikon
[ ] Kodak

[ ] 16 Mpix
[ ] 20 Mpix
[x] 24 Mpix

[ ] SuperZoom
[x] Reflex

...

Рейтинг:

0 / 0

17.12.2016, 18:43:20

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369333

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

MasterZivDima TMasterZiv, внимательнее на структуру посмотри, там все уже есть и дополнительно ничего не надо.
Все решается тем запросом, который я написал. Запрос строится динамически.

А, так это у тебя не классическая схема, а наоборот.
Я прочитал "классическая", и дальше не глядел даже :-)
Коллеги!

Я предлагаю не спекулировать термином классического или не классического .

Есть LAMP. И есть база с товарами. Надо извлекать товары как можно быстрее.

...

Рейтинг:

0 / 0

17.12.2016, 18:46:48

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369334

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TAkinaпропущено...
Планировщик - он один на инстанс сервера, и работает в одном потоке. При большом потоке запросов он запросто может стать узким местом.
Можно конкретики: где именно он однопоточный? О каком сервере речь? Я честно сознаюсь что в эту тему никогда не вникал, но не вижу проблем сделать его многопоточным. Тут нет ничего требующего однопоточности. План строится на статистиках, а они не очень меняются, да даже если и меняются и план будет построен на предыдущей статистике, то это просто проблема одного конкретного запроса.
Здесь я - пас. Я не знаю какие планировщики в LAMP.

Если вы смоделируете узкое место в optimizer - буду рад.

...

Рейтинг:

0 / 0

17.12.2016, 18:49:05

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369335

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

AkinaDima Tв ТЗ было по другомуНу тогда берём любую СУБД с олапкой - самая для него задача.
Хм... ну попробуйте найти такую любую.

Насколько мне известно OLAP бывает разных под-типов. И тот который (R)OLAP (реляционный OLAP) по сути
является программной надстройкой над обычной DBMS и я сильно сомневаюсь что эта надстройка
будет эффективнее чем наш поиск по EAV.

А коробочные решения OLAP - обычно дороги и требуют большой сноровки в изначальной конфигурации.

Может кто-либо из вас похвастаться что он конфигурил OLAP-системы под ключ?

...

Рейтинг:

0 / 0

17.12.2016, 18:54:56

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369337

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

SashaMercuryПрошу прощения за оффтоп. Дмитрий, не первый раз встречаю что атрибуты отношений имеют префикс относящийся к имени отношения, но никогда не понимал зачем это. Когда я спрашивал, мне говорили о том, что ребятам элементарно join ить удобно, однако разве кто-то используется JOIN без псевдонимов. В том случае, если один из атрибутов отношения является foreign key то я согласен с тем, что желательно добавить префикс указывающий на имя таблицы, в противном случае, мне до сих пор не понятно, зачем это нужно, видимо в силу малого опыта в области баз данных. Объясни пожалуйста для большинство все так делают, ибо это вопрос уже несколько лет лежит у меня в голове фоном))) Надеюсь что это холивар, если так, то удаляйте сразу мое сообщение, а то основная тема загнется
Это действительно холивар и оффтоп. И лучше эту тему поднять отдельным топиком.

...

Рейтинг:

0 / 0

17.12.2016, 18:58:32

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369339

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonХм... из личного опыта. Запросы с group by ... having всегда работали тяжело и не в OLTP-стиле.
Не уверен что так происходит, но тут после выборок подзапросов серверу можно снимать блокировки с рабочей таблицы, сливать результат union во временную таблицу и group by делать по ней. Про тяжесть уже писал, group by по 50к записей это не много.
maytonПо поводу параллелизма. Для обыкновенных DBMS он остаётся мифом. Практически очень мало
запросов могут в explain plan выдать признаки параллелизма.
В данном случае имеем как раз то что параллелится, несколько подзапросов объединенных через union, каждый можно выполнять независимо от других. Это редкий случай когда есть что параллелить.

Можно написать так чтобы не параллелилось

Код: sql

1.
2.
3.

select distinct tov_id from Attribute where val_id = @p1 
		and tov_id in ((select tov_id from Attribute where val_id in (@p2, @p3)
				and tov_id in (select tov_id from Attribute where val_id in (@p4, @p5, @p6)))

group by тут не надо, в промежуточных таблицах много данных не возникнет, но это не параллелится.

...

Рейтинг:

0 / 0

17.12.2016, 19:01:41

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369350

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonDima TПро размер:
Предположим в среднем 50 атрибутов на товар, тогда по размеру Attribute получится примерно 500 000 записей, 16 байт на запись итого 8 Мб.

Можно затестить, надо только генератор данных сделать
Разрази меня гром. Я не понимаю как ты посчитал про 8 мегабайт. Здесь оценки можно уверенно дать
только после моделирования. Опции хранения - это самая загадочная часть dbms и здесь я-бы не стал
делать прогнозы.
Все просто: таблица Attribute это привязка товара к галочке. Т.е. чтобы товар "ТВ Gnusmas 40" FullHD" найти галочками, то надо этот товар привязать к двум Value, т.е. 39"-43" и FullHD. Это две записи в таблицу Attribute.
Ты написал что товаров 10000, Akina 20009771 предположил что привязок не более 50 на товар, вот я и прикинул 50*10000.

maytonПо поводу генерации данных. Это больной вопрос. Забегая вперед я даже скажу что он на 60%-80% определяет
саму постановку. Тоесть эффективность решения нашей задачи не столько зависит от формул или технологий
сколько от гистограммы наших данных и характера нагрузки.

По сабжу я пока решил сделать так. Я нагуглил штук 10 магазинов стройматериалов и скачал их прайсы в виде
xls, и думаю что если их обработать и загрузить то будет вполне себе нормальный набор для тестов.
Выделение характеристик и привязку к ним кто будет делать? Жопа в этом, написания в прайсах не нормализованы, я про ИИ потому и писал что сложная это работа выделять характеристики и привязывать к ним.

...

Рейтинг:

0 / 0

17.12.2016, 19:14:54

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369351

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TНе уверен что так происходит, но тут после выборок подзапросов серверу можно снимать блокировки с рабочей таблицы, сливать результат union во временную таблицу и group by делать по ней. Про тяжесть уже писал, group by по 50к записей это не много.

Ну... я еще раз акцентирую внимание на том что пользователь нашего API это праздный клиент.
Который может рассеянно кликать-кликать на один и тот-же checkbox просто "по приколу".
Таков он есть. А мы на каждый его клик будем создавать временную таблицу?

По поводу 50k записей я погорячился. Может их будет даже меньше. Но в любом случае
желательно убрать из стека такие операции как write temporary table при формировании
курсора.

...

Рейтинг:

0 / 0

17.12.2016, 19:15:34

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369352

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TВсе просто: таблица Attribute это привязка товара к галочке. Т.е. чтобы товар "ТВ Gnusmas 40" FullHD" найти галочками, то надо этот товар привязать к двум Value, т.е. 39"-43" и FullHD. Это две записи в таблицу Attribute.
Ты написал что товаров 10000, Akina 20009771 предположил что привязок не более 50 на товар, вот я и прикинул 50*10000.

А ну ОК.

Выделение характеристик и привязку к ним кто будет делать? Жопа в этом, написания в прайсах не нормализованы, я про ИИ потому и писал что сложная это работа выделять характеристики и привязывать к ним.
Да это сложная работа. И я думаю она пойдет отдельным топиком. Подключу энтузиастов к парсингу.
А кто распарсит быстрее всех - пополню телефончик.

...

Рейтинг:

0 / 0

17.12.2016, 19:18:08

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369355

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonDimitry SibiryakovЭто очень упрощает задачу. Главная таблица связи товаров с их характеристиками упрощается, поскольку значение характеристики представлено одним полем-ссылкой на справочник групп. Критерии в поисковом запросе сводятся к "Тип_характеристики=? and Группа_значения=?", что покрывается индексом. Отсутствие having в запросе позволяет нечёткий поиск по релевантности.
Хм... мне не очень нравится постановка нечеткого поиска. Я как клиент интернет магазинов
желаю точный поиск. К примеру я указал что я ищу зеркальный фотик где производитель никон
и матрица в 24 мегапиксела и я хочу получить список именно из этих позиций товара без всяких
посторонних похожих.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.

[x] Nikon
[ ] Kodak

[ ] 16 Mpix
[ ] 20 Mpix
[x] 24 Mpix

[ ] SuperZoom
[x] Reflex

Сибиряков прав: если сначала выдать то что совпадает по всем трем характеристикам (count(*) = 3), затем по двум, то никому хуже не будет. Покупатель в начале увидит то что просил, но дальше вполне может оказаться близкое, но то что не просил. Возможно оно больше его устроит по каким-то пятым свойствам не упомянутым в фильтре.

...

Рейтинг:

0 / 0

17.12.2016, 19:23:40

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369358

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima TСибиряков прав: если сначала выдать то что совпадает по всем трем характеристикам (count(*) = 3), затем по двум, то никому хуже не будет. Покупатель в начале увидит то что просил, но дальше вполне может оказаться близкое, но то что не просил. Возможно оно больше его устроит по каким-то пятым свойствам не упомянутым в фильтре.
Я приму это как доп-фичу. Но основной business-req. должен звучать именно как точный поиск по
атрибутам товара.

...

Рейтинг:

0 / 0

17.12.2016, 19:31:30

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369359

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonDima TНе уверен что так происходит, но тут после выборок подзапросов серверу можно снимать блокировки с рабочей таблицы, сливать результат union во временную таблицу и group by делать по ней. Про тяжесть уже писал, group by по 50к записей это не много.

Ну... я еще раз акцентирую внимание на том что пользователь нашего API это праздный клиент.
Который может рассеянно кликать-кликать на один и тот-же checkbox просто "по приколу".
Таков он есть. А мы на каждый его клик будем создавать временную таблицу?
Я не про временную в терминологии БД, давай назовем ее промежуточной.

Вобщем я о том что сервер сначала сделает

Код: sql

1.
2.
3.

	select distinct tov_id from Attribute where val_id = @p1
		union all (select distinct tov_id from Attribute where val_id in (@p2, @p3))
		union all (select distinct tov_id from Attribute where val_id in (@p4, @p5, @p6))

сохранит результат куда-то во временную/промежуточную таблицу T, затем выполнит

Код: sql

1.
2.
3.

select tov_id from  T
	group by tov_id
	having count(*) = 3

Результат вернет клиенту, а T удалит.

...

Рейтинг:

0 / 0

17.12.2016, 19:34:20

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369362

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Вот модель, которую я накрапал в четверг. Она отражена в скриншоте с Modeller.

Дима. К тебе просьба оценить разницу между твоей и моей моделью. Может я чего-то недосказал
или наоборот ты глубже сделал нормализацию.

Вобщем хотелось бы прояснить почему у нас число таблиц разное.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.

DROP TABLE PROD_ATTRS;
DROP TABLE PRODUCTS;
DROP TABLE PRODUCT_CATEGORIES;

DROP SEQUENCE PRODUCT_CATEGORIES_SEQ;

CREATE SEQUENCE PRODUCT_CATEGORIES_SEQ;

CREATE TABLE PRODUCT_CATEGORIES(
 CAT_ID        NUMBER PRIMARY KEY,
 CAT_NAME      VARCHAR2(255) UNIQUE NOT NULL,
 PARENT_CAT_ID NUMBER
);

DROP SEQUENCE PRODUCTS_SEQ;

CREATE SEQUENCE PRODUCTS_SEQ;

CREATE TABLE PRODUCTS(
 PROD_ID       NUMBER PRIMARY KEY,
 CAT_ID        NUMBER NOT NULL,
 PROD_CODE     VARCHAR2(60) UNIQUE NOT NULL,
 NAME          VARCHAR2(255) UNIQUE NOT NULL,
 DESCRIPTION   VARCHAR2(4000),
 PRICE         NUMBER NOT NULL,
 WEIGHT        NUMBER(5,2) CHECK (WEIGHT >= 0),
 STOCK_REMAINS NUMBER DEFAULT 0
);

ALTER TABLE PRODUCTS ADD CONSTRAINT PRODUCTS_FK FOREIGN KEY(CAT_ID) REFERENCES PRODUCT_CATEGORIES(CAT_ID);

CREATE TABLE PROD_ATTRS(
 PROD_ID       NUMBER,
 ATTR_NAME     VARCHAR2(255) NOT NULL,
 ATTR_VALUE    VARCHAR2(255)
);

CREATE UNIQUE INDEX PROD_ATTRS_PK ON PROD_ATTRS(PROD_ID,ATTR_NAME) COMPRESS 1;

ALTER TABLE PROD_ATTRS ADD PRIMARY KEY(PROD_ID,ATTR_NAME) USING INDEX;

ALTER TABLE PROD_ATTRS ADD CONSTRAINT PROD_ATTRS_FK FOREIGN KEY(PROD_ID) REFERENCES PRODUCTS(PROD_ID);

...

Рейтинг:

0 / 0

17.12.2016, 19:35:04

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369363

Akina

Участник

Откуда: Зеленоград, Москва, Россия

Сообщения: 20 644

Рейтинг: 0 / 0

maytonИндекс из более чем 3х полей - важен и нужен. Это я вам говорю как регулярный клиент магазинов электроники. И поскольку мы не можем на данном этапе определить маркетинговые свойсвта (или преимущеста) одного атрибута над другим то я все-таки предлагаю индексировать все.Это может быть важно со стороны клиента или там маркетолога. Который где-то в чём-то другом, конечно, умный, но вот в SQL он ноль без палочки. На предлагаемой системе индекс даже из трёх атрибутов будет крайней редкостью, в большинстве своём будут индексы из 2 атрибутов, и то далеко не все атрибуты охвачены. Диски имеют конечный объём, а количество индексов растёт факториально. Зачем создавать индекс, который будет использован 1 раз в месяц с вероятностью в 65%?

...

Рейтинг:

0 / 0

17.12.2016, 19:38:48

| Ответить | Цитировать | Написать

Тяпничный поиск товаров по набору атрибутов

#39369372

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonДима. К тебе просьба оценить разницу между твоей и моей моделью. Может я чего-то недосказал
или наоборот ты глубже сделал нормализацию.
Это та же картинка только текстом. Картинкой понятней. Хоть чуть-чуть поясни какая таблица что содержит. Я тут 20016306 уже пытался гадать что к чему, пока добавить нечего.

Давай конкретный пример рассмотрим:
Товар "ТВ Gnusmas 40" FullHD" надо привязать к галочкам 39"-43" и FullHD

Как это сохранится в твоей БД?

У меня будет так:

Tovar
tov_idtov_name1ТВ Gnusmas 40" FullHD
Category
cat_idcat_name2Диагональ3Разрешение
Value
val_idcat_idval_name4239"-43"53FullHD
Attribute
tov_idval_id1415

...

Рейтинг:

0 / 0

17.12.2016, 19:51:27

| Ответить | Цитировать | Написать

25 сообщений из 61, страница 2 из 3

все

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Тяпничный поиск товаров по набору атрибутов

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&msg=39369331&tid=1340536]:	0ms
get settings:	7ms
get forum list:	15ms
check forum access:	3ms
check topic access:	3ms
track hit:	63ms
get topic data:	11ms
get forum data:	3ms
get page messages:	63ms
get tp. blocked users:	2ms
others:	231ms

total:	401ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы