|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
какой самый эффективный способ в таком битмапе: 101011101000110 определить, что 1 находится на позициях: 1,3,5,6,7,9,13,14 ? итерацией там аж 2 for + 1 if получается ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 14:29 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 14:35 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Замени один for на таблицу масок. Никак ты не получишь N результатов быстрее чем за O(N). Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 14:36 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
забыл упомянуть, что 64 битами тут не ограничивается строка может иметь более миллиона 0/1 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 15:18 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
ИМХО быстрее всего таблицу использовать из 256 элементов, где каждый элемент это вектор с индексами. Индекс Значение0102130 14250 2......255 0 1 2 3 4 5 6 7 Дальше побайтно прогонять через таблицу. Можно по два байта за раз, тогда таблица будет 65536 элементов. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 15:27 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
а сколько может быть индексов в таком векторе? у меня скорее наоборот - 1 вектор с индексами (но на лям индексов), а не 255 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 16:03 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
1 байт - 8 бит, т.е. в индекс до 2^8 (0...255), в значении до 8 элементов. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 16:06 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухстрока может иметь более миллиона 0/1 Сугубо всё равно, только цикл будет уже по строке, а внутри него куча if-ов по таблице масок. Плюс можно распараллелить по кускам строки. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 16:12 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakovвнутри него куча if-ов И да, по байту будет тормозить, лучше сразу данные держать в uintptr_t. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 16:17 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
ну а так если: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 17:20 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудух, Критерии эффективности? Память, скорость? Ну и с двумя циклами я не понял. Это как? Вроде ваш код с которого начинать надо. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 20:19 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухну а так если Это как бы не битмап вовсе, а строка ноликов и единичек, т.е. 1 байт отображает 1 бит, избыточность в 256 раз. Я бы для начала поковырял откуда это недоразумение взялось и там бы порядок навел. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 20:26 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Dima Tполудухну а так если Это как бы не битмап вовсе, а строка ноликов и единичек, т.е. 1 байт отображает 1 бит, избыточность в 256 раз. Я бы для начала поковырял откуда это недоразумение взялось и там бы порядок навел.+1)) ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 20:54 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Dima T1 байт отображает 1 бит, избыточность в 256 раз. 8 раз. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 21:36 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухну а так если: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
Имхо неэффективно с точки зрения выделения памяти-при разных входных значениях будет теряться разное время на реалллокацию/копирование. Можете промерять время выполения на разных наборах м убедиться. Я бы сделал буфер размером с макс.длину строки и работал бы с ним(записывал/читал бы результат), и никаких stl-классов ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 21:39 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Dima Tизбыточность в 256 раз опять накурился Я бы для начала поковырял откуда это недоразумение взялось и там бы порядок навел. отсюда порядок там не навести можно кое-что улучшить, например, ф-ю в постгрю перенести, чтобы не гонять туда огромный список ID ну и вроде всё. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 21:40 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
L.OtujktdЯ бы сделал буфер размером с макс.длину строки и работал бы с ним(записывал/читал бы результат), и никаких stl-классов вот только операция одноразовая ... |
|||
:
Нравится:
Не нравится:
|
|||
21.08.2019, 21:44 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудух, А ты хитрый манипулятор! С 1 поста было всем очевидно что ты подсчитываешь биты в регистре. Потом мы узнали что "аж до миллиона битов". Потом мы узнали что тебе нормлёк и строковыми операциями посчитать. А потом ты вообще проговорился что дескыть под постгрес да под интернет магазины. Ну что. Может мы сразу это перенесем в Разработку Инфо систем ? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 01:04 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
я спрашиваю здесь, потому что тут самые эффективные алгоритмы ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 01:25 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
данные же не пересекаются написать пиксельный шейдер для видеокарты и оно те распаралелит аутоматом на все конвейеры видеокарты. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 01:47 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухя спрашиваю здесь, потому что тут самые эффективные алгоритмыон прав. Эффективность всегда относительная. Вот нолики и единички в символьном виде передавать неэффективно). Согласись. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 07:16 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Малыхин Сергей, +1)) Можно разбить стринг на куски и потоками пройтись параллельно в кусках. Странная задача, поэтому лень думать. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 07:19 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудух отсюда порядок там не навести можно кое-что улучшить, например, ф-ю в постгрю перенести, чтобы не гонять туда огромный список ID ну и вроде всё. Почитай про EAV модель , обычно ее для этих целей применяют. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 07:29 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Напомнило мой топик https://www.sql.ru/forum/1242903/tyapnichnyy-poisk-tovarov-po-naboru-atributov ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 09:11 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, )) все в мире уже давно написанно, и решения найдены). По теме можно сказать что код выше от ТС годен к употреблению. А оптимизацию раньше времени не проводят. Нет ограничений. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 09:51 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Давайте обсудим недостатки решения которое приведено в статье https://habr.com/ru/post/261137/ ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 10:34 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonНапомнило мой топик https://www.sql.ru/forum/1242903/tyapnichnyy-poisk-tovarov-po-naboru-atributov ну так эта тема про решение твоей проблемы а советы фронтендеров с фреймворками для меня имеют нулевую ценность, поэтому у меня в их разделе 0 тем ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 11:01 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonДавайте обсудим недостатки решения которое приведено в статье https://habr.com/ru/post/261137/ если что не устраивает, есть ещё монга и эластик но как по мне решение идеальное на самом деле тут редис то вроде и не нужен (надо тестить) в постгре можно ф-ю держать, она также в памяти отработает ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 11:04 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Постгрес никогда не считался быстрой системой. Такова его архитектура. Поэтому. Есть у меня сомнения. По поводу редиски я не против но нужен внятный механизм расширения бизнес модели этих фасетов и классификаторов. Вангую что девочка-контент-менеджер магазина просто ушатает эту систему постоянно (2-3) раза в час закидывая туда новые типы товаров и их атрибутов поиска. Если механика расширения (на ходу!) изначально заложена то гуд. Если нет - то система будет постоянно ребилдится и как следствие недоступна. Вангую также что девочка закинет туда 100500 классов (из Экцеля ага) просто так на всякий случай. на будущее. И эти пустые атрибуты навсегда займут место в битовой маске. И не будет никакой возможности в будущем их утрамбовать обратно. К каким последствиям приведет пустое неиспользованое захватывание бит в маске вы можете посчитать. Это память сервера Redis. А память обычно очень быстро кончается. Вот теперь давайте обсуждать эти поинты. И если эти сценарии невозможны - то почему. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 11:13 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonПостгрес никогда не считался быстрой системой. Такова его архитектураон упорно гнет решение расширить постгри и в его оперативке решать задачи. полудухв постгре можно ф-ю держать, она также в памяти отработает ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 11:23 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC SharpmaytonПостгрес никогда не считался быстрой системой. Такова его архитектураон упорно гнет решение расширить постгри и в его оперативке решать задачи. Я где-то в глубине души даже готов согласиться. Но почему за более чем 20 лет эволюции, Postgres не предоставил нам коробочного решения для фасетного поиска? Варианты. 1) Это не работает в Postgresql. 2) Гибридные решения с Redis работают эффективнее. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 11:43 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonВарианты. 1) Это не работает в Postgresql. 2) Гибридные решения с Redis работают эффективнее. 3. Фасетный поиск это не задача реляционных БД. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 11:56 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC SharpmaytonВарианты. 1) Это не работает в Postgresql. 2) Гибридные решения с Redis работают эффективнее. 3. Фасетный поиск это не задача реляционных БД. А полнотекстовый? А ГИС? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 12:05 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, ГИС это отдельные картриджи в сиквел, оракле и постгри. Полнотекстовый насколько помню в java используют не саму Рсубд. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 12:09 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Может полудух хочет кардтридж под Постргрес. Чем его идея тогда хуже оракловой? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 12:17 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonМожет полудух хочет кардтридж под Постргрес. Чем его идея тогда хуже оракловой?может. Пусть делает. Мы обсудили почему за 20 лет нет этого до сих пор. Это есть но не в бд. Когда что то пишешь с нуля, надо понимать - зачем. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 12:33 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Я думаю что поиск в БД по списку денормализованных атрибутов - не согласуется с чистой теорией. Это даже не 1НФ. Но есть потребности бизнеса в том чтобы искать какую-то хрень например SELECT * from TOVAR where contains(hashtags,'Samsung','HDMI',......и еще штук 20 атрибутов) и искать быстро. На предельной скорости. Полнотекстовые движки это решают фильтром Блума + точной проверкой после предварительной выборки. Это даже инкапсулировано в некоторые файловые форматы бигдаты такие как Apache ORC. Кстати в одном из семинаров по постргресу главный постгресщик рассказывал историю возникновения JSONB. До этого был другой подход. Просто в хранении списка ключевых слов и в текстовом индексировании. Я думаю что это может быть то что нужно полудуху. Пускай он погуглит по легаси-плагинам. Или опять-же JSONB+index. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 12:55 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 13:09 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC Sharp, я не понял к чему эта ссылка. Я с твоего позволения не буду на нее нажимать. Можешь прояснить к чему она? Что там внутри? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 13:10 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, Формирование параметров вебмагазина букинга по товарам. На форуме ссылок с вирусами нет. Видно что параметров куча и все они не битовые маски. Можно 20 парам поставить в where и все они отработают на ура. То есть твоё число 20 имхо мало чтобы были проблемы. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 13:31 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonПостгрес никогда не считался быстрой системой. Такова его архитектура. Поэтому. Есть у меня сомнения. По поводу редиски я не против но нужен внятный механизм расширения бизнес модели этих фасетов и классификаторов. Вангую что девочка-контент-менеджер магазина просто ушатает эту систему постоянно (2-3) раза в час закидывая туда новые типы товаров и их атрибутов поиска. Если механика расширения (на ходу!) изначально заложена то гуд. Если нет - то система будет постоянно ребилдится и как следствие недоступна. Вангую также что девочка закинет туда 100500 классов (из Экцеля ага) просто так на всякий случай. на будущее. И эти пустые атрибуты навсегда займут место в битовой маске. И не будет никакой возможности в будущем их утрамбовать обратно. К каким последствиям приведет пустое неиспользованое захватывание бит в маске вы можете посчитать. Это память сервера Redis. А память обычно очень быстро кончается. Вот теперь давайте обсуждать эти поинты. И если эти сценарии невозможны - то почему. там есть один нюанс, которого в статье нет нужна агрегация потому что только агрегация даст последовательную цепочку ID, которым соответствуют позиции 01 в битмапе (они же последовательно идут) иначе неизбежны пробелы. с одной стороны доп.костыль, а с другой - нет никаких проблем с обновлением в любой точке чё угодно можно выкинуть, чё угодно вставить и никакие девки не страшны лишние атрибуты конечно надо выкидывать, а как ещё только вот атрибуты хранятся в справочнике и их можно автоматически включать в фильтр памяти там 625 КБ авторплюсы такого решения: 1) Жрёт мало памяти. У нас > 50000 товаров, около 100 значений фильтров, то есть 50000 * 100 = 5 000 000 бит = всего 625 килобайт памяти. 2) Очень быстро. Сложность побитовой операции O(N), тем не менее, строки у нас не миллионами байт измеряются, а перемножить пару-тройку битмапов ио 50000 бит — задача пары микросекунд для процессора. Overall, в худшем случае (перемножение всех фильтров), замеряя разницу времени в PHP до отправки команды в REDIS и после получения результата — 40мс (это с доп. функцией из п.3, далее). Вполне реалтаймовая генерация страницы, для веба пойдёт. Если кажется много — просьба кешируйте результат, но нас это удовлетворило вполне. maytonПостгрес никогда не считался быстрой системой. Такова его архитектура. Поэтому. Есть у меня сомнения. во1, это не так. Откуда такое заявление взялось? во2, речь про операции в памяти. Мелкая таблица с атрибутами измеряется в килобайтах и будет в памяти всю дорогу. Накинуть на неё операцию AND - займёт, по идее, столько же, сколько и в редиске. Вопрос только в алгоритмах, но там же стандартная библиотека должна быть. maytonНо почему за более чем 20 лет эволюции, Postgres не предоставил нам коробочного решения для фасетного поиска? ты же говорил, что любитель послушать лекции по постгре, так там Бартунов регулярно говорит, что людей мало, людей не хватает, люди вы где, ау?, люди, дайте людей!, вэлком люди, у нас куча задач, нужны люди, люди, ЛЮДИ11! через одну повторяет maytonКстати в одном из семинаров по постргресу главный постгресщик рассказывал историю возникновения JSONB. До этого был другой подход. Просто в хранении списка ключевых слов и в текстовом индексировании. Я думаю что это может быть то что нужно полудуху. Пускай он погуглит по легаси-плагинам. Или опять-же JSONB+index. я про JSONB ещё года 2 назад всё изучил и тесты с монгой видел JSONB не то. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:32 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC SharpmaytonSELECT * from TOVAR where contains(hashtags,'Samsung','HDMI',......и еще штук 20 атрибутов)надо еще доказать что это долго. Пример (мусор удалён) вы там с Димой один косяк на двоих чтоли курите вот так фильтр выглядит: /?f=ap:5_3_5;bh:28_99_33;ck:7_9_22 ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:34 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonЯ думаю что поиск в БД по списку денормализованных атрибутов - не согласуется с чистой теорией. Это даже не 1НФ. Но есть потребности бизнеса в том чтобы искать какую-то хрень например денормализация и поиск по ID - это самый быстрый вариант что-то найти ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:37 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухнужна агрегация потому что только агрегация даст последовательную цепочку ID, которым соответствуют позиции 01 в битмапе (они же последовательно идут) иначе неизбежны пробелы. с одной стороны доп.костыль, а с другой - нет никаких проблем с обновлением в любой точке чё угодно можно выкинуть, чё угодно вставить и никакие девки не страшны лишние атрибуты конечно надо выкидывать, а как ещё только вот атрибуты хранятся в справочнике и их можно автоматически включать в фильтр Ничего не понял про агрегацию. Агрегация это применение формулы типа min, max, sum .e.t.c. Приведи пример твоей агрегации. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:39 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухDima Tизбыточность в 256 раз опять накурился Я бы для начала поковырял откуда это недоразумение взялось и там бы порядок навел. отсюда порядок там не навести можно кое-что улучшить, например, ф-ю в постгрю перенести, чтобы не гонять туда огромный список ID ну и вроде всё. если оттуда, то вы собрались пользоваться Редисом? если да, то там есть операции работы с множествами, битами и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:45 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухmaytonЯ думаю что поиск в БД по списку денормализованных атрибутов - не согласуется с чистой теорией. Это даже не 1НФ. Но есть потребности бизнеса в том чтобы искать какую-то хрень например денормализация и поиск по ID - это самый быстрый вариант что-то найтида. Но магазин плохо ложиться на данную модель. Отсюда костыли в виде EAV, xml, json,... ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:50 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
во1, это не так. Откуда такое заявление взялось? во2, речь про операции в памяти. Мелкая таблица с атрибутами измеряется в килобайтах и будет в памяти всю дорогу. Накинуть на неё операцию AND - займёт, по идее, столько же, сколько и в редиске. Вопрос только в алгоритмах, но там же стандартная библиотека должна быть. Это заявление появилось после многих лет наблюдений за Ораклом. Потом я понаблюдал как работает PG. Поюзал его. Почитал про внутренне устройство таблиц. И сдалал для себя выводы. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:50 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухты же говорил, что любитель послушать лекции по постгре, так там Бартунов регулярно говорит, что людей мало, людей не хватает, люди вы где, ау?, люди, дайте людей!, вэлком люди, у нас куча задач, нужны люди, люди, ЛЮДИ11! Да. Я слушал лекции Бартунова. Я сочувственно кивал. Но какое это имеет отношение ко мне чьорт вась возьми, сударь! ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:52 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухя про JSONB ещё года 2 назад всё изучил и тесты с монгой видел JSONB не то. У тебя есть уже бенчмарк в котором твой магазин заходит атрибутами в JSONB? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:53 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухвы там с Димой один косяк на двоих чтоли курите вот так фильтр выглядит: /?f=ap:5_3_5;bh:28_99_33;ck:7_9_22не знаю никакого димы и твоих примеров)))). LOL Это же не из моего урл? Говори толком. У меня урл вроде обычный where. Дай твой урл из сети. Будет конкретика. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 14:58 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC Sharpполудухпропущено... денормализация и поиск по ID - это самый быстрый вариант что-то найтида. Но магазин плохо ложиться на данную модель. Отсюда костыли в виде EAV, xml, json,... EAV - не обеспечивает нужной скорости сбора информации. Фактически EAV эффективен на коротких точечных транзакциях типа security, metadata где мы берем ID принципала и смотрим какие напрмиер у него права и привилегии есть. Если мы по толстому EAV (магазин) будем постоянно бомбить поисковыми реквестами от UI фронта интернет магазина - то база умрёт. Я готов спорить что умрёт на продуктовой нагрузке и при той архитектуре которую я имею в виду. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 15:00 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, У меня тоже к нему куча наезда)). Это костыль к Р субд для движка магазина. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 15:05 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonна это ЛЮДИ нужны, а их нет. Сам такой поиск у них не в приоритете. FTS и так есть. И кстати, в постгресе редиску тоже можно прикрутить. также как у них есть битмапы на любую длину и операции по ним. Ну и пускай нужны. Я-то тут причем? По поводу FTS. Насколько я понимаю он потребности фасетного поиска не покрывает. Если-бы покрывал - господин на хабре не стал-бы писать статью про Редисочный поиск. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 18:47 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухоткуда у тебя кириллица взялась во WHERE?ну причем тут кодировка или ищем по ID или названию отеля. Вроде главное что тут битовой маской не пахнет и битмапом. Или пахнет? И если пахнет, то в каком месте?)))) Вот что главное. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 19:10 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Прошу прощения. Вместо квотировать сообщение я нажал редактировать. Старая копия не сохранилась. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 19:13 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, ) Хде прогер движка форума который должен был ТРИ раза спросить: "вы уверены?"))) ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 19:23 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Да мы давно просили. Главный грохнул ПТ и с тех пор ни с кем ни общается. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 19:28 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудух, Вот такое в урл Код: plaintext 1.
Конечно, там есть и строки-стринги) ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 19:38 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonПрошу прощения. Вместо квотировать сообщение я нажал редактировать. Старая копия не сохранилась. бл?*:! ну спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 19:58 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
денормализация по сути PetroNotC Sharpполудухоткуда у тебя кириллица взялась во WHERE?ну причем тут кодировка или ищем по ID или названию отеля. Вроде главное что тут битовой маской не пахнет и битмапом. Или пахнет? И если пахнет, то в каком месте?)))) Вот что главное. когда ищут по названию отеля, это отдельный input с поиском "налету" фильтр к ней не имеет отношение разумеется, если делать такие кривые "фильтры", там никакой битмап не прикрутишь. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:01 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonПрошу прощения. Вместо квотировать сообщение я нажал редактировать. Старая копия не сохранилась. кстати, а какого у тебя есть кнопка редактировать, а у нас нет?? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:02 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
При грамотном шардинге или партишенинге мы можем бизнес модель резать на кусочки. Например checkout_year=2019 сразу отсечет нам ненужные года. Ну и хеш партицирование. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:05 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухmaytonПрошу прощения. Вместо квотировать сообщение я нажал редактировать. Старая копия не сохранилась. кстати, а какого у тебя есть кнопка редактировать, а у нас нет?? У меня - перчатка Таноса. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:06 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухкогда ищут по названию отеля, это отдельный input с поиском "налету"это не понял. Реально в букинге не на лету, т.к. перезапрос страницы на Enter. И отель будет не конкретный, а просто справа в списке "товаров". Его дополнительно надо будет там найти. Криво это или нет, не задумывался. Не с чем сравнить. Поисковый запрос не должен искать конкретный отель. Он сохраняется у юзверя и может лежать годами. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:16 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудух, Имхо, фасетный можно применять если у тебя запрос дольше 100мс. Если нет, то можно не заморачиваться. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:18 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC Sharpполудух, Имхо, фасетный можно применять если у тебя запрос дольше 100мс. Если нет, то можно не заморачиваться. Любая база имеет тенденцию к росту. И эти 100мс с каждым днем растут. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:27 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, Конечно. авторФасетный поиск позволяет перемещаться по многомерному информационному пространству через объединение текстового поиска с постепенным сужением выбора в каждом измерении[ Ровно как букинге. Текстовый поиск плюс многомерное уточнение. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:42 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonДавайте обсудим недостатки решения которое приведено в статье https://habr.com/ru/post/261137/ Я так понимаю ТС в курсе тех алгоритмов, но ищет чудо, а все кто говорит что чуда не будет обзывает обкурившимися. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 20:52 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Dima TmaytonДавайте обсудим недостатки решения которое приведено в статье https://habr.com/ru/post/261137/ Я так понимаю ТС в курсе тех алгоритмов, но ищет чудо, а все кто говорит что чуда не будет обзывает обкурившимися. так ты сюда вбрасываешь даже не вникая в тему эту ссылку сюда принёс я, так что да, я в курсе чудо я не ищу, по факту я сейчас тут будущим магазино-строителям раскрываю глаза на качественный фильтр - отвечаю на вопросы ты же мне советуешь EAV на первой странице, которое для фильтров где-то на последнем месте учитывая, что я свой фреймворк написал и несколько CRM на заказ, я несколько в курсе про EAV про ссылки и указатели так долго троллил, что аж жЫр с монитора закапал. могу предложить другие варианты: невнимательный, рассеянный, тролльжЫрный PetroNotC Sharpполудухкогда ищут по названию отеля, это отдельный input с поиском "налету"это не понял. Реально в букинге не на лету, т.к. перезапрос страницы на Enter. И отель будет не конкретный, а просто справа в списке "товаров". Его дополнительно надо будет там найти. Криво это или нет, не задумывался. Не с чем сравнить. Поисковый запрос не должен искать конкретный отель. Он сохраняется у юзверя и может лежать годами. ухх наверное более бездарный фильтр сложно было бы найти... с т.з. функционала то он свою миссию делает, но писала армия индусов, не иначе рожала в муках точнее ну вот поисковая строка, справа от неё 2 селекта "Заезд/Отъезд" + ещё опции. поисковая строка сразу же выдаёт селектор аяксом, в нём выбирается пункт, у пункта есть ID и текст спрашивается - НАХРЕНА текст пихать в URL?! Почему не ID? КАК можно было такую длинную строку мусора сгенерить из такого маленького фильтра, это же талант нужен! там всего-то должно было быть: /?f=id:22;in:2019-08-25;out:2019-09-10;mat:2;ch:1;num:1 а они чего сделали дичь какая на след.странице есть "Место/название объекта", так они даже оттуда слово воткнули в GET даже если они хотели, чтобы клиент, глядя на этот урл, мог увидеть название отеля... как он его там увидит за всем этим мусором? Там один label занимает четверь. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 22:08 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
ну и на второй странице, слева, длинная колонка тех самых чекбоксов (опять же дичь - там 5 экранов вниз скроллить надо, а когда выбираешь один внизу, то страница обновляется и кидает обратно наверх ), которые должны быть просто цифрами но это было бы слишком просто... ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 22:14 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC SharpКриво это или нет, не задумывался. Не с чем сравнить. https://fcenter.ru/product/type/5?vend=7¶m=1585_766_754&offset=0 ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 22:16 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудух, дружище , сбавь обороты. Здесь - тихий добрый форум и никто никого не обличает. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 23:02 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухPetroNotC SharpКриво это или нет, не задумывался. Не с чем сравнить. https://fcenter.ru/product/type/5?vend=7¶m=1585_766_754&offset=0 основа фасетных фильтров в циферках в скобочках после фильтра. По ссылке я этого не увидел. И давайте различать интерфейс и функционал. - если фильтр город=Москва, то нафига отправлять ID москвы вместо москвы? Можно и порассуждать об этом. полудухглядя на этот урл, мог увидеть название отеля...да не смотрит на урл никто. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2019, 23:13 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухну вот поисковая строка, справа от неё 2 селекта "Заезд/Отъезд" + ещё опции. поисковая строка сразу же выдаёт селектор аяксом, в нём выбирается пункт, у пункта есть ID и текст спрашивается - НАХРЕНА текст пихать в URL?! Почему не ID? КАК можно было такую длинную строку мусора сгенерить из такого маленького фильтра, это же талант нужен! там всего-то должно было быть: /?f=id:22;in:2019-08-25;out:2019-09-10;mat:2;ch:1;num:1 а они чего сделали дичь какая на след.странице есть "Место/название объекта", так они даже оттуда слово воткнули в GET даже если они хотели, чтобы клиент, глядя на этот урл, мог увидеть название отеля... как он его там увидит за всем этим мусором? Там один label занимает четверь. Если серъезно заниматься оптимизацией трафика - то нужно смотреть не в request а в response. Там действительно вот где много избыточного. GraphQL в помощь. А эстетика URL никого не парит потому что по хорошему она не нужна. Она может быть скрыта за приложением типа thin-client и может строиться специальным билдером параметров. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 07:40 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухтак ты сюда вбрасываешь даже не вникая в тему Еще бы ты тему расписал. Сначала у тебя был битмап, потом он вдруг оказался строкой нулей и единичек, причем строка это какой промежуточный результат непонятно чего. Как посчитать единички в строке ты уже сам ответил 21954674 , для ускорения можно только параллелить, и то не факт что значительное ускорение получишь. Возможно быстрее будет искать с помощью strchr() . Еще можешь вектору заранее побольше памяти выделить, чтобы он часто перевыделением не занимался. Код: plaintext 1.
Все. Нет чудесных алгоритмов для работы с такими массивами. Да как бы и не надо. Даже если строка у тебя миллион символов, то перебор ее меньше 1 миллисекунды займет. Но непонятно почему надо именно строку эту трансформировать в массив индексов? Почему сразу не получить массив в процессе расчета? Тем более что это СУБД, а в СУБД удобнее массивами(таблицами) оперировать, а не строки парсить. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 08:38 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Dima T, Согласен. Ответ уже был. А если расширять до архитектуры, то ТС колкий как ёжик)))). Если в сторону до фасетного поиска, то он не имеет отношения к битмапу. Это наличие просто пачки фасетных запросов. Как то так. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 09:02 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Эта задача идеально параллелится на технологиях map-reduce. Чем больше физических вычислительных нод вы внесёте в кластер - тем быстрее получите ответ. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 09:09 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
mayton, Автор не особо любит фреймворки( ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 09:43 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
Это скорее принцип. Или шаблон. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 09:51 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC Sharpоснова фасетных фильтров в циферках в скобочках после фильтра. По ссылке я этого не увидел. там какой-то глюк в JS если так зайти , то при выборе чекбоксов он пишет, сколько найдено И давайте различать интерфейс и функционал. - если фильтр город=Москва, то нафига отправлять ID москвы вместо москвы? ну здрасьте... ID проще найти в БД его проще валидировать он не портит эстетику урла (если ссылку с букинга отправить другу в мобил, то можно навсегда потерять друга. Я уж молчу, что по ней страшно переходить (клиент потерян)) от слова "Москва" компам только лишний гемор и никакого профита. да не смотрит на урл никто. ага, до тех пор, пока им кидаться не начнут (а это самый горячий способ привлечения клиента, на минуточку) ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 10:38 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
maytonЕсли серъезно заниматься оптимизацией трафика да причём тут трафик... ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 10:41 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
полудухmaytonЕсли серъезно заниматься оптимизацией трафика да причём тут трафик... А при чем здесь эстетика URL? Я на URL вообще не смотрю почти никогда. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 10:42 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
постгрес я всё-таки немного переоценил там нет такого простого setbit, как в редиске... ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 10:42 |
|
самый эффективный способ посчитать позиции в битмапе?
|
|||
---|---|---|---|
#18+
PetroNotC Sharpполудухвы там с Димой один косяк на двоих чтоли курите вот так фильтр выглядит: /?f=ap:5_3_5;bh:28_99_33;ck:7_9_22не знаю никакого димы и твоих примеров)))). LOL Это же не из моего урл? Говори толком. У меня урл вроде обычный where. Дай твой урл из сети. Будет конкретика. зы. а про косяк так ничего не написал, ай да П. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2019, 10:54 |
|
|
start [/forum/topic.php?all=1&fid=57&tid=2017579]: |
0ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
43ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
109ms |
get tp. blocked users: |
2ms |
others: | 13ms |
total: | 207ms |
0 / 0 |