|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Ребята, доброго времени дня/ночи суток! Посоветуйте, что взять бы такое для реализации следующей задачки. Есть проект "Система хранения документов" (ECM) - довольно большая и монструозная. Появилась такая задача: пользователь открывает документ, в документе может быть несколько аттачей (png, doc, jpeg, что угодно). И пользователь может навигировать по этим аттачам в веб интерфейсе: выбирает аттач, мы его конвертируем в pdf (используем aspose) и показываем в pdf.js viewer. Все шикарно работает. Пользователь выбирает следующий аттач - мы конвертируем - показываем. Так вот нужно улучшить. Когда пользователь открывает очередной документ, мы хотим заранее конвертнуть и закешировать все аттачи этого документа (такой precache получается). Так вот для конвертации всех аттачей надо запустить несколько потоков параллельно, по потоку на аттач, и результат конвертации сохранить где-то в кеше. В принципе, проблемы никакой нет в реализации. Но хочется ведь взять что-нибудь готовое уже. Для кеширования в приложении я давно хочу взять ehcache. Думаю тут самое время (сейчас используем свои механизмы кеширования всего что есть, кешируем в памяти). Собственно вопрос: может кто что посоветует для решения такой задачи? Чтобы можно было запускать сбор данных в несколько потоков и кешировать результат, и при этом не выходить из рамок ресурсов (ограничить число потоков и памяти для кеша). Я имею ввиду что-нибудь готовое, чтобы не городить огород. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 02:47 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, А как можно конвертировать "png, doc, jpeg, что угодно" в pdf.js? Этоже пдф-ная технология. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 02:55 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Relic Hunter, Ну смотрите, мы с помощью aspose конвертируем то, что можно, в pdf сперва (png -> pdf, doc -> pdf и т.д.), а потом, уже имея pdf, показываем его в pdf.js ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 02:57 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Собственно конвертация может занять какое-то время, поэтому и хочется конвертнуть заранее в pdf и закешировать этот pdf. Чтобы когда ползователь нажмет на этот аттач, ему меньше ждать. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 02:59 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, pdf.js это клиентская технология, а не серверная. Сохраняйте сразу в pdf и пусть "клеент" конвертирует. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 04:37 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, Палка о двух концах. Есть такое в эксплорере - загружать заранее все ссылки что есть на странице. Я это всегда выключаю. Нафига загружать всё подряд? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 07:15 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Делайте для всех доков превью в jpeg 60 DPI. Это статика, и загрузится сразу и мгновенно. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 07:17 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterЕсть проект "Система хранения документов" (ECM) - довольно большая и монструозная. ... В принципе, проблемы никакой нет в реализации. Но хочется ведь взять что-нибудь готовое уже. Для кеширования в приложении я давно хочу взять ehcache. Думаю тут самое времяМде, ECM у вас, скажем прямо, так себе. То что вы хотите в ECM называется rendition и имеет тенденцию храниться не в каком-то кеше, а в вместе с остальными файлами/метаданными, и генерироваться (и сохраняться) либо по запросу, либо после сохранения основного документа. rabiterpng, doc, jpeg, что угодно ... и при этом не выходить из рамок ресурсовУдачи, у aspose генерация "толстых" документов тупит так, что какой-нить ворд на 600 страниц конвертируется по 10 минут и выжирает весь процессор, так что вы описываете - это потенциальный DoS. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 07:22 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
спасибо! ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 07:24 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Не совсем понятен юзкейс. Будет ли пользователь редактировать документы. А так - можно плюсануть к кешированию картинок. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 08:24 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonНе совсем понятен юзкейс. Будет ли пользователь редактировать документы.ТС хочет все документы которые есть в системе отображать в режиме просмотра через iframe с pdf.js - типа так универсально получается (в целом можно все в pdf не конвертировать, а к примеру pdf крутить через pdf.js, картинки как есть, офис через onlyoffice какой-нить, но мороки какбы больше) ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 08:33 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterРебята, доброго времени дня/ночи суток! Посоветуйте, что взять бы такое для реализации следующей задачки. Так вот для конвертации всех аттачей надо запустить несколько потоков параллельно, по потоку на аттач, и результат конвертации сохранить где-то в кеше. Лучше запустить один поток на пользователя (а не на аттач), который последовательно подготовит все аттачи rabiterВ принципе, проблемы никакой нет в реализации. Но хочется ведь взять что-нибудь готовое уже. Для кеширования в приложении я давно хочу взять ehcache. С точки зрения "прямващевсёужереализованоиготово" думаю, что нет смысла искать, т.к. черновой вариант напишется максимум за день (с перекурами и перерывами на кофе/сон) :) Берите ehcache - штука очень гибкая и мощная: в том числе и на диск из памяти сможет сбрасывать при определенных условиях, различные варианты "устаревания" кеша, работает уже давно в промышленных средах. Интегрируется в проекты ну очень легко. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 09:21 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123Делайте для всех доков превью в jpeg 60 DPI. Это статика, и загрузится сразу и мгновенно. Андрей Панфилов храниться не в каком-то кеше, а в вместе с остальными файлами/метаданными, и генерироваться (и сохраняться) либо по запросу, либо после сохранения основного документа. если нагрузка вас уже беспокоить, то вам следует прислушаться к господам. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 09:38 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Я не пойму вообще смысла тут кеша. Если не преобразовывать все в pdf, то и кеш не нужен. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 09:43 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей Панфиловтипа так универсально получается (зато понадобился кеш. Обратная сторона. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 09:45 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123зато понадобился кеш. Обратная сторона.там кейсов довольно много можно накидать, к примеру у документа гриф ДСП стоит и пользаку нужно его отдавать модифицированным (от банальных водяных знаков, до игры со шрифтами, кириллицой/латинцией и пр.) чтобы понять кто документ слил. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 09:59 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Автор что-то over-проектировал. Тут определённо нужно обсуждать саму задачу. Причем не на уровне "я хочу" а на уровне чего на самом деле нужно бизнес-пользователю. Преобразование картинок в pdf выглядит уж-точно какой-то гипертрофированной задачей. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 10:00 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей Панфиловчтобы понять кто документ слил.прикольно)) ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 10:04 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonАвтор что-то over-проектировал. И теперь хочет по быстрому всё наладить. Прикрутит кэш, какое-то время даже наверно работать будет, а потом ему опять по быстрому захочется. В общем здесь всё безнадёжно. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 11:51 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Да. А если цель стоит - ставить watermark на все документы - тогда кеш будет поделен по горизонтали на количество пользователей. Вобщем как всегда или скорость или секюрность. Надо выбирать. Мдя. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 11:57 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Relic Hunterrabiter, pdf.js это клиентская технология, а не серверная. Сохраняйте сразу в pdf и пусть "клеент" конвертирует. Конвертация происходит на сервере, браузеру отдаем уже сконвертированный pdf ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:10 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123Палка о двух концах. Есть такое в эксплорере - загружать заранее все ссылки что есть на странице. Я это всегда выключаю. Нафига загружать всё подряд? У нас есть ТЗ от одного из кастомеров на precache. Надо делать) Petro123Делайте для всех доков превью в jpeg 60 DPI. Это статика, и загрузится сразу и мгновенно. Удобнее работать через pdf.js - можно листать страницы мышкой, зумить, копировать текст и т.д. Мы от картинок ушли из-за этого. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:15 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей ПанфиловrabiterЕсть проект "Система хранения документов" (ECM) - довольно большая и монструозная. ... В принципе, проблемы никакой нет в реализации. Но хочется ведь взять что-нибудь готовое уже. Для кеширования в приложении я давно хочу взять ehcache. Думаю тут самое времяМде, ECM у вас, скажем прямо, так себе. То что вы хотите в ECM называется rendition и имеет тенденцию храниться не в каком-то кеше, а в вместе с остальными файлами/метаданными, и генерироваться (и сохраняться) либо по запросу, либо после сохранения основного документа. Есть у нас rendition, есть кастомеры, у которых мы все аттачи конвертируем в pdf и храним эти pdf вместе с оригинальными аттачами в хранилище. Но кастомеров много, не все могут позволить себе большие хранилища, чтобы в них хранить экстра данные, вот для них нужен небольшой прекеш в памяти, о котором я написал. И опять же, действительно, у некоторых кастомеров бывают user specific watermarks, так что получается user specific кеш должен быть. Андрей Панфиловrabiterpng, doc, jpeg, что угодно ... и при этом не выходить из рамок ресурсовУдачи, у aspose генерация "толстых" документов тупит так, что какой-нить ворд на 600 страниц конвертируется по 10 минут и выжирает весь процессор, так что вы описываете - это потенциальный DoS. Ну в реальности редко бывают аттачи картинки, это я для примера скинул. Вообще aspose не я выбирал, и корвертацию всего и вся в pdf, Я когда узнал об этом, удивился немного, ну да ладно. Но, кстати, doc Война и Мир (4 мегабайта на 1700 страниц) конвертируется в PDF на моем ноуте за 7 секунд. Но у нас для каждого документного типа можно выставить трешхолд на превью. Часто бывают аттачи маленькие совсем. Андрей ПанфиловmaytonНе совсем понятен юзкейс. Будет ли пользователь редактировать документы.ТС хочет все документы которые есть в системе отображать в режиме просмотра через iframe с pdf.js - типа так универсально получается (в целом можно все в pdf не конвертировать, а к примеру pdf крутить через pdf.js, картинки как есть, офис через onlyoffice какой-нить, но мороки какбы больше) верно, универсальность. Кастомеров много, у всех свои use cases, у кого много маленьких аттачей, у кого-то мало, но большие. Все у нас настраивается, какие типы файлов конвертировать в pdf, какие нет, у какиз будет preview, у каких нет, по типам, по размерам. pdf.js у нас как плагин вообще дефолтный, отдельные кастомеры используют свой вьювер. Главное, в будущем если будет необходимость мы можем для разных типов аттачей использовать разные вьюверы. Но пока вот pdf.js Андрей ПанфиловPetro123зато понадобился кеш. Обратная сторона.там кейсов довольно много можно накидать, к примеру у документа гриф ДСП стоит и пользаку нужно его отдавать модифицированным (от банальных водяных знаков, до игры со шрифтами, кириллицой/латинцией и пр.) чтобы понять кто документ слил. Да, так и есть, каждому пользователю может отдаваться аттач со специфичным watermark. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:29 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonНе совсем понятен юзкейс. Будет ли пользователь редактировать документы. А так - можно плюсануть к кешированию картинок. Редактировать нет, но вот листать колесиком мышки страницы, зумить, копировать текст - look and feel намного приятнее чем если тебе дают картинку понюхать. maytonАвтор что-то over-проектировал. Тут определённо нужно обсуждать саму задачу. Причем не на уровне "я хочу" а на уровне чего на самом деле нужно бизнес-пользователю. Преобразование картинок в pdf выглядит уж-точно какой-то гипертрофированной задачей. Да, преобразование картинок в pdf это огонь, согласен :D maytonДа. А если цель стоит - ставить watermark на все документы - тогда кеш будет поделен по горизонтали на количество пользователей. Вобщем как всегда или скорость или секюрность. Надо выбирать. Мдя. Вооот, все верно подметили, получается кеш user specific. Ну тут нужна золотая середина. Я хочу как можно более safe решение, такой маленький кеш, для кеширования маленьких аттачей и не больше N штук на пользователя (на большие аттачи сделаем настраиваемый threshold). Кастомеров много, у всех своя специфика данных. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:36 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
qastarabiterРебята, доброго времени дня/ночи суток! Посоветуйте, что взять бы такое для реализации следующей задачки. Так вот для конвертации всех аттачей надо запустить несколько потоков параллельно, по потоку на аттач, и результат конвертации сохранить где-то в кеше. Лучше запустить один поток на пользователя (а не на аттач), который последовательно подготовит все аттачи Точно! Я вчера уже засыпал, подумал, зачем по потоку на аттач, в реальности может получится медленнее. Пусть будет один поток на пользователя, который последовательно будет конвертировать. К тому же можно будет прервать процесс между аттачами, если пользователь другой документ выбрал. Да и мороки меньше с многопоточкой - один поток легче захендлить. qastarabiterВ принципе, проблемы никакой нет в реализации. Но хочется ведь взять что-нибудь готовое уже. Для кеширования в приложении я давно хочу взять ehcache. С точки зрения "прямващевсёужереализованоиготово" думаю, что нет смысла искать, т.к. черновой вариант напишется максимум за день (с перекурами и перерывами на кофе/сон) :) Берите ehcache - штука очень гибкая и мощная: в том числе и на диск из памяти сможет сбрасывать при определенных условиях, различные варианты "устаревания" кеша, работает уже давно в промышленных средах. Интегрируется в проекты ну очень легко. Да, я ehcache уже оценил! ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:39 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
ОзверинPetro123Делайте для всех доков превью в jpeg 60 DPI. Это статика, и загрузится сразу и мгновенно. Андрей Панфилов храниться не в каком-то кеше, а в вместе с остальными файлами/метаданными, и генерироваться (и сохраняться) либо по запросу, либо после сохранения основного документа. если нагрузка вас уже беспокоить, то вам следует прислушаться к господам. Нагрузка не то, чтобы беспокоит сейчас уже, я просто предвижу эту проблему. Хранить pdf в основном хранилище рядом с оригинальными аттачами - да, мы так делаем для некоторых кастомеров. Но не для всех подходит, потому что либо из-за user specific watermarks (каждому пользователю отдается модифицированный аттач), либо кастомеры не хотят платить за место в storage за прекеш данные. Вообщем идея в таком light weight кеше в памяти "здесь и сейчас" для маленьких аттачей (настраивается размер). ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:43 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterРедактировать нет, но вот листать колесиком мышки страницы, зумить, копировать текст - look and feel намного приятнее чем если тебе дают картинку понюхать.согласен. Тогда давайте юз кейс с цифрами. Зашел на страничку и все ссылки страницы начали на сервере конверт в pdf? Или как? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:44 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterРедактировать нет, но вот листать колесиком мышки страницы, зумить, копировать текст - look and feel намного приятнее чем если тебе дают картинку понюхать.согласен. Тогда давайте юз кейс с цифрами. Зашел на страничку и все ссылки страницы начали на сервере конверт в pdf? Или как? Да зависит от кастомера... Ну вообще вот перед тобой табличка, в табличке документы, у каждого документа несколько аттачей. Пользователь кликает на документ, появляется окошко с метаданными документа и список его аттачей, первый аттач выбирается автоматически и показывается его превью. Пользователь выбирает второй аттач - опять конвертация, опять превью. Это как работает пока. Надо чтобы определенное число аттачей (настраиваемая велечина), конвертировалось сразу при открытии документа. Так что пока пользователь работает с первым аттачем, остальные уже на подходе. Это реальзый use case от одного из кастомеров. Причем если осталось место для прикеша, то начинаем автоматом конвертировать и кешировать уже аттачи из следующего документа в списке. Вообще я думаю тут должна быть настраиваемся предсказательная стратегия того, какой аттач пользователь откроет следующим, но это все пока не приоритет. Вообщем я в принципе определился. Для кеша - ehcache (только heap tier). С offheap и disk я думаю потом можем проблемы огрести, потому что там уже надо будет более индивидуально подходить к каждому кастомеру в плане настроек offheap и disk tiers. Ну и будет один поток на пользователя, который будет последовательно аттачи конвертировать и добавлять в кеш. И да, пока для каждого пользователя будет свой экземпляр кеша. Пусть пока так, дальше посмотрим. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 13:56 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, nginx используете? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:00 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, И эта вся бодяга т.к. кастомер не имеет памяти в хранилище для превью? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:18 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterПользователь выбирает второй аттач - опять конвертация, опять превью.то есть либо купить терабайт для превью, либо писать код. Так? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:19 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonrabiter, nginx используете? Не уверен, может быть на каких-нибудь инсталляциях и используем... Я, если честно, не в курсе. Вы намекаете на то, что можно кешировать nginx-ом? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:20 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, Размер обычных аттачей и время что ждет юзверь? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:21 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterлибо кастомеры не хотят платить за место в storageпусть ждут раз не платят. Нефиг))) Ну, или сделайте отдельный rest http сервис с превью. Как платная опция. Заплатил, будет летать. Нет - терпи генерацию превью. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:27 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabitermaytonrabiter, nginx используете? Не уверен, может быть на каких-нибудь инсталляциях и используем... Я, если честно, не в курсе. Вы намекаете на то, что можно кешировать nginx-ом?кешировать можно готовое. А у вас нет готовых превью. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:28 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiter, И эта вся бодяга т.к. кастомер не имеет памяти в хранилище для превью? Petro123rabiterПользователь выбирает второй аттач - опять конвертация, опять превью.то есть либо купить терабайт для превью, либо писать код. Так? Вообще я согласен с Вами. Первое о чем я подумал, какого черта, какой-то непонятный кеш на уровне приложения, мелко мыслим! Предложил начальству хранить сконвертированный pdf рядом в том же архиве с оригинальным аттачем. Выяснилось, что для некоторых кастомеров это уже реализовано на уровне rendition. Ну, короче, не буду вдаваться в детали, все же нужен такой легковесный настраиваемый кеш / прикеш. Относимся к нему как к этакому light подспорью. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:30 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterпропущено... Не уверен, может быть на каких-нибудь инсталляциях и используем... Я, если честно, не в курсе. Вы намекаете на то, что можно кешировать nginx-ом?кешировать можно готовое. А у вас нет готовых превью. Вот, в том-то и дело ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:31 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiter, Размер обычных аттачей и время что ждет юзверь? Нет у меня данных, слава богу, я далеко от суппорта и кастомеров. Petro123rabiterлибо кастомеры не хотят платить за место в storageпусть ждут раз не платят. Нефиг))) Ну, или сделайте отдельный rest http сервис с превью. Как платная опция. Заплатил, будет летать. Нет - терпи генерацию превью. это тема, кстати. Я возьму это на заметку, спасибо! Я имею ввиду вообще выделить эту опцию прикеша в отдельный модуль. Хочешь - на, не хочешь - убираем модуль из сборки, отключается прикеш. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:35 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterвыделить эту опцию прикеша в отдельный модуль.да. Даже не модуль, а сервис с другой машины. Как пример сервиса WMS. Но имейте ввиду, что возможно на вас просто ездят за дешево. Нужны цифры. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:40 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabitermaytonrabiter, nginx используете? Не уверен, может быть на каких-нибудь инсталляциях и используем... Я, если честно, не в курсе. Вы намекаете на то, что можно кешировать nginx-ом? Да. На сайте nginx есть шаблоны готовых конфигураций кешей. Наиболее правильно - вынести вест статик-контент от аппликейшена. И для картинок задать там время жизни в 1h - уже хоршо снизит нагрузку. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:40 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123WMS https://ru.m.wikipedia.org/wiki/Web_Map_Service ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Вообще, не понимаю. Оригинал ворд документа весит 100мегов Превью 60 DPI наверно будет 10 килобайт. Нет места? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:48 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
До кучи https://nginx.org/ru/ https://docs.nginx.com/nginx/admin-guide/web-server/serving-static-content/ ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 14:54 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterИ опять же, действительно, у некоторых кастомеров бывают user specific watermarks, так что получается user specific кеш должен быть.Смысла нет в таком кеше. Здесь дорогая операция - это перевести документ какого-либо формата в pdf, а вот навестить на pdf водяные знаки - относительно дешево. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 16:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей ПанфиловrabiterИ опять же, действительно, у некоторых кастомеров бывают user specific watermarks, так что получается user specific кеш должен быть.Смысла нет в таком кеше. Здесь дорогая операция - это перевести документ какого-либо формата в pdf, а вот навестить на pdf водяные знаки - относительно дешево. Я-бы не стал спешить пока у нас не будет цифр. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2019, 16:47 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
mayton, Все, я сделяль, осталось причесать. А цифр не будет. Я вообще-то в целом с вами согласен, нелепая таска. Я бы кешировал так кешировал по взрослому, в архиве, отдельной джобой. Но я не могу драйвить такие решения. Кстати, ehcache клевый, особенно его read through пригодилась. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 04:04 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Покажи свою конфигурацию ehcache. Без бизнес-названий разумеется... Только цифры. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 17:05 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonПокажи свою конфигурацию ehcache. Без бизнес-названий разумеется... Только цифры. - наверняка там еще показывать нечего, прикинули хрен к носу и решили что надо в память файлы кэшировать, а когда память кончится тогда начнут считать ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 17:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonПокажи свою конфигурацию ehcache. Без бизнес-названий разумеется... Только цифры. кеш только в хипе, по количеству entries - настраивается индивидуально через админку для каждого документного типа - админ кастомера может вообще поставить 0 и отключить, если надо. Вообще ходовое значения, я думаю, будет что-то в районе 5 сущностей на пользователя. Кеш не глобальный, SessionScoped, т.е. для каждого пользователя. Пользователей много одновременных не бывает (до 1000 одновременных). Размер аттачей, для которых превью отключается, тоже настраивается через админку индивидуально для каждого документного типа. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 17:56 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
KachalovmaytonПокажи свою конфигурацию ehcache. Без бизнес-названий разумеется... Только цифры. - наверняка там еще показывать нечего, прикинули хрен к носу и решили что надо в память файлы кэшировать, а когда память кончится тогда начнут считать Да, именно так как вы сказали, и даже хуже ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 17:56 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
На мой взгляд проблема еще вот какая, так как это pdf.js, ему нужно загрузить всю pdf с сервера, прежде чем он сможет ее отобразить. Толку, что у нас на сервевере лежит готовая pdf в кеше. В смысле это, конечно, хорошо, но эту pdf надо еще до браузера донести всю целиком. Вообще помимо pdf.js есть другие решения, которые парсят pdf на сервере, а клиенту отдают части pdf по мере необходимости (например, при пролистывании документа), но эти решения платные, да и сложнее их было интегрировать. Но так как это плагин у нас, всегда можно pdf.js заменить вообще на что угодно. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:02 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
А вообще логика у руководства такая по этому кешированию - кешируем в памяти, кастомер про это знает, если хочет - включает и настраивает для документных типов необходимые ему значения кеша, соотносит с размером оперативной памяти, колличеству пользователей. Т.е. мы как бы не занимаемся настройками кеша, все вынесено в конфигурацию. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:07 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Ахахах, просто эталоннейший пример говнозадачи из современной IT-помойки))) Нет, вы только вдумайтесь - сначала придумать показывать пользователю картинки через pdf.js, предварительно конвертируя в pdf (как такая мысль в голову только прийти могла???), потом увидеть, что все это дико тормозит (а вы чего-то другого ожидали?). А теперь, вместо того, чтобы признать, что это решение было, мягко говоря не совсем удачным и сделать по нормальному, начинать городить на говнокоде новый слой говнокода, чтобы заставить старый говнокод хоть как то работать. Нет, оно понятно, если цель - изображать бурную деятельность - вариант беспроигрышный. Наверняка ведь, перед тем как придумать это "гениальное" архитектурное решение c пдфами, было проведено не одно совещание, с рисованиями умных диаграмм на доске и бурными обсуждениями. Хотя за это время можно было бы все по нормальному сделать, но это же работать надо, а не языком чесать. Теперь вот опять активные дебаты на тему, какой кэш приделать, как, куда и зачем. Опять будет проведено несколько совещаний с рассмотрением различных технологий кэширвания, поиском плюсов и минусов, оценками... Главное, что заказчик видит - работа кипит! И денежки несет, конечно же. Я не знаю как долго еще это будет прокатывать, но рано или поздно тренд обязан смениться с вливания бесконечных финансовых ресурсов в эту черную дыру, по какому-то недоразумению называемую "разработкой ПО" на реальную разработку профессионалами в области, собственно, разработки ПО, а не мастеров просиживания штанов в офисе. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:21 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterэту pdf надо еще до браузера донести всю целиком.сколько объем? Я выше писал про килобайты. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:40 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Ржавый гвоздьАхахах, просто эталоннейший пример говнозадачи из современной IT-помойки))) Нет, вы только вдумайтесь - сначала придумать показывать пользователю картинки через pdf.js, предварительно конвертируя в pdf (как такая мысль в голову только прийти могла???), потом увидеть, что все это дико тормозит (а вы чего-то другого ожидали?). А теперь, вместо того, чтобы признать, что это решение было, мягко говоря не совсем удачным и сделать по нормальному, начинать городить на говнокоде новый слой говнокода, чтобы заставить старый говнокод хоть как то работать. Нет, оно понятно, если цель - изображать бурную деятельность - вариант беспроигрышный. Наверняка ведь, перед тем как придумать это "гениальное" архитектурное решение c пдфами, было проведено не одно совещание, с рисованиями умных диаграмм на доске и бурными обсуждениями. Хотя за это время можно было бы все по нормальному сделать, но это же работать надо, а не языком чесать. Теперь вот опять активные дебаты на тему, какой кэш приделать, как, куда и зачем. Опять будет проведено несколько совещаний с рассмотрением различных технологий кэширвания, поиском плюсов и минусов, оценками... Главное, что заказчик видит - работа кипит! И денежки несет, конечно же. Я не знаю как долго еще это будет прокатывать, но рано или поздно тренд обязан смениться с вливания бесконечных финансовых ресурсов в эту черную дыру, по какому-то недоразумению называемую "разработкой ПО" на реальную разработку профессионалами в области, собственно, разработки ПО, а не мастеров просиживания штанов в офисе. Хоспаде, сколько раз зарекался тут что спрашивать. Одним словом, русский форм. Одни ясновидцы и гадалки. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Ржавый гвоздь, ))) Аффтар! Держи удар. Это тоже уметь надо). ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Ржавый гвоздьможно было бы все по нормальному сделать - интересно, "по нормальному" это как? Я участвовал в разработке нескольких ECM систем, так что проблемы ТС мне отчасти понятны. Какой вариант будет "нормальным" в описанной бизнес задаче? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:43 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterтут что спрашиватьэто не тут. Это мужской форум. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:43 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterэту pdf надо еще до браузера донести всю целиком.сколько объем? Я выше писал про килобайты. Объем - по разному. Вы знаете что такое коробочный продукт? Это значит что у тебя кастомеров 200 штук и у всех своя специфика, поэтому все - настраивается, и размер кеша и прочее. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:44 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterтут что спрашиватьэто не тут. Это мужской форум. Ладно, понял, беру свои слова назад про гадалок)) Все норм ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:45 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Kachalovпо нормальному" это как?ТЭО делают и ТЗ с цифрами. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:46 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123Kachalovпо нормальному" это как?ТЭО делают и ТЗ с цифрами. Кастомеров много, отсюда попытки сделать что-то универсально, и вынести все в настройки (тоже беда, кстати, softcoding ) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:48 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, Превью сжимается в сотни раз. Вы же можете дать цифры. Это же не ДСП и не сов. Секретно. Вы сказали про время передачи клиента..... ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:50 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterуниверсальноэто у всех проблема. Не бывает универсального. Увы. Один качает Войну и мир, другой работает с фото 3 на 4. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:51 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Ржавый гвоздьАхахах, просто эталоннейший пример говнозадачи из современной IT-помойки))) Нет, вы только вдумайтесь - сначала придумать показывать пользователю картинки через pdf.js, предварительно конвертируя в pdf (как такая мысль в голову только прийти могла???), потом увидеть, что все это дико тормозит (а вы чего-то другого ожидали?). А теперь, вместо того, чтобы признать, что это решение было, мягко говоря не совсем удачным и сделать по нормальному, начинать городить на говнокоде новый слой говнокода, чтобы заставить старый говнокод хоть как то работать. Нет, оно понятно, если цель - изображать бурную деятельность - вариант беспроигрышный. Наверняка ведь, перед тем как придумать это "гениальное" архитектурное решение c пдфами, было проведено не одно совещание, с рисованиями умных диаграмм на доске и бурными обсуждениями. Хотя за это время можно было бы все по нормальному сделать, но это же работать надо, а не языком чесать. Теперь вот опять активные дебаты на тему, какой кэш приделать, как, куда и зачем. Опять будет проведено несколько совещаний с рассмотрением различных технологий кэширвания, поиском плюсов и минусов, оценками... Главное, что заказчик видит - работа кипит! И денежки несет, конечно же. Я не знаю как долго еще это будет прокатывать, но рано или поздно тренд обязан смениться с вливания бесконечных финансовых ресурсов в эту черную дыру, по какому-то недоразумению называемую "разработкой ПО" на реальную разработку профессионалами в области, собственно, разработки ПО, а не мастеров просиживания штанов в офисе. Ты зря набросился на автора. Он-же пишет дескыть "не могу драйвить" решения. Значит он - человек подневольный. Кодит как сказали. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:52 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiter, Превью сжимается в сотни раз. Вы же можете дать цифры. Это же не ДСП и не сов. Секретно. Вы сказали про время передачи клиента..... Да с чего оно сожмется-то?) Ну был doc 50kb, стал pdf 50kb (ну примерно). Но реально какие use cases у разных кастомеров будут, я не знаю. Может у них файлы по 50 мегабайт? Тогда просто отключим для них превью и все, как-то так. Т.е. мы кастомер решает в итоге. Ну вот например, Java Concurrency In Practice.pdf, сейчас приаттачил, весит 6.3 мегабайта - от сервера до моего браузера идет 3 секунды. Но эти цифры ничего не значат, это же зависит от сети, от инфраструктуры. Понятно - чем больше, тем дольше. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:55 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterуниверсальноэто у всех проблема. Не бывает универсального. Увы. Один качает Войну и мир, другой работает с фото 3 на 4. Воот, все верно. Некоторые вообще чертежи хранят в нашей системе, и им этот pdf.js вообще не нужен, мы им API, они по нему свой вьювер заимплементили и во фрейме встроили на страницу. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 18:57 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterНо реально какие use cases у разных кастомеров будут, я не знаю.рассказываю наш на одной работе. Юзвери сканили договора на МФУ и заливали систему. Так как там по умолчанию 600 или 1200 DPI параметр скана по умолчанию, то pdf были огромные. И место быстро кончилось. Они просто не тыкали сканер на меньшее разрешение. ... Как костыль, я делал утилиту, которая в цикле проходила и уменьшала разрешение сканов внутри pdf. Можно и на входе было это делать. Это просто юз кейс недоработок постановки. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:16 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterМожет у них файлы по 50 мегабайт? Тогда просто отключим для них превью и все, как-то так.может наоборот? Включить? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:19 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterим этот pdf.js вообще не нужентебе Ржавый гвоздь про это и намекнул) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:21 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
И не путай процесс конвертации и процесс кеширования. Удачи! ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:22 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterМожет у них файлы по 50 мегабайт? Тогда просто отключим для них превью и все, как-то так.может наоборот? Включить? Да, есть такая тема, если какая-то проблема никак не решается, надо ее усугубить) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:30 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123И не путай процесс конвертации и процесс кеширования. Удачи! Ну да, это два разных процесса, НО! Чтобы самому не заморачиваться с многопоточкой, я делегировал это Ehcache. Короче настроил read through. И когда вызываем cache.get(attachmentKey) - то кеш проверяет, есть ли entry с таким ключем, если нет, то он загружает аттач и конвертирует его в pdf, добавляет в кеш, и возвращает. И все это thread safe, всмысле не будет несколько конвертаций одного и того же аттача бестолку (thundering-herd). Только вот я хотел асинхронные сервлет сделать, чтобы поток не простаивал во время конвертации. А так получается он будет заблокирован во время вызова cache.get. Да ну и фиг с ним! Зато прозрачно. Короче вся сложность - внутри ehcache. А этим ребятам я доверяю. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:37 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterPetro123пропущено... может наоборот? Включить? Да, есть такая тема, если какая-то проблема никак не решается, надо ее усугубить)не. Если меговые файлы, то 2 решения: - превью в базе - кеш хоть на клиенте ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:40 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterPetro123rabiter, Превью сжимается в сотни раз. Вы же можете дать цифры. Это же не ДСП и не сов. Секретно. Вы сказали про время передачи клиента..... Да с чего оно сожмется-то?) Ну был doc 50kb, стал pdf 50kb (ну примерно). Но реально какие use cases у разных кастомеров будут, я не знаю. Может у них файлы по 50 мегабайт? Тогда просто отключим для них превью и все, как-то так. Т.е. мы кастомер решает в итоге. Ну вот например, Java Concurrency In Practice.pdf, сейчас приаттачил, весит 6.3 мегабайта - от сервера до моего браузера идет 3 секунды. Но эти цифры ничего не значат, это же зависит от сети, от инфраструктуры. Понятно - чем больше, тем дольше. В бытность когда учился. Любил тырить из лабораторных классов различные pdf на дискетке. Тогда по сетям раннего интернета и FIDO гуляли приличные книги по программированию. Были отсканированы картинками в 300dpi с black&white цветом (это вырвиглазно!) и сконверчены в pdf. Я из соображений экономии ресурсов написал прогу на сях которая выкусывала из pdf картинки по сигнатурам. Это было несложно. В основном зависело от формата. Чуть позже я догадался их переводить в многостраничные tiff-документы (было такое) и далее уже хранил у себя. Жлобские проги открывали pdf на слабых четвёрках и Пеньтиумах до 5 минут. А мой формат открывался почти мгновенно. Это было время чудовищной экономии. Но это point автору, что не стоит вовлекать без смысла в стек технологии которые не нужны или превышают потребности кастомера в 1000 раз. Реально. Формат картинки jpeg/png уже лет 20 не менялся. А сколько патчей было накатано на pdf? И сколько инцедентов безопасности? Сколько дыр? Сколько проблем с простой печатью на принтере если контент защищён? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:41 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, Про кеш не ко мне. Я его не могу оценивать до Модели. Если модель кривая, то кеш только продлит агонию. Про модель я выше писал. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
у нас используется hazelcast - поддерживается в Spring Data ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:43 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Герой дняу нас используется hazelcast - поддерживается в Spring Data Да. Кстати. Можете рассказать по лицензиям? Вроде как платная версия Hazelcast должна включать в себя off-heap доступ к памяти. Верно? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:49 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonrabiterпропущено... Да с чего оно сожмется-то?) Ну был doc 50kb, стал pdf 50kb (ну примерно). Но реально какие use cases у разных кастомеров будут, я не знаю. Может у них файлы по 50 мегабайт? Тогда просто отключим для них превью и все, как-то так. Т.е. мы кастомер решает в итоге. Ну вот например, Java Concurrency In Practice.pdf, сейчас приаттачил, весит 6.3 мегабайта - от сервера до моего браузера идет 3 секунды. Но эти цифры ничего не значат, это же зависит от сети, от инфраструктуры. Понятно - чем больше, тем дольше. В бытность когда учился. Любил тырить из лабораторных классов различные pdf на дискетке. Тогда по сетям раннего интернета и FIDO гуляли приличные книги по программированию. Были отсканированы картинками в 300dpi с black&white цветом (это вырвиглазно!) и сконверчены в pdf. Я из соображений экономии ресурсов написал прогу на сях которая выкусывала из pdf картинки по сигнатурам. Это было несложно. В основном зависело от формата. Чуть позже я догадался их переводить в многостраничные tiff-документы (было такое) и далее уже хранил у себя. Жлобские проги открывали pdf на слабых четвёрках и Пеньтиумах до 5 минут. А мой формат открывался почти мгновенно. Это было время чудовищной экономии. Но это point автору, что не стоит вовлекать без смысла в стек технологии которые не нужны или превышают потребности кастомера в 1000 раз. Реально. Формат картинки jpeg/png уже лет 20 не менялся. А сколько патчей было накатано на pdf? И сколько инцедентов безопасности? Сколько дыр? Сколько проблем с простой печатью на принтере если контент защищён? Ах, студенческие годы... У нас копирование с дискет было возможно только через лаборантов и в часы копирования. По поводу pdf - мне тоже не нравится формат, если честно, какой-то он перегруженый. И к тому же, его нельзя стримить, т.е. нужен весь файл, чтобы отобразить. Ну и да, дыры в безопасности. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:51 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterпропущено... Да, есть такая тема, если какая-то проблема никак не решается, надо ее усугубить)не. Если меговые файлы, то 2 решения: - превью в базе - кеш хоть на клиенте согласен! ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:52 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Герой дняу нас используется hazelcast - поддерживается в Spring Data Это интересно! Я бы поработал с hazelcast! Но по сути, я из всей мощи этих продуктов (ehcache, hazelcast), использую только локальное кеширование (не распределенное), так что особо без разницы) ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 19:53 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiter, Про кеш не ко мне. Я его не могу оценивать до Модели. Если модель кривая, то кеш только продлит агонию. Про модель я выше писал. Концепт прост, мы снабжаем кеш стратегией, как ему себя вести, если к нему обращаются за данными, которых в нем нет. Так вот, пусть он знает где лежат данные и как их взять (для меня это включает еще и конвертацию). Т.е. получается все очень упрощается. Мы работаем с кешем так, словно в нем всегда уже есть данные, которые нам нужны, вот и все (а он там догружает сам, чего нет). ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 20:02 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonГерой дняу нас используется hazelcast - поддерживается в Spring Data Да. Кстати. Можете рассказать по лицензиям? Вроде как платная версия Hazelcast должна включать в себя off-heap доступ к памяти. Верно? лицензия бесплатная, там платный Monitor - но он не нужен, достаточно в лог писать состояние кешей и потом разбирать Плюс, там удобство в том, что имеется мастер-слейв + локальные синхронизируемые кеши, и все это бесплатно ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 20:02 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterPetro123rabiter, Про кеш не ко мне. Я его не могу оценивать до Модели. Если модель кривая, то кеш только продлит агонию. Про модель я выше писал. Концепт прост, мы снабжаем кеш стратегией, как ему себя вести, если к нему обращаются за данными, которых в нем нет. Так вот, пусть он знает где лежат данные и как их взять (для меня это включает еще и конвертацию). Т.е. получается все очень упрощается. Мы работаем с кешем так, словно в нем всегда уже есть данные, которые нам нужны, вот и все (а он там догружает сам, чего нет). это же неправильно, кэш не должен что-то искать ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 20:03 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Герой дняrabiterпропущено... Концепт прост, мы снабжаем кеш стратегией, как ему себя вести, если к нему обращаются за данными, которых в нем нет. Так вот, пусть он знает где лежат данные и как их взять (для меня это включает еще и конвертацию). Т.е. получается все очень упрощается. Мы работаем с кешем так, словно в нем всегда уже есть данные, которые нам нужны, вот и все (а он там догружает сам, чего нет). это же неправильно, кэш не должен что-то искать Да это неправильно. У кешей есть темпоральные эвристики. И они основаны на различных стратегиях и формулах со временем. И если подсунуть кешу фейковое существование всех данных то эта формула будет нарушена. Или эта стратегия должна в себя включать формулу. Вобщем я-бы попросил эту стратегию в студию. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 20:18 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterПо поводу pdf - мне тоже не нравится формат, если честно, какой-то он перегруженый. И к тому же, его нельзя стримить, т.е. нужен весь файл, чтобы отобразить.Почитайте спецификацию чтоли для начала, ну или если лень читать, то попробуйте открыть вот это в хроме и мозилле, а потом расскажите о наблюдениях. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 20:45 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Постранично вроде стримится. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 20:54 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Герой дняrabiterпропущено... Концепт прост, мы снабжаем кеш стратегией, как ему себя вести, если к нему обращаются за данными, которых в нем нет. Так вот, пусть он знает где лежат данные и как их взять (для меня это включает еще и конвертацию). Т.е. получается все очень упрощается. Мы работаем с кешем так, словно в нем всегда уже есть данные, которые нам нужны, вот и все (а он там догружает сам, чего нет). это же неправильно, кэш не должен что-то искать Ну вот у вас написано откуда, obmanula.ru, я туда зашел, а там ничего нет, это же тоже неправильно, но однако! Касательно кеша - это один из шаблонов работы с кешем, иногда очень удобно (read-through). ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:02 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Talk is cheap. Show me code. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:04 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonГерой дняпропущено... это же неправильно, кэш не должен что-то искать Да это неправильно. У кешей есть темпоральные эвристики. И они основаны на различных стратегиях и формулах со временем. И если подсунуть кешу фейковое существование всех данных то эта формула будет нарушена. Или эта стратегия должна в себя включать формулу. Вобщем я-бы попросил эту стратегию в студию. Да, а это уже аргумент! Спасибо за информацию. Но в моем случае, какая там формула, какая эвристика, кеш с размером в 5-10 кешируемых элементов. Но на больших данных - согласен, недопустимо! ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:04 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей ПанфиловrabiterПо поводу pdf - мне тоже не нравится формат, если честно, какой-то он перегруженый. И к тому же, его нельзя стримить, т.е. нужен весь файл, чтобы отобразить.Почитайте спецификацию чтоли для начала, ну или если лень читать, то попробуйте открыть вот это в хроме и мозилле, а потом расскажите о наблюдениях. Вы думаете мне не хватает спецификаций или чего "почитать"? Хотя спасибо, конечно, и за ссылку :-) pdf.js, кстати, это то, что в firefox используется как внутренний viewer. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:06 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonПостранично вроде стримится. Как я понял из нескольких источников, там таблица с тем, что где находится внутри pdf, находится в самом конце этого Pdf. Т.е. надо весь качать. Хотя, есть сервак поддерживает ranged request, можно сам этот хвост pdf и скачать с сервака. Pdf.js, кстати, так умеет делать. Но с ranged request мне как-то не хотелось разбираться. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:08 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
[quot Андрей Панфилов]rabiterпопробуйте открыть вот это в хроме и мозилле, а потом расскажите о наблюдениях. в хроме в итоге заргузилось, мозилы под рукой нет (рабочий ноут уже выключил), а что там? Может кто проверить? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:11 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей ПанфиловПочитайте спецификацию чтоли для начала, ну или если лень читать, то попробуйте открыть вот это в хроме и мозилле, а потом расскажите о наблюдениях.я так понял - трафик отдачи очень слабый.... ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 21:15 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
вадяАндрей ПанфиловПочитайте спецификацию чтоли для начала, ну или если лень читать, то попробуйте открыть вот это в хроме и мозилле, а потом расскажите о наблюдениях.я так понял - трафик отдачи очень слабый.... Не, дело не в трафике, pdf весит 350 мегабайт. Это демонстрация, pdf viewer из хрома ничего не показывает, пока всю ее не скачает. А вот PDF.js использует ranged header (т.е. может запросить сначала хвост pdf файла, с reference таблицей, а потом уже все остальное). В итоге получается, что firefox (который использует pdf.js) начинает уже показывать первые страницы pdf до его полной загрузки. @Андрей Панфилов, спасибо за демонстрацию! Но камень в огород формата pdf, что им стоило это reference таблицу вначале файла разместить? ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 22:55 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
хмм, а это мысль, можно заморочиться и проверить, как включить (и возможно ли вообще, и что это такое) ranged headers на Wildfly, Glassfish и Websphere - это сервера, что мы поддерживаем. По крайней мере, таску на будущее можно создать. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2019, 22:58 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterНо камень в огород формата pdf, что им стоило это reference таблицу вначале файла разместить? PDF Linearization ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2019, 06:07 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterКонцепт прост, мы снабжаем кеш стратегией, хм.. Я вам три раза сказал: Превью_в_БД <---> Конвертация <---> Кеш Вы уперлись 10 страниц в кеш, а это выше 3 ВЗАИМОИСКЛЮЧАЮЩИХ и ВЛИЯЮЩИХ параметра. - поставь превью и кеш не нужен - убери PDF и кеш не нужен Сейчас ты кешем делаешь костыль для не оптимизированных других двух параметров. ... Как вариант, делай заказчику ВСЕ 3 ПАРАМЕТРА: - вкл\выкл превью - вкл\выкл конвертаци. в PDF - вкл\выкл кеш сервере - вкл\выкл кеш в базе клиента localStorage IE11 ....... Я понимаю, что счас вы просто обучаетесь работе с кешем за счет фирмы. Т.к. на конечный юз кейс это мало повлияет. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2019, 11:47 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterpdf весит 350 мегабайт.сколько страниц? Одна? 350? ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2019, 11:50 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonПостранично вроде стримится. где? http://files.stroyinf.ru/Data/46/4669.pdf У него наиважнейшая цель шрифты правильно показать и верстку. А не стримится постранично. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2019, 11:55 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, выше моя ссылка - 4 мегабайт PDF - 40 страниц. На какой странице топика мы от вас цифр дождёмся - фиг знает. Вы наверно топик не читаете. Кешем заняты. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.03.2019, 11:57 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123maytonПостранично вроде стримится. где? http://files.stroyinf.ru/Data/46/4669.pdf У него наиважнейшая цель шрифты правильно показать и верстку. А не стримится постранично. Ну ОК. Согласен. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 00:37 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterpdf весит 350 мегабайт.сколько страниц? Одна? 350? Нет, там несколько, возможно это была демонстрация линеризации pdf (постобработка, см. ссылку от Андрея Панфилова). А может range headers, еще не рахзобрался, в понедельник на работе поэкспериментирую и с тем и с тем. Хромовский вьювер, кстати, отображает эту 350 pdf только после того, как уеликом загрузит. А вот PDF.js (firefox), почти сразу начинает от отображать первые страницы. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:09 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterКонцепт прост, мы снабжаем кеш стратегией, хм.. Я вам три раза сказал: Превью_в_БД <---> Конвертация <---> Кеш Вы уперлись 10 страниц в кеш, а это выше 3 ВЗАИМОИСКЛЮЧАЮЩИХ и ВЛИЯЮЩИХ параметра. - поставь превью и кеш не нужен - убери PDF и кеш не нужен Сейчас ты кешем делаешь костыль для не оптимизированных других двух параметров. ... Как вариант, делай заказчику ВСЕ 3 ПАРАМЕТРА: - вкл\выкл превью - вкл\выкл конвертаци. в PDF - вкл\выкл кеш сервере - вкл\выкл кеш в базе клиента localStorage IE11 ....... Я понимаю, что счас вы просто обучаетесь работе с кешем за счет фирмы. Т.к. на конечный юз кейс это мало повлияет. Честно говоря не понял что вы имеете ввиду) Какой превью? Унас нет превью. Точнее наше "превью", это конвертация в pdf и отображение его в pdf.js. Кеш в localStorage не вариант... слишком маленький размер для кеша. Сколько там, всего мегабайт 5? Еще и browser specific. Кеш в хранилище - самый адекватный вариант, но это другая история. Вы поймите, вариант с кешированием файлов в памяти я не одобряю, эта таска мне пришла сверху. И не потому что реальные проблемы где-то, а потому что архитект так решил (преждевременная оптимизация короче). Эта версия с pdf.js вообще еще не в продакшене даже. Я архитекта предупредил, что могут быть проблемы, и что на деле это короче бред а не оптимизация, но решили все равно сделать. А я конечно рад с ehcahce поработать, давно приглядываюсь. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:28 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiter, выше моя ссылка - 4 мегабайт PDF - 40 страниц. На какой странице топика мы от вас цифр дождёмся - фиг знает. Вы наверно топик не читаете. Кешем заняты. Читаю, но выходной же) Завтра гляну погоняю этот pdf тоже. По поводу цифр - какие цифры? Ну хорошо, примерно так, размер аттачей я не знаю, может быть разный, от десятков килобайт до десятков мегабайт. Но в реальности, думаю, будет стоять трешхолд на отключение превью (отображение в pdf.js) для всех аттачей с размером больше 100кб. Но это настраивается! Для каждого пользователя будет кешироваться максимум 5-10 аттачей в сессии (тоже настраивается). Вот какие-то такие цифры. Одновременных пользователей больше 100-150 не предвидится. Тут все очень зависит от кастомера. У некоторых может быть и 1000 пользователей, но это отдельные случаи. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:38 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Андрей ПанфиловrabiterНо камень в огород формата pdf, что им стоило это reference таблицу вначале файла разместить? PDF Linearization Спасибо за ссылку! Не знал про линеризацию. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:39 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterPetro123пропущено... сколько страниц? Одна? 350? Нет, там несколько, возможно это была демонстрация линеризации pdf (постобработка, см. ссылку от Андрея Панфилова). А может range headers, еще не рахзобрался, в понедельник на работе поэкспериментирую и с тем и с тем. Хромовский вьювер, кстати, отображает эту 350 pdf только после того, как уеликом загрузит. А вот PDF.js (firefox), почти сразу начинает от отображать первые страницы.вот понедельник экспериментируй и расскажешь. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:42 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Я спросил что находится в файле 350 мегов. Ты вывалил кучу букв и все не по делу. 2) Превью, это в бд рядом с документом доп.поле в 100 раз меньше. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:48 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterЧестно говоря не понял что вы имеете ввиду) Какой превью? Унас нет превью.нда.. Я предложил метод превью, тогда твой метод с кешем выкинуть на помойку. Так понятно? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:53 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123Я спросил что находится в файле 350 мегов. Ты вывалил кучу букв и все не по делу. 2) Превью, это в бд рядом с документом доп.поле в 100 раз меньше. В файле 350 мегабайт - картинки на каждой странице. Ок, такого превью у нас нет. Мы конвертим файлы целиком в pdf и показываем в pdf.js (вы превратить способны в попугая). Эти pdf по размеру могут быть такого же размера в основном, как и оригинал. Но их я бы сохранял в хранилище вместе с оригиналами. И делал бы это не по требованию, а заранее какой-нибудь асинхронной джобой (например, ночью). ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:58 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterЧестно говоря не понял что вы имеете ввиду) Какой превью? Унас нет превью.нда.. Я предложил метод превью, тогда твой метод с кешем выкинуть на помойку. Так понятно? Превью не нужен. Это только первая страница? Не нужен. Нужна вся pdf. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 18:59 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterPetro123пропущено... нда.. Я предложил метод превью, тогда твой метод с кешем выкинуть на помойку. Так понятно? Превью не нужен. Это только первая страница? Не нужен. Нужна вся pdf. Короче, норм решение было бы асинхронно конвертить файлы в pdf и сохранять в хранилище вместе с оригиналами, постобрабатывать их (линеризация), и все. Согласны? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:00 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterrabiterпропущено... Превью не нужен. Это только первая страница? Не нужен. Нужна вся pdf. Короче, норм решение было бы асинхронно конвертить файлы в pdf и сохранять в хранилище вместе с оригиналами, постобрабатывать их (линеризация), и все. Согласны? Асинхронно я сказал, я имел ввиду какой-нибудь джобой ночью, например. Но это получается, что размер хранилища вырастит в два раза. Тот превью первой страницы, который вы предложили - никому тут не нужен, по крайней мере пока (но я понял, конечно, о чем вы). ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:02 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Дисковые ресурсы щас - копеечные. Купили себе S3? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:07 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, Нет. Превью все страницы. Формат разный. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:48 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
maytonДисковые ресурсы щас - копеечные. Купили себе S3? Amazon вроде не поддерживаем. Но список различных поддерживаемых хранилищ весьма длинный. Т.е. зависит от того, что есть у кастомера, что он хочет. И тут уже возможны варианты по стоимости) ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:50 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterИ делал бы это не по требованию, а заранее какой-нибудь асинхронной джобой (например, ночью).да. Разумеется. И что мешает? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:51 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterТот превью первой страницы, который вы предложилиты как всегда все перепутал ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:52 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterконвертить файлы в pdfнет. Превью это часто тот же формат, но низкого разрешения. Можно сменить формат... По настройкам и желанию. Не надо все в pdf. Только текстовые. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:55 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiter, Скоро 7 страниц, а ты никак не поймешь что такое превью. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 19:57 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Подобно тому как все дороги ведут в Рим. Все технологии оптимизации preview приведут нас к дисковому хранилищу картинок. +Разные там eTag, expired e.t.c. джобы которые обновляют кеши. Но это уже детали реализации. И нет на свете другого способа сделать кастомера happy... ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2019, 20:34 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiterконвертить файлы в pdfнет. Превью это часто тот же формат, но низкого разрешения. Можно сменить формат... По настройкам и желанию. Не надо все в pdf. Только текстовые. как ты уменьшишь формат-то? вот у тебя doc с текстом, конвертируем в pdf, тот же размер, то же количество слов. только картинки если есть в документе, их да, можно уменьшить. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2019, 11:50 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
Petro123rabiter, Скоро 7 страниц, а ты никак не поймешь что такое превью. у меня ещё две недели до отпуска, так что время общаться есть. и опять же, люблю поговорить с приятными людьми! ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2019, 11:51 |
|
Выбор технологии кеширования
|
|||
---|---|---|---|
#18+
rabiterPetro123пропущено... нет. Превью это часто тот же формат, но низкого разрешения. Можно сменить формат... По настройкам и желанию. Не надо все в pdf. Только текстовые. как ты уменьшишь формат-то? вот у тебя doc с текстом, конвертируем в pdf, тот же размер, то же количество слов. только картинки если есть в документе, их да, можно уменьшить.выше ссылку дал на pdf. Жду от тебя ссылку что нельзя уменьшить размер. И как я уменьшал картинки тоже говорил выше. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.03.2019, 12:00 |
|
|
start [/forum/topic.php?all=1&fid=59&tid=2121425]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
44ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
124ms |
get tp. blocked users: |
1ms |
others: | 311ms |
total: | 522ms |
0 / 0 |