Тяпничный криптунЪ и редукция / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Тяпничный криптунЪ и редукция

15 сообщений из 90, страница 4 из 4

все

Тяпничный криптунЪ и редукция

#39910067

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

mayton

Dima T

Операций не куча, а ровно столько сколько разрядов

То что ты сказал - справедливо только для сложения и вычитания. Там - линейная сложность.

Умножение и деление двоичных чисел - имеет примерно от квадрата до икс в степени 1.2 complexity.

Ну это же элементарно: для перевода числа в N-разрядность просто делим его на N: остаток это значение разряда, частное это все высшие разряды.

Например 137 переводим в HEX:
137/16 = 8 частное 9 остаток
8 / 16 = 0 частное 8 остаток
Итого 137 = 89h

...

Рейтинг:

0 / 0

30.12.2019, 20:51:24

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910069

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

mayton

Dima T

Для 137 это до 256, т.е. писать как есть. Потери всего 1 байт на 10 символов, т.е. таблица займет на 10% больше места.

Да я думаю не о потерях 10% а о корректности и о возможных false-positive срабатываниях.
Но если у меня будет алфавит из 129 символов то я точно буду брать расширять до байта.
Делить по модулю 129 мне точно не захочется. Да и медленно.

Какие ложные срабатывания? Если формат хранения допускает избыточность, то на берегу проверяй соответствие значения формату, т.е. в расчеты должны идти только правильные значения, мусор надо убирать на входе.

...

Рейтинг:

0 / 0

30.12.2019, 20:58:58

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910122

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Делить не придется, надо будет складывать умножать. Мы же на вход получаем ключ в N-рязрядном представлении и его надо преобразовать в двоичное, т.е. в число, а для этого надо умножать, например 4 разряда:

Код: plaintext

key = ((Р ₃ *N + Р ₂ )*N + Р ₁ )*N + Р ₀

...

Рейтинг:

0 / 0

31.12.2019, 09:44:00

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910231

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Еще подумал, если умножать и складывать так

Код: plaintext

P ₀  + P ₁ *N + P ₂ *N ²  + P ₃ *N ³

где N ^X заранее посчитано, то такая конструкция параллелится процом во время выполнения и займет пару тактов, т.е. не тормоз.

...

Рейтинг:

0 / 0

31.12.2019, 16:49:43

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910240

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima T

mayton

пропущено...

Да я думаю не о потерях 10% а о корректности и о возможных false-positive срабатываниях.
Но если у меня будет алфавит из 129 символов то я точно буду брать расширять до байта.
Делить по модулю 129 мне точно не захочется. Да и медленно.

Давай рассуждать. Существуют ли такие редукты у которых разные хеши?
Ключ (к примеру) имеет длину до 12 символов. Это разумная длина.
Хеш SHA1 имеет длину 160 бит. Мощность множества хешей SHA1 во много
раз превышает мощность множества 12 символьных ключей.

Следовательно по принципу Дирихле существуют. Как 2 кролика в 1 клетке.
Или как следствие из того что хширование - это сурьективная функция.
И редуцирование - тоже сурьективная. Хотя если-бы мы увеличили длину
ключа до 20 символов тогда возможно и редукция стала-бы однозначной.

...

Рейтинг:

0 / 0

31.12.2019, 18:05:06

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910515

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Ты меня запутал. Похоже мы по-разному понимаем твой пост 22051757
Я так понимаю что речь была о выходе за границы алфавита, т.е. при алфавите в 137 разрядов, чтобы не делить, делаем редукцию в 256, в результате часть разрядов ключа окажется за пределами алфавита, поэтому тут надо изобретать какое-то преобразование к алфавиту ключа. Причем алфавит еще и рваный, т.к. это строка. Можно без деления обойтись, например таблицей.

mayton

Dima T

пропущено...

Какие ложные срабатывания? Если формат хранения допускает избыточность, то на берегу проверяй соответствие значения формату, т.е. в расчеты должны идти только правильные значения, мусор надо убирать на входе.

Давай рассуждать. Существуют ли такие редукты у которых разные хеши?

Ключ (к примеру) имеет длину до 12 символов. Это разумная длина.
Хеш SHA1 имеет длину 160 бит. Мощность множества хешей SHA1 во много
раз превышает мощность множества 12 символьных ключей.

Следовательно по принципу Дирихле существуют. Как 2 кролика в 1 клетке.
Или как следствие из того что хширование - это сурьективная функция.
И редуцирование - тоже сурьективная. Хотя если-бы мы увеличили длину
ключа до 20 символов тогда возможно и редукция стала-бы однозначной.

ИМХО Хэширование не гарантирует что два разных ключах будут иметь одинаковый хэш. Повышая мошность хэша мы снижаем вероятность возникновения такой ситуации, но не исключаем ее. То же с редукцией, обязательно будут разные хэши, которые дадут один и тот же ключ.
Собственно поэтому в статье автор честно предупредил что будут возникать зацикливание и вырождение цепочек.

...

Рейтинг:

0 / 0

03.01.2020, 08:21:21

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910521

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Как вариант алгоритма быстрой редукции 20 байт хэша в 12 байт алфавита:
1. При старте делаем таблицу 4 Кб (2 ¹² элементов) , где зациклен алфавит ключа: "1234567890123456....".
2. 12 раз от хэша взять по полтора байта (12 бит), использовать каждый как индекс массива, в итоге получаем разряд ключа.

Никаких делений не надо. Получение элемента по индексу массива легкая операция и плюсом проц запараллелит получение разных разрядов.

ИМХО одного байта для индекса недостаточно, т.к. тогда таблица будет 256 байт и значения будут неравномерно распределены, некоторые один раз, некоторые два, т.е. вероятность получения одних вдвое выше других. При 4 Кб (2 ¹² ) и алфавите 137 символов повторов будет 29-30, т.е. разброс 3%.

...

Рейтинг:

0 / 0

03.01.2020, 10:03:00

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910608

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Мне кажется что тема кешей перекликается с этой. Если заниматься глубокой оптимизацией самого
процесса генерации. Например.

1) Фаза №1. Для данного алфавита 8 alpha-numeric (к примеру) генерируем радужку с параметром t=10.
2) Получаем CSV-файл вида. В каждой строке - 10 редукций.

Код: sql

1.
2.
3.

key,reduct10
00000000,as9d8fl4
zzzzzzzz,0df43511

3) Некоторые key избыточны т.к. уже включены в цепочку редукций. Вопрос.
Каким образом их искать? В процессе генерации? Или после? Где их хранить?
База данных? Текстовый файл с сортировкой? Какие-то виды хеш-таблиц на диске?
Специализированные key-value библиотеки. Может в фазе построения - хранить
развёрнутую цепочку? Потом сворачивать после унификации?

...

Рейтинг:

0 / 0

03.01.2020, 16:01:16

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910614

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Тут маленькая проблема, одна цепочка может быть миллиарды ключей, сохранить в памяти целиком не получится. Думаю надо точечно хранить, например каждую миллионную точку

...

Рейтинг:

0 / 0

03.01.2020, 17:26:06

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910616

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Да. Так вот вопрос. Как оптимально искать?

...

Рейтинг:

0 / 0

03.01.2020, 17:35:29

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910644

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

mayton

Да. Так вот вопрос. Как оптимально искать?

Я уже написал как: каждую миллионную точку, т.е. построить глобальное хранилище миллионных точек всех считающих потоков и синхронизировать в каждый. Т.е. в каждом считающем потоке будет миллион уже обсчитанных ключей, 10-12 Мб, возможно больше потребуется, тут все эмпирически определяется, хранилище надо будет синхронизировать регулярно и каждый свежий ключ проверять на наличие в хранилище. А может Амдал не даст развернуться и надо будет изобретать что-то еще.

Собственно можно уже написать, но зачем? Уже написано.

...

Рейтинг:

0 / 0

03.01.2020, 19:35:44

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910645

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Вот в смежном топике один господин беспокоился об использовании (утилизации) кешей.

А я вижу в этой задаче краш-тест для кеша. Ну... помнишь по аналогии с CardRaytracer.
Я его специально подбирал чтоб только CPU грузил но память и диск не трогал.

А эта задача - будет шатать L1/L2/L3 с полной амплитудой.

...

Рейтинг:

0 / 0

03.01.2020, 19:41:35

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910648

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

mayton

А эта задача - будет шатать L1/L2/L3 с полной амплитудой.

Не будет, тут объемы данных на порядки выше кэшей проца, тут бы в своп не уйти и то уже замечательно. Хотя уйти в своп в NMVe это не так уж и медленно.

PS Интересно, есть ли управление некэшированием, т.е. дать понять процу не кэшировать то, что заведомо известно в кэше искать не потребуется.

...

Рейтинг:

0 / 0

03.01.2020, 20:24:41

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910811

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Не знаю. С моей точки зрения уход в своп - это потеря контроля над ситуацией.

Кстати. Знаешь что в Linux (RHEL) существуют весьма скромные рекомендации по формуле
размера своп-диска? Там он не выходит в терабайты.

Смотри https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/storage_administration_guide/ch-swapspace

Для моей конфигурации (не RHEL но похожей), я поставил RAM=8G, Swap=8G.

...

Рейтинг:

0 / 0

04.01.2020, 21:42:59

| Ответить | Цитировать | Написать

Тяпничный криптунЪ и редукция

#39910818

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

mayton

Не знаю. С моей точки зрения уход в своп - это потеря контроля над ситуацией.

Верно, в данной задаче надо просчитывать чтобы не было свопа, а не непопадание в кэши.

mayton

Кстати. Знаешь что в Linux (RHEL) существуют весьма скромные рекомендации по формуле
размера своп-диска? Там он не выходит в терабайты.

Смотри https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/storage_administration_guide/ch-swapspace

Для моей конфигурации (не RHEL но похожей), я поставил RAM=8G, Swap=8G.

Это общие рекомендации. Я их вообще не понимаю, хотя догадываюсь что они основаны на ожидании какой-нибудь задачи, которая увидит сколько есть реальной памяти и постарается занять ее всю. В виндовсе по умолчанию на всякий случай еще умножили на 1.5.

Например если я воткнул 32 Гб оперативки в свой комп, то я ожидаю что свопа не будет вообще, но виндовс по дефолту займет 48 Гб под своп на моем SSD в 110 Гб (((

Я в виндовсе всегда принудительно выставляю минимальный размер свопа 16 Мб, максимальный - рекомендуемый 1.5 от размера памяти. Еще гибернайт выключаю, т.к. состояние памяти туда скидывается перед усыплением, но по факту он нафиг не нужен, т.к. все ширпотребные проги периодически сохраняют свое несохраненное состояние и при старте после сбоя предлагают к нему вернуться.
Реальный размер свопа у меня обычно 16 Мб, иногда до 1 Гб вырастает на компах где памяти 2-4 Гб.

...

Рейтинг:

0 / 0

04.01.2020, 22:11:47

| Ответить | Цитировать | Написать

15 сообщений из 90, страница 4 из 4

все

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Тяпничный криптунЪ и редукция

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&msg=39910818&tid=1339856]:	0ms
get settings:	6ms
get forum list:	20ms
check forum access:	4ms
check topic access:	4ms
track hit:	67ms
get topic data:	13ms
get forum data:	3ms
get page messages:	72ms
get tp. blocked users:	2ms
others:	230ms

total:	421ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы