Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Иван FXSадаптировать алгоритм сжатия под конкретную последовательность (подбирая в нём значение некоторого параметра) -- это всё-таки совершенно не называется "изобрести новый алгоритм сжатия"За неимением вашего алгоритма, я могу сослаться на существующие и вполне обоснованно утверждать, что разные режимы одного алгоритма дают разницу на проценты для больших объёмов хорошо сжимаемых данных. А вы предлагаете манипулировать сотнями-тысячами бит потенциально плохо сжимаемых данных - параметру тупо не хватит материала для набора статистики. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.01.2018, 21:46 |
|
||
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Иван FXSalekcvpВ случае же абсолютно случайной последовательности (любой разрядности) - повторяющихся групп чисел либо не будет вовсе, либо будет минимальное количество минимальной длины, соответственно и сжать таким образом её не получится. -- будут и повторы, и любой, вообще говоря, длины. А сжать не получится потому, что нужно будет сохранить также и словарь, который "сожрёт" весь эффект от сжатия (это перекличка с соседней темой про "генерируемый словарь"). А если был бы "параллельный льготный тариф" для отправки (хранения) словаря, то можно было бы забацать "словарь" из одного слова ( = отправляемый текст). Тогда сам "архив" имел бы длину 1 бит. Я изначально предложил подойти ad-absurdum и заменить случайную последовательсность справочника на sequence но меня не услышали. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.01.2018, 21:51 |
|
||
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovЗа неимением вашего алгоритма, я могу сослаться на существующие и вполне обоснованно утверждать, что разные режимы одного алгоритма дают разницу на проценты для больших объёмов хорошо сжимаемых данных.испытываю большие трудности в понимании написанного 1. "За неимением вашего алгоритма ... вы предлагаете манипулировать сотнями-тысячами бит потенциально плохо сжимаемых данных" -- это про какую из инициированных мной в этом году тем? (Да виноват, инициировал несколько, прорвало.) 2. "дают разницу на проценты" -- а разве разные архиваторы конкурируют друг с другом не "за проценты" (в смысле единицы процентов)? Ну не в десятки же раз "хороший архиватор" сжимает лучше, чем "плохой архиватор"! 3. "разные режимы одного алгоритма" -- вы понимаете разницу между выбором seed в каком-нибудь параметризованном алгоритме (типа градиентного спуска) и выбором, например, количества слоёв в нейронной сети? Хотя и то, и другое можно назвать "выбором значения параметра" ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.01.2018, 22:47 |
|
||
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Иван FXSиспытываю большие трудности в понимании написанногоОбычно, помогает не сразу вывалить идею на публику, а подумать над ней, что-нибудь сделать или, хотя бы, просто отложить, а спустя некоторое время подумать ещё раз. Насколько я понял, вам кажется странным тратить усилия на майнинг хэшей и вы предлагаете майнить степени сжатия. Лично для меня бессмысленны оба занятия, но ваш вариант - ещё менее осмысленный: для майнинга хэшей есть чёткий алгоритм и побеждать будет тот, у кого больше вычислительных мощностей при равной архитектуре. Включая архитектуру, специально разработанную под конкретную задачу. Чтобы майнить степени сжатия требуется или каждый раз разрабатывать алгоритм сжатия под конкретную последовательность, что выглядит несколько утопично или подбирать некий мифический параметр. Это не только выглядит совершенной маниловщиной, но и является ею по сути. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.01.2018, 23:06 |
|
||
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Все 4 страницы срача я не читал, поэтому сразу предложу хорошее решение. Звиняйте, если оно уже было. Число записывается в формате <длина числа в битах><само число> Длина числа в битах записывается в виде набора байт, где у каждого байта старший бит - признак конца, а 7 младших - данные. т.е. <0xxxxxxx>, <0xxxxxxx>, <1xxxxxxx> для чисел до 2^21 или <1xxxxxxx> для чисел до 127 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 09:33 |
|
||
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovНасколько я понял, вам кажется странным тратить усилия на майнинг хэшей и вы предлагаете майнить степени сжатия. это в другую тему реплика, давайте не перемешивать темы. Ответил там: 21106660 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 10:44 |
|
||
|
Компактная нотация бинарной записи числа
|
|||
|---|---|---|---|
|
#18+
Подумал, и понял что у Левенштейна - хороший код. плотнее пожалуй не загонишь. для совсем частных случаев можно попробовать, а в целом - вряд ли. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.01.2018, 12:55 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=39584047&tid=1340186]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
35ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
| others: | 265ms |
| total: | 393ms |

| 0 / 0 |
