powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Дисперсия длины архива?
21 сообщений из 146, страница 6 из 6
Дисперсия длины архива?
    #39585735
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
exp98S.G.в академию наук с очередной идеей вечного двигателя А никто не помнит "окончательные вердикты" Французской Ак.Н. ?
Камни не могут падать с неба, ибо оно не твердь земная.
Аппараты тяжелее воздуха летать не могут.Не знаю, почему этот пример всегда приводят.
Это было во времена, когда химия была еще алхимией, и наука была сродни теперешним псевдо-наукам. По сути, было одно название, науки как таковой не было.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585742
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
softwarerexp98пропущено...
А никто не помнит "окончательные вердикты" Французской Ак.Н. ?
Камни не могут падать с неба, ибо оно не твердь земная.
Аппараты тяжелее воздуха летать не могут.
Ну наивные они и непредусмотрительные. Надо так: "Проект вечного двигателя будет рассмотрен после того, как его работающий прототип в течение двухсот лет бесперебойно снабдит электричеством здание Академии". +1

Аналогично, пусть кто-то (не будем указывать пальцем, но это Иван FXS) , сначала покажет работающий прототип архиватора на основе ГПСЧ, а потом уже будем рассуждать по нему.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585754
Фотография LR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSточнее, не верно: сжатие идет за счет того, что записи имеют более короткий идентификатор, чем они сами.
Необязательно. Помню свою первую реализацию "аля Хаффмана" (тогда, в конце 80-х, о Хаффмане мы еще ничего не знали, по частоте встречаемости символов в тексте, косое бинарное дерево) - идентификатор наиболее часто встречаемого символа занимал 1 бит, наиболее редко встречаемого мог занимать гораздо более 8 бит. Степень сжатия, конечно, была не очень, но цели были несколько другими (зашифровать текстовую справочную систему и успевать отображать на экране из архива, чтобы при скролинге пользователь не замечал тормозов).
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585777
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LRидентификатор наиболее часто встречаемого символа занимал 1 бит, наиболее редко встречаемого мог занимать гораздо более 8 бит. Степень сжатия, конечно, была не очень, но цели были несколько другими (зашифроватья даже не буду цепляться к "цели были несколько другими (зашифровать"

Дело том, что если оставить некоторые подстроки "не закодированными" (не заменять их идентификаторами), то нужно будет тратить ресурсы (биты) на маркировку этих частей выходного потока как "сырые данные" (которые бери как есть, не пытайся раскодировать). Поэтому можно представить ситуацию, когда некоторые ("последних из могикан") подстроки входного потока оказывается выгоднее закодировать даже более длинными, чем они сами, идентификаторами.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585783
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кстати
LRидентификатор наиболее часто встречаемого символа занимал 1 бит -- а сколько бит занимала "разметка", позволяющая идентифицировать этот идентификатор как идентификатор?
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585791
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
S.G.Аналогично, пусть кто-то (не будем указывать пальцем, но это Иван FXS) , сначала покажет работающий прототип архиватора на основе ГПСЧ, а потом уже будем рассуждать по нему.объясните, -- если предположить, что я сваял "работающий прототип архиватора на основе ГПСЧ", -- зачем бы мне понадобилось вот это вот -- "сначала покажет ..., а потом уже будем рассуждать по нему"?

Я обсуждаю тему, по которой у меня нет ясного понимания, чтобы получить это -- более ясное -- понимание. Если вам это не интересно, значит ... вам это не интересно, вот и всё. Это, кажется, свободны форум свободных людей.

(Извините, если получилось резко.)
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585847
Фотография LR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSкстати
LRидентификатор наиболее часто встречаемого символа занимал 1 бит -- а сколько бит занимала "разметка", позволяющая идентифицировать этот идентификатор как идентификатор?
В архив сначала записывалось полученное "косое дерево" (словарь), затем - _битовая_ последовательность кодированного содержимого. Из архива вначале извлекалось "дерево", на котором "листьями" висят символы, и, затем последующая _битовая_ последовательность бит за битом указывала куда идти по дереву (0/1 = налево/направо), до "листиков" - листик за листиком. Вот сами и решайте сколько бит занимает здесь "разметка"...
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585862
Фотография LR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXS,

вот здесь в вики все подробно расписано и даже анимированная гифка есть))
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585874
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LR, то есть никакая часть Z входной строки не остаётся не закодированной (в выходной строке S)? Тогда да, в "_битовой_ последовательность кодированного содержимого" можно обойтись без разметки.

Если некоторая подстрока Z во входной строке S встретилась ровно один раз (уникальна), то вам нужно 1) разместить её в словаре; 2) как-то "увязать" её там с её кодом (возможно, именно это получится довольно компактно); 3) поставить её код (в "_битовой_ последовательность кодированного содержимого") на место, указывающее положение Z в S. То есть конкретно эта подстрока Z "сыграет" весьма против сжатия ...
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585876
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
читай "никакая часть Z входной строки S не остаётся не закодированной (в выходной строке S')"
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585881
Фотография LR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXS,

да, кодируется все
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585890
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSподстрока Z "сыграет" весьма против сжатия... даже не упоминая о том, что её код может оказаться длиннее её самой
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585942
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSЕсли некоторая подстрока Z во входной строке S встретилась ровно один раз (уникальна), то вам нужно 1) разместить её в словаре; 2) как-то "увязать" её там с её кодом (возможно, именно это получится довольно компактно); 3) поставить её код (в "_битовой_ последовательность кодированного содержимого") на место, указывающее положение Z в S. То есть конкретно эта подстрока Z "сыграет" весьма против сжатия ...
Размещение Z в теле архива тоже не бесплатно: надо будет предусмотреть какой-то идентификатор что далее значение строки, а не ее идентификатор из словаря. Еще надо как-то задать размер строки.
Поэтому вопрос спорный как в итоге компактнее будет.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585972
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dima T, вроде бы я именно это и написал в 13:33 :
Иван FXSДело том, что если оставить некоторые подстроки "не закодированными" (не заменять их идентификаторами), то нужно будет тратить ресурсы (биты) на маркировку этих частей выходного потока как "сырые данные" (которые бери как есть, не пытайся раскодировать).
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585986
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSПредставьте, что в нашем входном потоке в конце концом обнаружилось два вхождения строки длиной 1000 бит ...
ИМХО Я бы вообще повторы не стал рассматривать, обсуждая ГПСЧ, т.к. при наличии повтора более короткую подстроку можно заменить ссылкой на более длинную, т.е. ГПСЧ получается вовсе ни при чем.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39585992
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
не понял, что такое Dima Tболее короткую подстроку ... более длинную в случае повтора?

Ну и подстроки "0" и "1" (или, скажем, "00", "01", "10" и "11") повторяются до ... многократно. Только на что их заменять?
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39586025
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSне понял, что такое Dima Tболее короткую подстроку ... более длинную в случае повтора?

Ну и подстроки "0" и "1" (или, скажем, "00", "01", "10" и "11") повторяются до ... многократно. Только на что их заменять?
ИМХО ответ на этот вопрос очевиден. Если менять не на что, то не менять.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39586084
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSmayton,

вообще говоря, если мы на Альфа Центавра отправляем сжатый архиватором файл, и хотим чтобы тамошние альфацетавряне его распаковали, то мы должны вместе с файлом архива и (де-)архиватор отправить, и ... операционную систему, и много чего ещё, даже перечислять не возьмусь.
Зачем операционную систему?
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39586089
Иван FXS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
типа, (де-)архиватор настолько кроссплатформенный, что и на альфацетаврианской операционке отработает?
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39586125
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSтипа, (де-)архиватор настолько кроссплатформенный, что и на альфацетаврианской операционке отработает?Можно подумать, что операционная система поднимется на центаврианском железе.
Это даже если (внезапно) найдётся способ воплотить передаваемый сигнал в принятые на Центавре системы хранения.

P.S. А зря вы не хотите думать о физических пределах и ограничениях.
...
Рейтинг: 0 / 0
Дисперсия длины архива?
    #39586532
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Иван FXSS.G.Аналогично, пусть кто-то (не будем указывать пальцем, но это Иван FXS) , сначала покажет работающий прототип архиватора на основе ГПСЧ, а потом уже будем рассуждать по нему.объясните, -- если предположить, что я сваял "работающий прототип архиватора на основе ГПСЧ", -- зачем бы мне понадобилось вот это вот -- "сначала покажет ..., а потом уже будем рассуждать по нему"?

Я обсуждаю тему, по которой у меня нет ясного понимания, чтобы получить это -- более ясное -- понимание. Если вам это не интересно, значит ... вам это не интересно, вот и всё. Это, кажется, свободны форум свободных людей.

(Извините, если получилось резко.)Потому что создать таким образом архиватор - невозможно.
Поэтому полезно попробовать не только "на пальцах", но и создать прототип, и посмотреть как он будет работать. Скомпрессировать, например, какой-нибудь хеш :)
...
Рейтинг: 0 / 0
21 сообщений из 146, страница 6 из 6
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Дисперсия длины архива?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]