|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Дочке задали по информатике такое задание (на некоем сайте)... Нужно сжать текст Код: javascript 1.
С максимальным процентом сжатия (это оценивает сайт), заменой подстроки на символ (выделяет сайт). Никогда с архивацией дело не имел Как вообще такое делается? ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 18:57 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Вот как там это все выглядит... ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 19:11 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Как-то странно выглядит Dictionary. Я-бы лупил просто отдельные слова или слоги. - tutor - toot - to ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:01 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
mayton , это только Код: javascript 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:04 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Вот так Код: javascript 1. 2. 3. 4.
У нас получилось только 29%... ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:06 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
А можно эти странные символы подчёркиваний просто заменить на пробелы? ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:13 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Вот так пока максимально получается Код: plaintext 1. 2. 3. 4. 5. 6.
... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:15 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
mayton А можно эти странные символы подчёркиваний просто заменить на пробелы? На пробелы не получится... Там текст менять самому нельзя. Можно его копировать и вставлять в правую часть. После этого он заменяется на тот символ, что программка подставляет для этой строки ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:18 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Тому, выше, добавили еще Код: plaintext 1. 2. 3. 4. 5. 6.
Код: plaintext
... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:21 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
У gzip получается 12% по этой формуле. Вроде я не ошибся. Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
Но по бинарю видно что на малых размерах Gzip пишет слишком много служебной инфы с головы. И в хвосте какой-то padding забитый нулями. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:26 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
krvsa ★☀☆☃☀ Этот набор символов - из расширенных диапазонов Unicode. Там каждый символ - точно не 1 байт. Вобщем сама идея реплейсмента одних лексем на другие - не работает на обобщённом текстовом файле. Что делать если сам файл состоит из таких служебных. Эскейпить? Знаит еще +1 служебный символ к каждому. Хотя может для учебной задачи по информатике оно и катит. Как мо мне если играть со строками то лучше уж не архивация а криптография. Шифр Виженнера... ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:41 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
mayton Хотя может для учебной задачи по информатике оно и катит. Конечно. Это ведь условная "замена". mayton Как мо мне если играть со строками то лучше уж не архивация а криптография. Шифр Виженнера... Ты не выделывайся... Ты пальцем покажи. (с) Т.е. как и что делать конкретно на этом примере. Именно его и нужно сжать. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:49 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
mayton У gzip получается 12% по этой формуле. Вроде я не ошибся. Ты бы написал последовательность подстрок для "замены"... А так, в программке нет никакого смысла. Дочка ведь такое не покажет училке... Училке нужна последовательность строк и максимальный процент сжатия... ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 20:51 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Не надо ничего училке показывать. Мне просто было интересно сравнить. И понять что gzip для коротких строчек типа url - не годится. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 22:33 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
А вот попробуй сжать вот такой текст этой заменой. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9.
... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 22:38 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
mayton А вот попробуй сжать вот такой текст этой заменой. Зачем мне сжимать этот текст? В задании текст тот, что я уже процитировал выше. Другие тексты не нужны, они никому не интересны. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 22:43 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Если не менять принципиально алгоритм но дать больше контекста - то можно наверное получить выгоду. К примеру русский текст выделяется и обрабатывается LZW с одним справочником а французский - с другим. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
... |
|||
:
Нравится:
Не нравится:
|
|||
02.12.2021, 23:53 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Чекни эти два варианта (без добавления отсебятины - она может что-то испортить) _to_tutor_two_tooters_to_toot _t oo utor dhe te_ и _to_tutor_two_tooters_to_toot _t oo utor dhe te_ t_ wh ie rd ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 00:43 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
krvsa mayton А вот попробуй сжать вот такой текст этой заменой. Зачем мне сжимать этот текст? В задании текст тот, что я уже процитировал выше. Другие тексты не нужны, они никому не интересны. Тогда меняй весь текст на один символ. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 07:26 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
SpringMan Чекни эти два варианта (без добавления отсебятины - она может что-то испортить) Отправил дочке - напишет как сжалось. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 08:02 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Siemargl классический lzw должен удовлетворить Вот смотри... Я неумеха в этом деле... Ты видать спец. Просто примени тот метод сам на моем примере. А результат (подстроки) покажи тут. Так можешь? ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 08:04 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
krvsa Отправил дочке - напишет как сжалось. Ушла в школу... Будет только вечером. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 08:48 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Dima T Тогда меняй весь текст на один символ. Самый лучший ответ ))) (если, конечно, словарь не участвует в расчете процента сжатия) ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 09:25 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Siemargllzwдает сжатие до 99 байт (из 148), т.е 33.1% А у krvsa получиось 31.08%. Думаю, на пятерку этого достаточно))) ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 11:25 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Siemargl Но там на выходе битовая строка Тогда зачем она мне в этом задании? ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 12:19 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Если кодер или декодер слегка изменить - то можно получить Нормальный Алгоритм маркова. Еще интересно из декодера получить генератор слов. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 13:34 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Burrows-Wheeler Transform (5 chars) Код: sql 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 14:32 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
6 chars Код: sql 1.
7 chars Код: sql 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 14:34 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
mayton А вот попробуй сжать вот такой текст этой заменой. Код: plaintext 1.
Надо с самого начала выяснить, какими методами, инструментами и какими "словарями" можно пользоваться, как учитывается словарь в % сжатия. Без этого гадать можно много и не достичь рез-та. А так хафман, м.б. "_" сама по себе вкупе с уже названными и даст рекорд, или частотность 1 2 3 4... вхождений. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:07 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Хаффман - это самый начальниый уровень. И то он не действует самостоятельно а обычно добавляется как фильтр к какому-то уже обработанному потоку. Кроме того его легко сломать. Может быть файл с достаточно линейной гистограммой частот символов. И тут хаффмен безсилен. Хотя LZW может сработать. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:12 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Для BWT еще padding нужен. И какой-то условный символ-филлер. Я не реализовал поэтому длина строки - меньше вышла. А вообще это не сжатие а просто какая-то предварительная фаза подготовки символов. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:14 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Здесь очевидна заведомая повторяемость. В принципе задача, уловить это, если преп сам не сказал. Вот как словарь понимается, как цельный символ или можно 1 бит? и как он в подсчёте участвует. Вопрос,да. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:20 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
exp98 В принципе задача, уловить это, если преп сам не сказал Училка сказала: - Вот так выделяете часть строки и копируете в правую часть... Видите как она (часть) заменилась вот на тот символ? Вот так и меняйте. Задача - получить максимальное сжатие, оно показывается в самом низу. Вот и все. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:27 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
exp98 Здесь очевидна заведомая повторяемость. В принципе задача, уловить это, если преп сам не сказал. Вот как словарь понимается, как цельный символ или можно 1 бит? и как он в подсчёте участвует. Вопрос,да. Игры со словарём можно рассматривать как забавный хак системы. Что будет если словарь удалённый и лежит где-то в гугле? Мы получаем такой себе Бабушкин-лайк-архиватор с супер-пупер характеристиками. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:50 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
SpringMan Чекни эти два варианта (без добавления отсебятины - она может что-то испортить) Дочка написала авторполучилось 17 и 12 ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:58 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
П.С.М. А у krvsa получиось 31.08%. Думаю, на пятерку этого достаточно))) Так и вышло - дочка довольна. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 15:58 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
А как компрессия считалась, относительная убыль длины нового текста? или доля длины нового текста? потому что с ходу по 2-му подсчёту сразу 50% получается. Следовательно 1-й вариант тоже 50%. Ну да и училка не сказала, в каком порядке закрашивать если хочешь _to и _too в словаре. Ну да, это для ручной раскраски. Кто-то может и не просечь. Оплошала училка. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 16:28 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
exp98 А как компрессия считалась, относительная убыль длины нового текста? или доля длины нового текста? Я особо не вдавался в алгоритм расчета этого процента... Там на картинке несколько цифр - возможно на них тот расчет и опирается. exp98 Оплошала училка. Старшая дочь несколько лет байты в килобайты переводила (у другой училки)... А тут такой "старт"! Х.з. чего дальше ждать на том сайте. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 17:12 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Когда я учился - мы на уроке информатики сразу вряли калькулятор МК-60 и погнали кодить. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.12.2021, 17:16 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
Попробуйте 1 _tutor 2 _to 3 ot 4 _the 5 21_two23ers223 Должно быть 34.46% ... |
|||
:
Нравится:
Не нравится:
|
|||
05.12.2021, 23:43 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
DanilaSP , задание уже не активно, проверить не смогу. Извини... ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2021, 11:37 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
krvsa, ничего страшного Я просто написал программку, которая строит словарь рандомизированным алгоритмом) На официальном форуме пишут, что можно дойти до 35.9%. Может и моя программа такое найдёт, если подольше подождать. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2021, 12:35 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
DanilaSP Попробуйте 1 2 3 4..... 5 21_two23ers223 ... |
|||
:
Нравится:
Не нравится:
|
|||
06.12.2021, 18:39 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
exp98 , задание допускало любые замены. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.12.2021, 09:14 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
На официальном форуме пишут, что можно дойти до 35.9%. Это сколько процентов 68 из 148 ? Length= 148, new length= 68 Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.12.2021, 16:34 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
exp98 , в той программке не все замены увеличивают процент сжатия... Некоторые его уменьшают. Т.ч. если это твой конечный результат - не факт что ты получил бы там хорошие показатели по сжатию. Проверить конечно уже не смогу... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.12.2021, 16:47 |
|
Задание по информатике 10 класс
|
|||
---|---|---|---|
#18+
exp98 А как компрессия считалась, относительная убыль длины нового текста? или доля длины нового текста? Для вычисления компрессии нужно посчитать total = итоговая длина текста + размер словаря (одна строка словаря занимает число символов в слове + 1). Далее вычислить компрессию как (148 - total) / 148, где 148 - длина исходного текста. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.12.2021, 11:19 |
|
|
Start [/forum/topic.php?fid=16&tid=1339610&all=1]: |
0ms |
get settings: |
1ms |
get forum list: |
6ms |
check forum access: |
0ms |
check topic access: |
0ms |
track hit: |
30ms |
get topic data: |
4ms |
get forum data: |
0ms |
get page messages: |
33ms |
update_topic_read_status (1339610): 08.12.2021 11:19:30: |
0ms |
get tp. blocked users: |
1ms |
get online users: |
15ms |
check new: |
1ms |
others: | 75ms |
total: | 166ms |
0 / 0 |