Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Regexp и binary data
|
|||
|---|---|---|---|
|
#18+
Добрый день всем. Как-то исторически сложилось что механзм regexp применяют для процессинга текстовых данных. Кто-нибудь использовал regexp-s для поиска и извлечения бинарных данных. Поделитесь сведениями. Опытом. Юзкейсами. Спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2015, 12:41 |
|
||
|
Regexp и binary data
|
|||
|---|---|---|---|
|
#18+
Теоретически это возможно. Языку без разницы какой у него алфавит. Практически я не встречал такого в реальности. Бинарные массивы обычно делают структурированными и их проще обрабатывать блоками фиксированной длины. Это с текстами сложности - записи разной длины. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2015, 15:28 |
|
||
|
Regexp и binary data
|
|||
|---|---|---|---|
|
#18+
Поясню свой вопрос. К примеру есть некий (мой собственный) формальный механизм описания двоичных файловых форматов. К примеру для картинок (JPEG) это: Код: plaintext 1. Описывает заголовок и некий футер который финализирует последовательность. Имея это описание я могу из произвольных ресурсов (pdf документ или образ диска) извлекать картинки. Пытаюсь придумать возможные limitations для regexp которые не дают возможность это делать для не-текстовых данных. Кроме нуля '\0' ничего пока не придумал. Вроде как получается можно и регулярки использовать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2015, 15:39 |
|
||
|
Regexp и binary data
|
|||
|---|---|---|---|
|
#18+
maytonК примеру для картинок (JPEG) это: Код: plaintext 1. Тогда уж "\0xff\0xd8\0xff\0xe0.*?\0x4a\0x46\0x49\0x46\0x00". maytonПытаюсь придумать возможные limitations для regexp которые не дают возможность это делать для не-текстовых данных. Кроме нуля '\0' ничего пока не придумал.Да и ноль тоже не будет проблемой. Если конечно возьмешь библиотеку у которой можно отключить ограничители строк и запускать на буфер фиксированной длины. Впрочем, я о таких библиотеках не слышал. Надо будет свою писать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.07.2015, 15:49 |
|
||
|
|

start [/forum/topic.php?fid=57&msg=39013524&tid=2018910]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
61ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
48ms |
get tp. blocked users: |
2ms |
| others: | 311ms |
| total: | 468ms |

| 0 / 0 |
