Perl / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Perl

19 сообщений из 44, страница 2 из 2

все

Perl

#36605662

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

АnострофНасчет "на порядки" - это ты загнул :)

по тестам разработчика компилируемой версии awk (а уж он свое детище не обидит) обходит интерпретируемый Perl в 1,5 - 2 раза.

http://awka.sourceforge.net/compare.html

Причем сравнения скорости регулярных выражений я так и не нашел.

На пару порядков на специфичных задачах.
Загибать привычки не имею, мы ем логи как то раз парсили. Сначала Perl-ом a потом awk.

По поводу скорости регулярок (а это не единственное отличие, влияющее на производительность)
почитай про DFA vs NFA (Хотя оно больше для простоты так называется ибо любое регулярное выражение можно привести к DFA (через NFA), а те регулярные выражения, что в Perl, они и не регулярные выражения вовсе, а нечто гораздо более мощное и гораздо менее теоретически обоснованное, для простоты называемое малограмотными людьми NFA движком регулярных выражений).

Блин, целый абзац написал Оно мне надо ваще тебя уговаривать ???
Возьми сравни и удивись. Если функционала awk хватит для твоей задачи, Perl по быстродействию рядом с ним стоять не будет (и мало кто еще к этому быстродействию приблизится)

...

Рейтинг:

0 / 0

29.04.2010, 16:44:19

| Ответить | Цитировать | Написать

Perl

#36605672

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

Аnострофможешь на awk составить программку, которая

прочитает файл 1.txt в своей директории
выполнит замену по шаблону s/\d+/123/g
и запишет результат в 2.txt
?

Хочу скорость сравнить :)

sed еще посмотри
а програмки за тебя писать у меня времени нет, уж звиняй
могу книжку по авку подкинуть

...

Рейтинг:

0 / 0

29.04.2010, 16:46:59

| Ответить | Цитировать | Написать

Perl

#36605711

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

Кто-нибудь напишите на awk это прогу. На минуту делов-то. Вот на Perl:

open(IN, "1.txt");
open(OUT, ">2.txt");
while(<IN>){
s/\d+/123/g;
print OUT
}

А потом сравним скорость. Самому интересно.

...

Рейтинг:

0 / 0

29.04.2010, 17:01:23

| Ответить | Цитировать | Написать

Perl

#36606072

avb1003

Участник

Откуда: Москва

Сообщения: 356

Рейтинг: 0 / 0

Аnостроф,
Если очень интересно, то рекомундую посмотреть
Дж.Фридл. "Регулярные выражения. Библиотека программиста" СПб.:Питер, 2001. c.147.
В главе 6 "Регулярные выражние в конкретных программах" есть раздел посвященный Awk и в нем
подраздел "Различия между диалектами регулярных выражений awk". Их, диалектов, там приведено 6.
Глава 7 посвящена регулярным выражениям в Perl. В Perl скорость работы с регулярными выражениями сильно зависит от выбора этих выражений - можно легко написать "плохое". В книге объясняется,
что к чему и как писать "хорошие". А сам язык, как таковой, вряд ли "на порядки" медленней. У меня был опыт - вдруг стала иногда(но сильно) тормозить С-ная программа - компонент системы 7x24, уже была в эксплуатации где-то около года. По-видимиму, администратор или другой нехороший человек подменил динамические библиотеки. Проблема решилась заменой регулярного выражения - не помню детали, где-то "убрал" "звездочку."

...

Рейтинг:

0 / 0

29.04.2010, 19:11:36

| Ответить | Цитировать | Написать

Perl

#36606081

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

Спасибо, я неплохо разбираюсь в регулярных выражениях, так как написал по ним диссертацию :)
Человек уверяет, что awk при обработке текста работает "на порядок быстрее Perl". Мне интересно, действительно ли это так.

...

Рейтинг:

0 / 0

29.04.2010, 19:19:44

| Ответить | Цитировать | Написать

Perl

#36606599

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

АnострофСпасибо, я неплохо разбираюсь в регулярных выражениях, так как написал по ним диссертацию :)
Человек уверяет, что awk при обработке текста работает "на порядок быстрее Perl". Мне интересно, действительно ли это так.

Интересно - проверь (я для себя уже проверил).
За тебя это делать не собираюсь

Коль диссер написл, должен понимать почему в Perl-е регулярные выражения далеко не так быстры как могли быть (не будь в них многих вкусностей)

...

Рейтинг:

0 / 0

30.04.2010, 08:44:11

| Ответить | Цитировать | Написать

Perl

#36606715

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

А, так AWK используются DFA :( Ни обратных ссылок, ни утверждений. Для моих задач совсем не подходит, т.к. юзаю по-полной все возможности NFA и даже пишу по вечерам свою версию PCRE :) Работать движок будет помедленней, чем PCRE, но там будет куча вкусностей, облегчающих написания рег. выражений. Например, можно будет напрямую прописывать в шаблоне числа - скажем, "больше 40, но меньше 270".

...

Рейтинг:

0 / 0

30.04.2010, 10:00:32

| Ответить | Цитировать | Написать

Perl

#36606763

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

АnострофА, так AWK используются DFA :( Ни обратных ссылок, ни утверждений. Для моих задач совсем не подходит, т.к. юзаю по-полной все возможности NFA и даже пишу по вечерам свою версию PCRE :) Работать движок будет помедленней, чем PCRE, но там будет куча вкусностей, облегчающих написания рег. выражений. Например, можно будет напрямую прописывать в шаблоне числа - скажем, "больше 40, но меньше 270".

Опять же, стоит определиться, что важнее: быстро или вкусности
Нам вкусностей хватало, а вот быстро было очень актуально

...

Рейтинг:

0 / 0

30.04.2010, 10:24:16

| Ответить | Цитировать | Написать

Perl

#36606771

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

АnострофНапример, можно будет напрямую прописывать в шаблоне числа - скажем, "больше 40, но меньше 270".

Гмм. В Perl-е можно довычислять выражение по ходу его выполнения. Мозг при этом правда выкипает да и вкусность какая-то шибко инопланетная, но ты уверен, что не изобретаешь велосипед ?

...

Рейтинг:

0 / 0

30.04.2010, 10:26:45

| Ответить | Цитировать | Написать

Perl

#36606876

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

Gluk (Kazan), уверен. Сейчас, чтобы определять и сравнивать числа (не одиночные символы-цифры, а именно числа) внутри регулярных выражений приходится такой код наворачивать, что написание каждой такой регулярки превращаются в нетривиальную задачку даже для неслабых умов. А, между тем, дело это очень даже востребовано.
Еще одна фишка - оптимизация работы с пакетами регулярных выражений. Я обнаружил что длинное регулярное NFA-выражение с кучей условий, альтернациями, классами символов и т.п. работает гораздо медленней, чем аналогичный по действию пакет коротких регулярных выражений. В некоторых ситуациях разница доходит до 10 - 15 раз! Чем длиннее и сложнее регулярное выражение, тем эффективней с ним работает мой движок по сравнению с PCRE. Однако пока я погряз в отладке и оптимизации - даже не знаю, когда будет полноценная бета, которую будет не стыдно людям показать.

...

Рейтинг:

0 / 0

30.04.2010, 11:09:35

| Ответить | Цитировать | Написать

Perl

#36606887

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

На коротких шаблонах PCRE пока быстрее на 20-30 % за счет того, что у меня движок более высокоуровневый.

...

Рейтинг:

0 / 0

30.04.2010, 11:15:25

| Ответить | Цитировать | Написать

Perl

#36606920

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

АnострофНа коротких шаблонах PCRE пока быстрее на 20-30 % за счет того, что у меня движок более высокоуровневый.

Наверное стоит посмотреть на движок TCL по поводу оптимизаций.
Не впоне понимаю как будет выглядеть регулярка для чисел. Примерчик можно?

...

Рейтинг:

0 / 0

30.04.2010, 11:29:35

| Ответить | Цитировать | Написать

Perl

#36607009

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

TCL использует комбинированный движок NFA-DFA, но скорость не впечатлила.

...

Рейтинг:

0 / 0

30.04.2010, 11:49:02

| Ответить | Цитировать | Написать

Perl

#36607037

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

Пример: удалить из строки числа, которые больше 23

s/ (\d:>23) / /g

Пример: найти в строке числа, которые больше переменной $a на 100, но меньше переменной $b

/(\d:>$a+1, <$b)/g

...

Рейтинг:

0 / 0

30.04.2010, 11:55:39

| Ответить | Цитировать | Написать

Perl

#36607095

Gluk (Kazan)

Участник

Сообщения: 9 657

Рейтинг: 0 / 0

АnострофПример: удалить из строки числа, которые больше 23

s/ (\d:>23) / /g

Пример: найти в строке числа, которые больше переменной $a на 100, но меньше переменной $b

/(\d:>$a+1, <$b)/g

надо вводить какие то скобки наподобие фигурных для квантификаторов.
Иначе каша получится и будет совсем не PCRE (особенно в последнем примере)
Кстати, числа это все таки \d+, а не \d

...

Рейтинг:

0 / 0

30.04.2010, 12:11:19

| Ответить | Цитировать | Написать

Perl

#36607099

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

Пакеты на данный момент записываются в стиле Perl:

/regex1/ &&
/regex2/ &&
!/regex3/ &&
!/regex4/

т.е. если в строке ЕСТЬ regex1 и regex2, НО НЕТ regex3 и regex4, то пакет нашел совпадение. С помощью таких пакетов можно очень быстро писать сложнейшие условия для отлова строк, причем пакет будет работать в 10 - 15 раз быстрее, чем одно длинное NFA-регулярное выражение с использованием утверждений и прочих расширенных конструкций. Самое сложное - правильно реализовать возвращение найденных в пакете захваченных переменных.

...

Рейтинг:

0 / 0

30.04.2010, 12:12:45

| Ответить | Цитировать | Написать

Perl

#36607118

Аnостроф

Участник

Сообщения: 33

Рейтинг: 0 / 0

"Надо вводить какие то скобки наподобие фигурных для квантификаторов" - это был самый первый вариант, который попробовал. Но с ним есть определенные трудности.

"Иначе каша получится и будет совсем не PCRE". При разбиении регулярных выражений на пакеты они выглядят очень понятно и легко записываются. Ладно, что-то я совсем выбился из рабочей колеи :)

...

Рейтинг:

0 / 0

30.04.2010, 12:17:36

| Ответить | Цитировать | Написать

Период между сообщениями больше года.

Perl

#38482802

volodin661

Участник

Откуда: Внутренняя Монголия

Сообщения: 537

Рейтинг: 0 / 0

Код: perl

1.
2.
3.
4.
5.

#удалить из строки числа, которые больше 23
s/ (\d+) / $1 if $1 <= 23 /ex

#найти в строке числа, которые больше переменной $a на 100, но меньше переменной $b
grep { $_-100 > $a and $_ < $b }  m/ ( \d+ ) /gx

ой-ой, закипели мозги.

...

Рейтинг:

0 / 0

29.11.2013, 07:10:54

| Ответить | Цитировать | Написать

Период между сообщениями больше года.

Perl

#39867045

volodin661

Участник

Откуда: Внутренняя Монголия

Сообщения: 537

Рейтинг: 0 / 0

Аnостроф
даже пишу по вечерам свою версию PCRE :) Работать движок будет помедленней, чем PCRE, но там будет куча вкусностей, облегчающих написания рег. выражений. Например, можно будет напрямую прописывать в шаблоне числа - скажем, "больше 40, но меньше 270".

Пример: удалить из строки числа, которые больше 23

Код: perl

s/ (\d:>23) / /g

Хочу отметить, что Larry Wall таки прислушался к идеям Апострофа :-) и реализовал их в своём новом regex engine в языке Perl6

удалить из строки числа, которые больше 23 :

Код: perl

s:g /(\d+) { $0 > 23 or next }//

...

Рейтинг:

0 / 0

25.09.2019, 18:18:05

| Ответить | Цитировать | Написать

19 сообщений из 44, страница 2 из 2

все

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Perl

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&gotonew=1&tid=1339902]:	0ms
get settings:	9ms
get forum list:	15ms
check forum access:	3ms
check topic access:	3ms
track hit:	48ms
get topic data:	9ms
get first new msg:	5ms
get forum data:	2ms
get page messages:	52ms
get tp. blocked users:	1ms
others:	196ms

total:	343ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы