Навороченый grep / Unix-системы

ReSQL.ru

2.0.61

Полная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Навороченый grep / 4 сообщений из 4, страница 1 из 1

05.12.2011, 12:34

#37559041

evgeny12000

Участник

Сообщения: 100
Рейтинг: 0 / 0

Навороченый grep

Задача искать строки в которых присутствует одно из ключевых слов (их может быть около 100), а также игнорировать строки в которых присутствует одно из ключевых слов (их тоже может быть около 100).
Главная цель, чтоб это работало оптимально быстро.

Вот вариант который получилось сделать. Но у него есть недостаток, есть ограничение на длину внутренних файлов (search_words.txt и exclude_words.txt)

egrep -r `cat search_words.txt` * | egrep -v `cat exclude_words.txt`

search_words.txt - mama|papa|deda|baba
exclude_words.txt - sin|vnuk|brat|sestra

Есть другие идеи ? Может эффективней делать perlom ?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

05.12.2011, 13:02

#37559118

MasterZiv

Участник

Откуда: Питер
Сообщения: 32 427
Рейтинг: 0 / 0

Навороченый grep

On 12/05/2011 01:34 PM, evgeny12000 wrote:

> Вот вариант который получилось сделать. Но у него есть недостаток, есть
> ограничение на длину внутренних файлов (search_words.txt и exclude_words.txt)
>
> egrep -r `cat search_words.txt` * | egrep -v `cat exclude_words.txt`
>
> search_words.txt - mama|papa|deda|baba
> exclude_words.txt - sin|vnuk|brat|sestra
>
> Есть другие идеи ?

Ну самое эффективное -- читать одну строку исходного файла один раз.
Эффективнее уже некуда -- лучше только в БД или ещё куда загружать и индексы
строить, это будет логарифмы (может быть).

Можно оба действия сделать в одном рег.выражении, но только
толку мало -- всё равно строка только один раз читаться будет.
И я не знаю, как и можно ли это сделать с egrep, у него там
свои регвыражения.

Может эффективней делать perlom ?

Можно и седом.
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

05.12.2011, 13:53

#37559209

evgeny12000

Участник

Сообщения: 100
Рейтинг: 0 / 0

Навороченый grep

MasterZivOn 12/05/2011 01:34 PM, evgeny12000 wrote:

> Вот вариант который получилось сделать. Но у него есть недостаток, есть
> ограничение на длину внутренних файлов (search_words.txt и exclude_words.txt)
>
> egrep -r `cat search_words.txt` * | egrep -v `cat exclude_words.txt`
>
> search_words.txt - mama|papa|deda|baba
> exclude_words.txt - sin|vnuk|brat|sestra
>
> Есть другие идеи ?

Ну самое эффективное -- читать одну строку исходного файла один раз.
Эффективнее уже некуда -- лучше только в БД или ещё куда загружать и индексы
строить, это будет логарифмы (может быть).

Можно оба действия сделать в одном рег.выражении, но только
толку мало -- всё равно строка только один раз читаться будет.
И я не знаю, как и можно ли это сделать с egrep, у него там
свои регвыражения.

Может эффективней делать perlom ?

Можно и седом.

Да, согласен с вами.
Покажите конкретные примеры, и ещё важен нюанс большое количество ключевых слов.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

05.12.2011, 15:06

#37559362

user123456789user

Гость

Навороченый grep

evgeny12000,

может как-нибудь так:

Код: plaintext

cat * | grep --fixed-strings --file search_words.txt | grep --fixed-strings --file exclude_words.txt --invert-match

где search_words.txt содержит:

Код: plaintext

1.
2.
3.

mama
papa
deda
baba

, а exclude_words.txt содержит:

Код: plaintext

1.
2.
3.

sin
vnuk
brat
sestra

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Навороченый grep / 4 сообщений из 4, страница 1 из 1

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=25&tablet=1&tid=1483859]:	0ms
get settings:	10ms
get forum list:	18ms
check forum access:	3ms
check topic access:	3ms
track hit:	59ms
get topic data:	9ms
get forum data:	2ms
get page messages:	36ms
get tp. blocked users:	1ms
others:	238ms

total:	379ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы