Навороченый grep / Unix-системы

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Навороченый grep

4 сообщений из 4, страница 1 из 1

Навороченый grep

#37559041

evgeny12000

Участник

Сообщения: 100

Рейтинг: 0 / 0

Задача искать строки в которых присутствует одно из ключевых слов (их может быть около 100), а также игнорировать строки в которых присутствует одно из ключевых слов (их тоже может быть около 100).
Главная цель, чтоб это работало оптимально быстро.

Вот вариант который получилось сделать. Но у него есть недостаток, есть ограничение на длину внутренних файлов (search_words.txt и exclude_words.txt)

egrep -r `cat search_words.txt` * | egrep -v `cat exclude_words.txt`

search_words.txt - mama|papa|deda|baba
exclude_words.txt - sin|vnuk|brat|sestra

Есть другие идеи ? Может эффективней делать perlom ?

...

Рейтинг:

0 / 0

05.12.2011, 12:34

| Ответить | Цитировать | Написать

Навороченый grep

#37559118

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

On 12/05/2011 01:34 PM, evgeny12000 wrote:

> Вот вариант который получилось сделать. Но у него есть недостаток, есть
> ограничение на длину внутренних файлов (search_words.txt и exclude_words.txt)
>
> egrep -r `cat search_words.txt` * | egrep -v `cat exclude_words.txt`
>
> search_words.txt - mama|papa|deda|baba
> exclude_words.txt - sin|vnuk|brat|sestra
>
> Есть другие идеи ?

Ну самое эффективное -- читать одну строку исходного файла один раз.
Эффективнее уже некуда -- лучше только в БД или ещё куда загружать и индексы
строить, это будет логарифмы (может быть).

Можно оба действия сделать в одном рег.выражении, но только
толку мало -- всё равно строка только один раз читаться будет.
И я не знаю, как и можно ли это сделать с egrep, у него там
свои регвыражения.

Может эффективней делать perlom ?

Можно и седом.
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

05.12.2011, 13:02

| Ответить | Цитировать | Написать

Навороченый grep

#37559209

evgeny12000

Участник

Сообщения: 100

Рейтинг: 0 / 0

MasterZivOn 12/05/2011 01:34 PM, evgeny12000 wrote:

> Вот вариант который получилось сделать. Но у него есть недостаток, есть
> ограничение на длину внутренних файлов (search_words.txt и exclude_words.txt)
>
> egrep -r `cat search_words.txt` * | egrep -v `cat exclude_words.txt`
>
> search_words.txt - mama|papa|deda|baba
> exclude_words.txt - sin|vnuk|brat|sestra
>
> Есть другие идеи ?

Ну самое эффективное -- читать одну строку исходного файла один раз.
Эффективнее уже некуда -- лучше только в БД или ещё куда загружать и индексы
строить, это будет логарифмы (может быть).

Можно оба действия сделать в одном рег.выражении, но только
толку мало -- всё равно строка только один раз читаться будет.
И я не знаю, как и можно ли это сделать с egrep, у него там
свои регвыражения.

Может эффективней делать perlom ?

Можно и седом.

Да, согласен с вами.
Покажите конкретные примеры, и ещё важен нюанс большое количество ключевых слов.

...

Рейтинг:

0 / 0

05.12.2011, 13:53

| Ответить | Цитировать | Написать

Навороченый grep

#37559362

user123456789user

Гость

evgeny12000,

может как-нибудь так:

Код: plaintext

cat * | grep --fixed-strings --file search_words.txt | grep --fixed-strings --file exclude_words.txt --invert-match

где search_words.txt содержит:

Код: plaintext

1.
2.
3.

mama
papa
deda
baba

, а exclude_words.txt содержит:

Код: plaintext

1.
2.
3.

sin
vnuk
brat
sestra

...

Рейтинг:

0 / 0

05.12.2011, 15:06

| Ответить | Цитировать | Написать

4 сообщений из 4, страница 1 из 1

Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Навороченый grep

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=25&msg=37559209&tid=1483859]:	0ms
get settings:	10ms
get forum list:	13ms
check forum access:	3ms
check topic access:	3ms
track hit:	150ms
get topic data:	11ms
get forum data:	3ms
get page messages:	44ms
get tp. blocked users:	2ms
others:	276ms

total:	515ms