|
Чем парсить логи ?
|
|||
---|---|---|---|
#18+
Нужно парсить логи ( порядка 200 - 300 гб в день ). Для этой цели есть 3 сервера. Чем лучше это делать ? 1) использовать Hadoop. Посмотрел я на него, даже поставил потестировать, поигрался с hive. Из плюсов: порадовала возможность задавать sql запросы к логам. Но в интернетах люди пишут что hadoop предназначен для ОЧЕНЬ больших данных и что в данной ситуации он будет не так быстр. 2) написать питоновский скрипт, который через tail Будет парсить логи на каждом сервере + закидывать все это в redis и уже потом сводить статистику в какую нибудь общую БД. Из минусов: прийдется ег полность писать :). 3) использовать что-то 3. Какой из этих вариантов предпочтительнее ? ... |
|||
:
Нравится:
Не нравится:
|
|||
25.12.2014, 13:14 |
|
Чем парсить логи ?
|
|||
---|---|---|---|
#18+
парсил через http://en.wikipedia.org/wiki/Logparser там тоже есть sql, к которому надо привыкать, ибо в вырожденных случаях работает неожиданно. вызываел его через zshell, с точностью до склероза, есть подключаемая библиотека, которую можно использовать внутри сишарпа. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.12.2014, 13:23 |
|
Чем парсить логи ?
|
|||
---|---|---|---|
#18+
поскольку компания благополучно скончалась, могу подарить отчет ... |
|||
:
Нравится:
Не нравится:
|
|||
25.12.2014, 13:26 |
|
Чем парсить логи ?
|
|||
---|---|---|---|
#18+
загружал в сайбез ... |
|||
:
Нравится:
Не нравится:
|
|||
25.12.2014, 13:28 |
|
Чем парсить логи ?
|
|||
---|---|---|---|
#18+
ribamoyaНужно парсить логи ( порядка 200 - 300 гб в день ). Для этой цели есть 3 сервера. Чем лучше это делать ? Какой из этих вариантов предпочтительнее ? В такой общей постановке - непонятно что делать. 99% эффекта будет зависеть от того какие запросы к логам. Если надо 1 раз в день посмотреть нарушителей безопасности - то можно через grep посмотреть и бох ним. Насчёт Хадупа - ничего не скажу т.к. не работал с ним. Собственно Хадуп вообще ортогонален к этой задаче. Это скорее принцип декомпозиции дисковых ресурсов и сведения результатов. Питонский скрипт - хороший вариант. Но чем он лучше grep - непонятно. Переливать всё в БД - другая крайность. Зачем тогда вообще логи создавались? Непонятно. Вобщем озвучь запросы. Наиболее важные и требующие быстрого решения. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.12.2014, 19:40 |
|
|
start [/forum/topic.php?fid=16&gotonew=1&tid=1341115]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
30ms |
get topic data: |
13ms |
get first new msg: |
8ms |
get forum data: |
3ms |
get page messages: |
53ms |
get tp. blocked users: |
2ms |
others: | 252ms |
total: | 395ms |
0 / 0 |