powered by simpleCommunicator - 2.0.38     © 2025 Programmizd 02
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Работа с большим лог-файлом
8 сообщений из 8, страница 1 из 1
Работа с большим лог-файлом
    #39190530
andrey10
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте. Есть большой лог файл весом более 30 гб и сайт на php, который записывает действия пользователей и дату. Мне нужно каким-то образом более-менее быстро искать в нем записи по дате и выводить их в админке.

Примерный запрос: "найти сообщения с 12-03-2016 12:20:00 до 12-03-2016 12:35:00" (диапазон поиска всегда не более 15 минут).

У меня имеются несколько способов решения задачи:
1. Самый очевидный способ - это засунуть лог в базу. Только я не знаю, стоит ли так делать. Не зря ведь большие логи не хранят в бд.
2. Открыть shell_exec и grep'ать. Но это не подходит. Бывает на операцию уходит 20 секунд, учитывая, что на сервере стоит ssd диск, а мне нужно делать это быстрее.
3. Разбить лог на много маленьких файлов по дням из даты в имени, а php определять какие именно файлы нужно открывать (их максимум 2 может быть).

Может быть вы мне еще что-то подскажете? Спасибо.
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39190571
Доктар123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey10Здравствуйте. Есть большой лог файл весом более 30 гб и сайт на php, который записывает действия пользователей и дату. Мне нужно каким-то образом более-менее быстро искать в нем записи по дате и выводить их в админке.

Примерный запрос: "найти сообщения с 12-03-2016 12:20:00 до 12-03-2016 12:35:00" (диапазон поиска всегда не более 15 минут).

У меня имеются несколько способов решения задачи:
1. Самый очевидный способ - это засунуть лог в базу. Только я не знаю, стоит ли так делать. Не зря ведь большие логи не хранят в бд.
2. Открыть shell_exec и grep'ать. Но это не подходит. Бывает на операцию уходит 20 секунд, учитывая, что на сервере стоит ssd диск, а мне нужно делать это быстрее.
3. Разбить лог на много маленьких файлов по дням из даты в имени, а php определять какие именно файлы нужно открывать (их максимум 2 может быть).

Может быть вы мне еще что-то подскажете? Спасибо.

Как еще один альтернативный вариант.
Завести еще один файл,
в котором кроном дописывать в конец дату-время и смещение от начала файла( размер )
на эту дату-время.
Найдя период в маленьком файле, из большого файла dd -хой выкусывать
период по смещению и передавать грепу...
Что бы было проще искать вхождение в диапазон , даты можно
хранить как количество секунд с начала эпохи...
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39190732
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть бесплатный инструмент https://www.elastic.co/ как раз для быстрого анализа больших данных.
С веб-интерфейсом поиска. Он предварительно индексирует содержание поэтому первый запуск
возможно будет небыстрым.
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39190776
Valeriu
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Здесь явно просится записать логи в БД..
А такой пустяк запрос получите меньше чем за секунду
Развернуть еe можно на Linux на том же сервере.
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39190848
andrey10
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо. Всё же буду писать в бд.
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39190851
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Дисковое пространство в БД всегда стоит дороже чем просто файл.
Кроме того нужно теперь бекапить на 30 гб больше.

Вобщем делай как хочешь, но IMHO лог-файлам место в файловой
системе.

Вобщем если стоит другая (специальная) задача по быстрому поиску
евентов то берут специальные БД типа Cassandra.
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39190853
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
andrey10Не зря ведь большие логи не хранят в бд.
Обычно их не хранят в БД только потому, что они быстро устаревают и данные приходится
удалять. БД не любят массовых удалений.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Работа с большим лог-файлом
    #39191079
Q.Tarantino
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
andrey103. Разбить лог на много маленьких файлов по дням из даты в имени, а php определять какие именно файлы нужно открывать (их максимум 2 может быть).
настроить ротацию. 1 день - 1 файл.
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Работа с большим лог-файлом
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]