powered by simpleCommunicator - 2.0.58     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / MySQL [игнор отключен] [закрыт для гостей] / Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
6 сообщений из 6, страница 1 из 1
Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
    #32433981
php-Coder
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Господа, давайте раз и навсегда разберемся с проблемой получения данных о посетителях и способах хранения статистической информации по посещениям ресурсов в мускуле в этом топике.

Предлагаемые вопросы на обсуждение:

Код: plaintext
1.
2.
Рационально ли использовать для получения статистики такую схему: 
валить всю инфу по каждому хиту в таблицу лог (и так по каждому ресурсу),
 а потом ее разбирать роботами или лучше сразу раскладывать по полочкам.


Код: plaintext
1.
2.
3.
Рационально ли проектировать нормализованную БД, или проще сразу 
определиться с необходимыми вариантами отчетов по посещаемости 
и для каждого отчета сделать свою таблицу во избежании использования
 всякого рода соединений таблиц JOIN.


Код: plaintext
1.
2.
3.
Рационально ли хранить полную информацию по каждому хиту или рациональнее 
хранить агрегированные данные (например, суммирование по часамили суткам  хитов, хостов 
и уников, или суммирование браузеров 
с поддержкой кукисов, джавы и прочее).


Код: plaintext
1.
2.
3.
4.
5.
Как можно определить поддержку кукисов (для дальнейшего определения уникальности посещения), 
если нет уверенности, что владельцы сайтов не снесут изменения в код счетчика 
(там где определяется поддержка кукисов вместо условий всегда поставить ДА и тогда каждый хит
 посетителя без куков будет воспрониматься многими системами как новое посещение, 
уник то  бишь). Это во первых, а во вторых при помощи ПХП нельзя на одной
странице поставить кук и тут же его проверить, он появится только после перезагрузки страницы.


Давайте начнем обсуждение с этого небольшого списка вопросов и расставим все точки над "i".
...
Рейтинг: 0 / 0
Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
    #32434061
Фотография Groove
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Код: plaintext
1.
2.
Рационально ли использовать для получения статистики такую схему: 
валить всю инфу по каждому хиту в таблицу лог (и так по каждому ресурсу),
а потом ее разбирать роботами или лучше сразу раскладывать по полочкам.

Наверное рационально, потому, что при вызове счетчика он сделает два запроса: один инсерт в таблицу логов, другой селект для вывода счетчика.
Плюс: быстродействие, минус: все остальные данные будут сгенерированы не сиюминутно, а раз в полчаса, час, в зависимости от настройки роботов.

Код: plaintext
1.
2.
3.
Рационально ли хранить полную информацию по каждому хиту или рациональнее 
хранить агрегированные данные (например, суммирование по часамили суткам  хитов, хостов 
и уников, или суммирование браузеров 
с поддержкой кукисов, джавы и прочее).

Хы, если позволяет дисковое пространство, то храните - пожалуйста, но обычно для получения отчетов используют уже обработанные агрегированные данные, по исходникам можно получать статистику разве что для небольшого количества малопосещаемых сайтов, например для одного своего сайта.
...
Рейтинг: 0 / 0
Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
    #32434320
Stellar.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Рационально ли использовать для получения статистики такую схему:
валить всю инфу по каждому хиту в таблицу лог (и так по каждому ресурсу),
а потом ее разбирать роботами или лучше сразу раскладывать по полочкам.
Нерационально. Для нормального счетчика MySQL - слишком медленное решение. Работать это не будет.




Рационально ли проектировать нормализованную БД, или проще сразу
определиться с необходимыми вариантами отчетов по посещаемости
и для каждого отчета сделать свою таблицу во избежании использования
всякого рода соединений таблиц JOIN.
Нормализованная база будет слишком медленно работать. Надо делать отчеты не по каждому запросу, а раз в какое-то время (1 - 6 часов) и хранить в статике.




eРационально ли хранить полную информацию по каждому хиту или рациональнее
хранить агрегированные данные (например, суммирование по часамили суткам хитов, хостов
и уников, или суммирование браузеров
с поддержкой кукисов, джавы и прочее).
Каждый хит сам по себе ничего не значит; важна лишь общая статистика.




Как можно определить поддержку кукисов (для дальнейшего определения уникальности посещения),
если нет уверенности, что владельцы сайтов не снесут изменения в код счетчика
Никак. Это и не требуется.


Это во первых, а во вторых при помощи ПХП нельзя на одной
странице поставить кук и тут же его проверить, он появится только после перезагрузки страницы.
Никакого PHP в качестве движка быть не может. Пользовательская часть - да, ради бога. Сам счетчик должен быть написан в виде С проложения быстрого HTTP сервера (0W-httpd) или типа такого.


P.S. Господа форумчане! Чтобы не спорить по пустому, просто стукнитесь в аську 727977; я расскажу где я работаю и чем занимаюсь -- это избавит от необходимости доказывать что и как надо делать для счетчиков.
...
Рейтинг: 0 / 0
Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
    #32434719
Фотография Groove
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Господа, у меня тоже есть вопрос:
как хранить статистику не только по каждому унику (разрешение экрана, кол-во цветов, куки, IP и прочее), но и пути его движения по сайту?

И что делать с теми посетителями у которых отключены куки? По ним то никак пути не прописать...
...
Рейтинг: 0 / 0
Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
    #32435266
Макс М.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Groove
http://www.phpopentracker.de/en/index.php - это API для создания статистики на ПХП (для рейтинга сайтов не подойдет, но для собственной статистики вполне). Я бегло просматривал - по-моему там есть то, что тебе нужно
...
Рейтинг: 0 / 0
Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
    #32437175
php-Coder
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Господа, еще вопрос на обсуждение:
если в таблицу ЛОГ валить всю информацию о посещении, то туда не плохо было бы добавить и какой нибудь идентификатор посетителя (сгенерированный), а потом его писать в куки. Это для того, чтобы можно было сгруппировать по айпишнику, или внутри айпишника по этому идентификатору.
Так вот это хорошая идея, если его генерить как md5(uniqid(rand(), true));
и писать в куки например на месяц?

и таблица логов будет иметь вид:

Идентификатор посещения (автоинкремент)
Идентификатор посетителя (берется из куков, если нет - генерируется)
REMOTE_ADDR
Время посещения
ФЛАГ: включена ли поддержка куков
etc.

А при разборе лога всех посетителей с выключенными куками для одного айпишника сводить к одному унику.

Так нормально?
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / MySQL [игнор отключен] [закрыт для гостей] / Здесь:РЕЙТИНГ САЙТОВ НА MySQL Все вопросы в этом топике
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]