Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Кто силен в алгоритмах? Ранжирование на основе популярности материала. / 11 сообщений из 11, страница 1 из 1
11.03.2015, 23:32
    #38901927
linki
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
На странице 20 позиций
(не особо важно что это - выдача поисковой системы со ссылками; или страница с анекдотами, где каждый юзер может поставить лайк +1).

Собрана статистика.
Нужно дать оценку -5..+5 каждой записи, в зависимости от количества кликов/лайков.
Проблема: первые позиции всегда будут получать больше кликов/лайков. Чем ниже позиция - тем выше ценность лайков/кликов на ней. Нужен какой-то понижающий коэфициент. Или как?

В итоге нужно будет отсортировать записи по популярности. А худшую запись выбросить.

Логично, если по всем позициям придется равное количество кликов, худшей будет - первая.

Вот как все это описать цифрами?
Какой понижающий коэффициент в зависимости от позиции?
...
Рейтинг: 0 / 0
12.03.2015, 00:03
    #38901931
linki
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
Еще, каждый человек оценивает только ОДНУ запись на странице - "ставит +1" , если он оценил 10 позицию, значит то, что было выше (1-9) - ему не понравились.

Если на примере выдачи поисковой системы (гугла, яндекса...): самая ценная - последний клик на странице со ссылками, значит результат данной ссылки его удовлетворил для данного поискового запроса. Он тоже один на страницу.
...
Рейтинг: 0 / 0
12.03.2015, 13:06
    #38902347
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
Нужно случайным образом выбирать 20 позиций из всего множества и показывать.
...
Рейтинг: 0 / 0
12.03.2015, 13:08
    #38902349
miksoft
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
linkiНужен какой-то понижающий коэфициент.Количество показов.
...
Рейтинг: 0 / 0
13.03.2015, 11:23
    #38903520
linki
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
Выводить записи на страницы в случайном порядке - мы не можем.
Данные уже накоплены, нужно анализировать.
...
Рейтинг: 0 / 0
15.03.2015, 12:33
    #38905160
linki
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
Никто не советует, но буду писать, может кому пригодится.

Нашел статистику кликов по выдаче гугла в заисимости от позиции:



Я же решил всю стат собрать и посмотреть средние данные, но т.к. страницы(запросы) имеют абсолютно разную популярность (посещаемость), решил привести статистику каждой страницы/запроса к 0-100 и посчитать среднее по этим данным (процентное_соотношение в таблице), вот что вышло:

позиция всего_кликов процентное_соотношение:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
 1 37921 100%
 2 26212  88% 
 3 23394  90% 
 4 17701  70% 
 5 16424  55% 
 6 14748  59% 
 7 10437  46% 
 8  9617  48%  
 9 11327  44% 
10 14978  39%
(2 и 3 колонка не связаны, почему -- выше; 2 колонка по сути - не нужна, значимая - 3)

По 3, 6, 8 позициям явно видно всплески, показывающие, что есть нужные материалы не на своих позициях (их нужно ранжировать выше).


Есть цифры -- какой ставить коэффициент затухания для оценки каждой позиции?

Тупо по -5% на каждую позицию?
...
Рейтинг: 0 / 0
15.03.2015, 19:54
    #38905352
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
linki,

в чём суть твоего вопроса?

Если ты хочешь взять статистику google - то бери готовые коээфициенты в процентах. Они очевидны.

Если ты хочешь получить интерполяцию графика - то это другая задача. И давай ее отдельным топиком.

P.S. Никакого "коэффициента затухания" не существует. Не создавай профанаций. Чтоб над тобой
знающие не смеялись.
...
Рейтинг: 0 / 0
15.03.2015, 20:38
    #38905368
miksoft
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
linkiпервые позиции всегда будут получать больше кликов/лайковlinkiВыводить записи на страницы в случайном порядке - мы не можем.
Данные уже накоплены, нужно анализировать.Так "будут" или "уже"?
Если "будут", то считать показы и делить лайки на количество показов. Если "уже", то никак, если статистика по количеству показов не собиралась.
100 лайков из 1000 показов - это значительно лучше, чем 1000 лайков из 1000000 показов.
...
Рейтинг: 0 / 0
16.03.2015, 18:36
    #38906299
linki
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
miksoftДанные уже накоплены, нужно анализировать.Так "будут" или "уже"?
Если "будут", то считать показы и делить лайки на количество показов.[/quot]
И уже (накоплено, табличка выше), и будут (накапливаться).

Отнял у каждой позиции 5% и получилось для начала более-менее.
...
Рейтинг: 0 / 0
17.03.2015, 04:46
    #38906545
SashaMercury
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
linkiНа странице 20 позиций
(не особо важно что это - выдача поисковой системы со ссылками; или страница с анекдотами, где каждый юзер может поставить лайк +1).

Собрана статистика.
Нужно дать оценку -5..+5 каждой записи, в зависимости от количества кликов/лайков.
Проблема: первые позиции всегда будут получать больше кликов/лайков. Чем ниже позиция - тем выше ценность лайков/кликов на ней. Нужен какой-то понижающий коэфициент. Или как?

В итоге нужно будет отсортировать записи по популярности. А худшую запись выбросить.

Логично, если по всем позициям придется равное количество кликов, худшей будет - первая.

Вот как все это описать цифрами?
Какой понижающий коэффициент в зависимости от позиции?

Существует класс задач конвекция-диффузия-реакция. Этот класс позволяет описать в частности динамику популяции и поведенческие моменты популяции. Возможно ДУ КДР можно использовать для описания ваших процессов. Поищите статьи, и расскажите нам. Только не русские, SIAM.

А если порассуждать. Кроме sql.ru, я появляюсь на странице Жозе Моуринью, sport.ru. И судя по лайкам к комментариям на этой странице, ранжирование происходит по качеству. Это и логично. Тем не менее, я бы делал это так. Было бы две колонки, одна постоянная, и ранжированная по лайкам, вторая, содержала бы новые комментарии. По 10 минут на 1 месте появившийся. Если за это время он набирает 7 голосов например, что-то с ним делать, если нет, убирать вниз .
PS
то что вы описали, наверняка можно (и скорее всего уже) описать с помощью ДУ, читайте про КДР.
...
Рейтинг: 0 / 0
17.03.2015, 09:10
    #38906618
mikron
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Кто силен в алгоритмах? Ранжирование на основе популярности материала.
linki,

(Количество всех кликов - количество кликов по позиции) / количество всех кликов
...
Рейтинг: 0 / 0
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Кто силен в алгоритмах? Ранжирование на основе популярности материала. / 11 сообщений из 11, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]