powered by simpleCommunicator - 2.0.53     © 2025 Programmizd 02
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Кто реализовывал Exploratory Search?
6 сообщений из 6, страница 1 из 1
Кто реализовывал Exploratory Search?
    #39580986
256k
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В PostgreSQL.


Имеется в виду тематическое моделирование

https://ru.wikipedia.org/wiki/Тематическое_моделирование


и вот здесь яндексоиды пишут про "Разведочный" поиск

https://habrahabr.ru/company/yandex/blog/313340/
...
Рейтинг: 0 / 0
Кто реализовывал Exploratory Search?
    #39581061
qwwq
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
256kВ PostgreSQL.


Имеется в виду тематическое моделирование

https://ru.wikipedia.org/wiki/Тематическое_моделирование


и вот здесь яндексоиды пишут про "Разведочный" поиск

https://habrahabr.ru/company/yandex/blog/313340/

а в каком отношение к ПЖ ?


я делал только частичные чисто технические подзадачи в пж:
парсить (токенайзить) можно токенайзером пж.
лемматировать токен встроенной ф-ей , по тому или иному словарю
совпадения с ключевыми мультивордами по сноуболу -- чисто на регекспах
по ханспелу -- на пересечении массивов-токенов (медленнее), с порядком, с совпадением хоть чего-то /на токен
ну и т.п.
понавертеть своих ф--й, по ним и индексировать (лучше -- с материализацией)


я обхожусь обычным тф-идф в той или иной интерпретации (смотрю на некую вытяжку из объекта как на поисковый запрос , а на какую-либо (вытяжку из) коллекцию/рубрикатор/иное -- как на набор искомых документов). одним запросом.


а всякие "кластеризации" -- это из разновидности натягивания сов на глобусы.
-- "они растягиваются".
для пж можно пайтоновские брать. (в пайтоне их есть)
тут пока больше искусство , чем строгая арифметика, имхо.
но задача маячит.

хотя если считать по отдельному док-ту много, а док-ты неизменны -- то вылезать надо из субд наружу.



за ссылки снкс. почитаемо.
...
Рейтинг: 0 / 0
Кто реализовывал Exploratory Search?
    #39581096
256k
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
qwwq256kВ PostgreSQL.


Имеется в виду тематическое моделирование

https://ru.wikipedia.org/wiki/Тематическое_моделирование


и вот здесь яндексоиды пишут про "Разведочный" поиск

https://habrahabr.ru/company/yandex/blog/313340/

а в каком отношение к ПЖ ?


я делал только частичные чисто технические подзадачи в пж:
парсить (токенайзить) можно токенайзером пж.
лемматировать токен встроенной ф-ей , по тому или иному словарю
совпадения с ключевыми мультивордами по сноуболу -- чисто на регекспах
по ханспелу -- на пересечении массивов-токенов (медленнее), с порядком, с совпадением хоть чего-то /на токен
ну и т.п.
понавертеть своих ф--й, по ним и индексировать (лучше -- с материализацией)


я обхожусь обычным тф-идф в той или иной интерпретации (смотрю на некую вытяжку из объекта как на поисковый запрос , а на какую-либо (вытяжку из) коллекцию/рубрикатор/иное -- как на набор искомых документов). одним запросом.


а всякие "кластеризации" -- это из разновидности натягивания сов на глобусы.
-- "они растягиваются".
для пж можно пайтоновские брать. (в пайтоне их есть)
тут пока больше искусство , чем строгая арифметика, имхо.
но задача маячит.

хотя если считать по отдельному док-ту много, а док-ты неизменны -- то вылезать надо из субд наружу.



за ссылки снкс. почитаемо.

В том смысле, что средствами базы реализовать в базе, чтобы минимум внешних примочек.
Например, самого полнотекстовго поиска мало, а надо еще и тематизацию и т.д.
...
Рейтинг: 0 / 0
Кто реализовывал Exploratory Search?
    #39581204
Alexius
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
256k,

можно на R что-то сделать для обработки/классификации документов и в хранимки это поместить (на pl/R). не знаю правда, есть ли в этом смысл.
...
Рейтинг: 0 / 0
Кто реализовывал Exploratory Search?
    #39581230
qwwq
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexius,

можно и пайтон прикрутить
https://stackoverflow.com/questions/6486738/clustering-using-latent-dirichlet-allocation-algo-in-gensim

вот только зачем .

можно решать такие задачи, когда тематика так и останется скрытым параметром -- неявной абстракцией модели (атомом демосфена), и интерпретировать непонятные многомерные хреновины не потребуется. а вход и выход -- помапить объекты А на объекты Б.
...
Рейтинг: 0 / 0
Кто реализовывал Exploratory Search?
    #39581273
qwwq
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
qwwq <> (атомом демосфена)<>.

мечом намокла (c)
или геометрией еврипида, ля

шизофазия--с, простите, авторечь т.с.
"то ли это возрастное"
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Кто реализовывал Exploratory Search?
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]