|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
Есть база коротких текстов (пусть это будут пословицы или афоризмы, по сути это неважно.) Нужно получить частотность слов, т.е. сколько раз встречается каждое слово во всех текстах. Функцией to_tsvector отфильтровываем стоп-слова и приводим оставшиеся слова в нормализованный вид. записываем полученные слова в отдельное поле таблицы. А дальше то как? Читал про полнотекстовый поиск в postges, но это оказалось несколько не то, что я хочу получить. Эта задача вообще может быть решена средствами sql запросов - или надо как-то по другому её решать? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 12:20 |
|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
Чем не устроила функция ts_stat? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 12:46 |
|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
пока не знаю чем не устроила. попробую её использовать. спасибо за наводку. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 13:06 |
|
|
start [/forum/moderation_log.php?user_name=dva11]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
get settings: |
11ms |
get forum list: |
15ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
74ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
39ms |
get tp. blocked users: |
1ms |
others: | 1162ms |
total: | 1366ms |
0 / 0 |