|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
Есть база коротких текстов (пусть это будут пословицы или афоризмы, по сути это неважно.) Нужно получить частотность слов, т.е. сколько раз встречается каждое слово во всех текстах. Функцией to_tsvector отфильтровываем стоп-слова и приводим оставшиеся слова в нормализованный вид. записываем полученные слова в отдельное поле таблицы. А дальше то как? Читал про полнотекстовый поиск в postges, но это оказалось несколько не то, что я хочу получить. Эта задача вообще может быть решена средствами sql запросов - или надо как-то по другому её решать? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 12:20 |
|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
Чем не устроила функция ts_stat? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 12:46 |
|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
пока не знаю чем не устроила. попробую её использовать. спасибо за наводку. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 13:06 |
|
|
start [/forum/topic.php?fid=53&gotonew=1&tid=1996670]: |
0ms |
get settings: |
7ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
40ms |
get topic data: |
8ms |
get first new msg: |
7ms |
get forum data: |
2ms |
get page messages: |
38ms |
get tp. blocked users: |
1ms |
others: | 11ms |
total: | 135ms |
0 / 0 |