|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
Есть база коротких текстов (пусть это будут пословицы или афоризмы, по сути это неважно.) Нужно получить частотность слов, т.е. сколько раз встречается каждое слово во всех текстах. Функцией to_tsvector отфильтровываем стоп-слова и приводим оставшиеся слова в нормализованный вид. записываем полученные слова в отдельное поле таблицы. А дальше то как? Читал про полнотекстовый поиск в postges, но это оказалось несколько не то, что я хочу получить. Эта задача вообще может быть решена средствами sql запросов - или надо как-то по другому её решать? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 12:20 |
|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
Чем не устроила функция ts_stat? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 12:46 |
|
подсчет слов в текстах
|
|||
---|---|---|---|
#18+
пока не знаю чем не устроила. попробую её использовать. спасибо за наводку. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.03.2017, 13:06 |
|
|
start [/forum/topic.php?fid=53&fpage=77&tid=1996670]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
34ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
47ms |
get tp. blocked users: |
2ms |
others: | 344ms |
total: | 470ms |
0 / 0 |