tsvector -> получить список строк / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / tsvector -> получить список строк

17 сообщений из 17, страница 1 из 1

tsvector -> получить список строк

#34777385

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

есть исходная строка 'aa bb cc aa xx'
есть построенный по ней вектор 'aa':1,4 'bb':2 'cc':3 'xx':5

как получить такую выборку:

'aa'
'bb'
'cc'
'xx'

...

Рейтинг:

0 / 0

05.09.2007, 13:14

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34777885

Гость

не совсем понятна цель процедуры
зачем делать из строки tsvector? зачем нужен record set?

...

Рейтинг:

0 / 0

05.09.2007, 14:47

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34777900

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

izне совсем понятна цель процедуры
зачем делать из строки tsvector? зачем нужен record set?

Для полнотекстового поиска я строю тсвектор.

Я хочу для таблицы создать вспомогательную таблицу, которая будет содержать уникальные слова из основной.

Потому из вектоора хочу выдернуть слова

...

Рейтинг:

0 / 0

05.09.2007, 14:51

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34777924

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

дошел до такого:

SELECT strip(to_tsvector((parse('aa bb cc xx cc')).token))

в результате правда идут все пробелы и повторяющиеся слова, но хоть так....

...

Рейтинг:

0 / 0

05.09.2007, 14:55

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34777998

Гость

из parse() можно делать выборку по определенному tokid, очевидно, чтобы исключить пробелы. для уникальных слов можно сделать distinct. но все это жуткий misdesign, полнотекстовый поиск не предназначен для такого, понятное дело. я бы делал эту задачу каким-нибудь другим способом.

...

Рейтинг:

0 / 0

05.09.2007, 15:06

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34778016

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

izиз parse() можно делать выборку по определенному tokid, очевидно, чтобы исключить пробелы. для уникальных слов можно сделать distinct. но все это жуткий misdesign, полнотекстовый поиск не предназначен для такого, понятное дело. я бы делал эту задачу каким-нибудь другим способом.

вполне может быть мисдизайн...., но каким другим?

вот такой запрос будет выбирать все уникальные слова

select distinct * from
(SELECT strip(to_tsvector((parse(xpath)).token)) from xprop ) as t;

...

Рейтинг:

0 / 0

05.09.2007, 15:09

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34778042

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

как можно token id использовать для выбрасывания пробелов?

...

Рейтинг:

0 / 0

05.09.2007, 15:14

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34778638

Гость

сходу не могу вспомнить, есть ли функция "показать токены данного парсера" в 8.2 (в 8.3 точно есть), но анализ запроса вроде такого:

test=# select * from parse('aaa bbb adsada-adasd, !$# &');
tokid | token
-------+--------------
1 | aaa
12 |
1 | bbb
12 |
2 |
12 |
16 | adsada-adasd
11 | adsada
12 | -
11 | adasd
12 | , !$#
12 | &
(12 rows)

показывает, что вам нужно выбрасывать tokid = 12.

Еще, кстати, в tsearch2 есть функции для анализа состояния GiST индекса -- в частности, можно узнать количество уникальных токенов.

...

Рейтинг:

0 / 0

05.09.2007, 17:07

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34778641

Гость

сорри, при копипасте из psql побились русские буквы, так что пропали токены nlword

...

Рейтинг:

0 / 0

05.09.2007, 17:08

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34778816

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

кстати, в tsvector уже сидят формы слов обработанные и пригодные для поиска или просто выделенные из текста лексемы?

...

Рейтинг:

0 / 0

05.09.2007, 17:43

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34778953

Гость

это вам нужно документацию хорошенько и с самого начала почитать

test=# select to_tsvector('utf8_russian', 'преклонился');
to_tsvector
------------------
'преклониться':1
(1 row)

tsvector содержит, разумеется, нормализованные в соотв-ии с заданным словарем лексемы.

...

Рейтинг:

0 / 0

05.09.2007, 18:14

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34779064

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

izэто вам нужно документацию хорошенько и с самого начала почитать

test=# select to_tsvector('utf8_russian', 'преклонился');
to_tsvector
------------------
'преклониться':1
(1 row)

tsvector содержит, разумеется, нормализованные в соотв-ии с заданным словарем лексемы.

Именно оно.
Потому я и хотел взять слова из вектора....Но не пойму как их оттуда вытащить.

...

Рейтинг:

0 / 0

05.09.2007, 18:45

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34779078

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

Winnipuh izэто вам нужно документацию хорошенько и с самого начала почитать

test=# select to_tsvector('utf8_russian', 'преклонился');
to_tsvector
------------------
'преклониться':1
(1 row)

tsvector содержит, разумеется, нормализованные в соотв-ии с заданным словарем лексемы.

Именно оно.
Потому я и хотел взять слова из вектора....Но не пойму как их оттуда вытащить.

у меня кстати результат такой
-------------------------------
'преклон':1

...

Рейтинг:

0 / 0

05.09.2007, 18:49

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34779248

Гость

это stemming
у вас плохо настроен tsearch2

...

Рейтинг:

0 / 0

05.09.2007, 19:37

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34779256

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

izэто stemming
у вас плохо настроен tsearch2

плохо на русский язык или вообще?
Русский пока мне не нужен, надо хотя бы с английским разобраться

...

Рейтинг:

0 / 0

05.09.2007, 19:39

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34779280

Гость

судя по приведенному вами примеру, русский настроен плохо
о других языках судить не могу

...

Рейтинг:

0 / 0

05.09.2007, 19:50

| Ответить | Цитировать | Написать

tsvector -> получить список строк

#34779287

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

izсудя по приведенному вами примеру, русский настроен плохо
о других языках судить не могу

спасибо за содействие!

...

Рейтинг:

0 / 0

05.09.2007, 19:54

| Ответить | Цитировать | Написать

17 сообщений из 17, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / tsvector -> получить список строк

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&msg=34779064&tid=2005062]:	0ms
get settings:	8ms
get forum list:	16ms
check forum access:	4ms
check topic access:	4ms
track hit:	40ms
get topic data:	11ms
get forum data:	3ms
get page messages:	54ms
get tp. blocked users:	2ms
others:	243ms

total:	385ms