Регистронезависимый поиск / IBM DB2, WebSphere, IMS, U2

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Регистронезависимый поиск

9 сообщений из 9, страница 1 из 1

Регистронезависимый поиск

#37272796

Troglodit

Гость

DB2 9.7.
По поиску нашел, что можно через дополнительный столбец, но это жутко неудобно,да и база пухнет.
в примере нашел

Код: plaintext

1.
2.

CREATE DATABASE testdb 
   USING CODESET UTF- 8  TERRITORY US 
   COLLATE USING UCA500R1_LEN_S2

но для у меня для русских букв не работает.

...

Рейтинг:

0 / 0

21.05.2011, 18:33

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37273081

const64+

Гость

Troglodit,

Можно при поиске выполнять преобразование - UCASE , LCASE

...

Рейтинг:

0 / 0

22.05.2011, 09:16

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37273102

Troglodit

Гость

Если я правильно понимаю, в этом случае про индексированный поиск (без дополнительного генерируемого поля) можно забыть.

...

Рейтинг:

0 / 0

22.05.2011, 10:44

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37273856

Mark Barinstein

Гость

TrogloditDB2 9.7.
По поиску нашел, что можно через дополнительный столбец, но это жутко неудобно,да и база пухнет.
в примере нашел

Код: plaintext

1.
2.

CREATE DATABASE testdb 
   USING CODESET UTF- 8  TERRITORY US 
   COLLATE USING UCA500R1_LEN_S2

но для у меня для русских букв не работает.Должно работать.
Что выдаёт:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

select v, collation_key_bit(v, 'UCA500R1_LEN_S2')
from table(values
  'привет'
, 'Привет'
, 'ПРИВЕТ'
, 'hello'
, 'HELLO'
) t(v)
where v=
--'Hello'
'привет'

...

Рейтинг:

0 / 0

23.05.2011, 09:42

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37274006

Troglodit

Гость

Спасибо. Всё работает. Я думал данный скрипт работает только для латинских букв.

...

Рейтинг:

0 / 0

23.05.2011, 11:07

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37274044

Mark Barinstein

Гость

Можно почитать про возможности здесь:
Unicode Collation Algorithm based collations
Т.е. для русского можно было бы выбрать:

Код: plaintext

1.
2.

CREATE DATABASE testdb 
   USING CODESET UTF- 8  TERRITORY RU
   COLLATE USING UCA500R1_LRU_S2

Для игнорирования разницы:
- 'ё' и 'е'
- 'й' и 'и'
можно выбрать:
UCA500R1_LRU_S 1

...

Рейтинг:

0 / 0

23.05.2011, 11:24

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37274088

Troglodit

Гость

Спасибо, Марк.

...

Рейтинг:

0 / 0

23.05.2011, 11:42

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37277631

Victor Metelitsa

Участник

Откуда: Тюмень

Сообщения: 2 626

Рейтинг: 0 / 0

Однако, если вы работаете с кириллицей и вам реально надо однобайтовую кодировку, при использовании юникода взамен generated columns (не очень удобны, но не так уж неудобны) база может распухнуть куда больше (это зависит от процента кириллических символов и по каким колонкам регистронезависимый поиск реально нужен). В самом деле,

1) (экстремальный случай) Если у вас исходная колонка CHAR(X) и в ней только русские символы, в юникодной базе она должна быть CHAR(2X) и размер индекса удваивается (точнее, конечно, удваиваются размеры значений в нём). Возможно, регистронезависимый поиск по ней не нужен. А если нужен, то в однобайтовой базе вместо одной колонки CHAR(2X) будет две CHAR(X), но индекс будет по одной, меньшего размера (имея в виду, что мы делаем его по uppercase'вой колонке).

2) (другой экстремальный случай) С другой стороны, пусть возьмём две колонки VARCHAR(X) (вторая - generated, ucase от первой) и эквивалент - одну VARCHAR(2X) в юникодной. Для русской строки в N байтов в таблице однобайтовой базы потребуется 2*N байтов плюс два VARCHAR-оверхеда. Для юникодной будет один VARCHAR-оверхед вместо двух, но размер ключа в индексе удвоенный. Для латинской же юникодная база однозначно должна быть выгоднее.

Для конкретных случаев надо считать.

...

Рейтинг:

0 / 0

25.05.2011, 00:19

| Ответить | Цитировать | Написать

Регистронезависимый поиск

#37278480

Troglodit

Гость

Увеличение размера базы в моем случае вторичны. А вот организация фильтрации таблицы/view и пр., для этого подойдет только регистронезависимый поиск, либо хранить все в верхнем регистре.

...

Рейтинг:

0 / 0

25.05.2011, 14:01

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / Регистронезависимый поиск

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=43&msg=37274006&tid=1602241]:	0ms
get settings:	10ms
get forum list:	19ms
check forum access:	3ms
check topic access:	3ms
track hit:	56ms
get topic data:	11ms
get forum data:	3ms
get page messages:	50ms
get tp. blocked users:	1ms
others:	222ms

total:	378ms