ASE 12.5 - поиск в строке, что быстрее? / Sybase ASA, ASE, IQ

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / ASE 12.5 - поиск в строке, что быстрее?

4 сообщений из 4, страница 1 из 1

ASE 12.5 - поиск в строке, что быстрее?

#36640131

Kru

Участник

Откуда: Жуковский

Сообщения: 391

Рейтинг: 0 / 0

Господа,
такой скорее теоретический вопрос.

Есть запросы котором есть SARG по индексированному полю и есть SARG ищущий в строке.

Т.е поиск второго SARG будет осуществляться перебором записей в страницах данных отобранных 1м SARG.

Сам поиск в строке можно реализовать одним из 3х способов:
where substring(x,1,4)='blah' or substring(x,1,4)='foob'
where substring(x,1,4) in ('blah', 'foob')
where x like 'blah%' or x like 'foob%'

Кластеризации по полю x нет, так что с этой стороны у like нет премущества.

Вопрос - будет ли какой-нибудь из 3х способов работать быстрее и почему?

Заранее спасибо

...

Рейтинг:

0 / 0

20.05.2010, 19:31

| Ответить | Цитировать | Написать

ASE 12.5 - поиск в строке, что быстрее?

#36640218

Kru

Участник

Откуда: Жуковский

Сообщения: 391

Рейтинг: 0 / 0

Вот ещё такой вопрос - в I/O подобные задачи измерять смысла нет, т.к. вопрос про то что быстрее like или substring.
Можно ли как-нибудь измерить стоимость этих операций?

Заранее большое спасибо

...

Рейтинг:

0 / 0

20.05.2010, 20:22

| Ответить | Цитировать | Написать

ASE 12.5 - поиск в строке, что быстрее?

#36642364

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Kru пишет:
> Есть запросы котором есть SARG по индексированному полю и есть SARG
> ищущий в строке.
>
> Т.е поиск второго SARG будет осуществляться перебором записей в
> страницах данных отобранных 1м SARG.

Запросы целиком, пожалуйста.

> Сам поиск в строке можно реализовать одним из 3х способов:
> where substring(x,1,4)='blah' or substring(x,1,4)='foob'

Не оптимизируется индексом

> where substring(x,1,4) in ('blah', 'foob')

Не оптимизируется индексом

> where x like 'blah%' or x like 'foob%'

ОПТИмизируется индексом

> Кластеризации по полю x нет, так что с этой стороны у like нет премущества.

Главное чтобы индекс был по этому полю.

> Вопрос - будет ли какой-нибудь из 3х способов работать быстрее и почему?

Вроде всё написал.

Но лучше запросы целиком смотреть.
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

21.05.2010, 18:11

| Ответить | Цитировать | Написать

ASE 12.5 - поиск в строке, что быстрее?

#36674314

Kru

Участник

Откуда: Жуковский

Сообщения: 391

Рейтинг: 0 / 0

MasterZiv
Kru пишет:
> Есть запросы котором есть SARG по индексированному полю и есть SARG
> ищущий в строке.
>
> Т.е поиск второго SARG будет осуществляться перебором записей в
> страницах данных отобранных 1м SARG.

Запросы целиком, пожалуйста.

> Сам поиск в строке можно реализовать одним из 3х способов:
> where substring(x,1,4)='blah' or substring(x,1,4)='foob'

Не оптимизируется индексом

> where substring(x,1,4) in ('blah', 'foob')

Не оптимизируется индексом

> where x like 'blah%' or x like 'foob%'

ОПТИмизируется индексом

> Кластеризации по полю x нет, так что с этой стороны у like нет премущества.

Главное чтобы индекс был по этому полю.

> Вопрос - будет ли какой-нибудь из 3х способов работать быстрее и почему?

Вроде всё написал.

Но лучше запросы целиком смотреть.

Добрый день, MasterZiv,
большое спасибо за ответ.
Я извиняюсь, что в свою очередь отвечаю с задержкой - были разные запарки...

Ниже пример
Таблица с 2мя полями - одно числовое, 2е строковое.

Индексы есть на обоих полях, но кластеризация по числовому полю.

Далее я использую разные выражения для поиска по фрагменту строки, строю планы и замеряю статистику.

Результаты, не зависимо от выражения получаются одинаковыми, хотя используемые операторы совершенно разные.

В 3м тесте специально добавил пару значений с гораздо более высокой кардинальностью. Запросы тем не менее всё равно используют кластерный индекс, что в общем-то понятно...

В общем-то ясно, что i/o не зависит от оператора, за исключением случаев когда на строковом поле кластерный индекс и используется like 'abc%'.

Но... может всё-же быть разница в производительности заметная на большом объеме данных?

Есть ли какая-нибудь возможность сравнить стоимость операторов?

Заранее большое спасибо

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.

create table pat_test( i int, j varchar( 20 ))
go
create clustered index idx_pt on pat_test (i)
go
create index idx_j on pat_test(j)
go
declare @i int, @j varchar ( 20 ), @x int

select @x =  0 

while @x <  10000 
begin 
    select @i = @x
    select @x = @x+ 10 
    while @i < @x
    begin
        select @i = @i+ 1 
        select @j = 'aa' + convert (varchar( 10 ), @i)
        insert into pat_test values (@i, @j)
    end
    
    select @x = @x+ 10 
    while @i <@x
    begin
        select @i = @i+ 1 
        select @j = 'bb' + convert (varchar( 10 ), @i)
            insert into pat_test values (@i, @j)
    end
    
    select @x = @x+ 10 
    while @i <@x
    begin
        select @i = @i+ 1 
        select @j = 'cc' + convert (varchar( 10 ), @i)
            insert into pat_test values (@i, @j)
    end
end

-- test 1
set showplan on
go
select * from pat_test
where i between  120  and  180 
and ( j like 'aa%' or j like 'bb%')

set showplan on
go
select * from pat_test
where  i between  120  and  180 
and substring(j, 1 , 2 ) in ('aa', 'bb')

set showplan on
go
select * from pat_test
where  i between  120  and  180 
and (substring(j, 1 , 2 ) = 'aa' or  substring(j, 1 , 2 ) = 'bb')

-- test 2
set statistics io, time on
go
select * from pat_test
where i between  120  and  180 
and ( j like 'aa%' or j like 'bb%')

set statistics io, time on
go
select * from pat_test
where  i between  120  and  180 
and substring(j, 1 , 2 ) in ('aa', 'bb')

set statistics io, time on
go
select * from pat_test
where  i between  120  and  180 
and (substring(j, 1 , 2 ) = 'aa' or  substring(j, 1 , 2 ) = 'bb')
-- test 3
 insert into pat_test 
 select count(*)+ 1 , 'cc' from pat_test
 
  insert into pat_test 
 select count(*)+ 1 , 'zz' from pat_test
 
 set showplan on
 go
  select * from pat_test
where  i >  10000 
and (substring(j, 1 , 2 ) = 'cc' or  substring(j, 1 , 2 ) = 'zz')

...

Рейтинг:

0 / 0

07.06.2010, 23:00

| Ответить | Цитировать | Написать

4 сообщений из 4, страница 1 из 1

Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / ASE 12.5 - поиск в строке, что быстрее?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=55&msg=36640218&tid=2010635]:	0ms
get settings:	10ms
get forum list:	12ms
check forum access:	3ms
check topic access:	3ms
track hit:	15ms
get topic data:	7ms
get forum data:	2ms
get page messages:	47ms
get tp. blocked users:	1ms
others:	214ms

total:	314ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы