История одна дата vs две. Что лучше? / Проектирование БД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / История одна дата vs две. Что лучше?

25 сообщений из 129, страница 5 из 6

все

История одна дата vs две. Что лучше?

#35668070

expla

Гость

BelyMasterZiv> А в других СУБД разве нельзя в constraint`ах использовать функции?
Функции можно как правило. Запросы нельзя.
Тут есть тонкость - запрос сегодня может возвращать одно, завтра другое. В зависимости от данных, которые лежат в БД.
В таком случае может получиться, что те данные, которые были введены вчера - сегодня уже неверные. Как серверу поступать с ними?

Типичный пример недетерминированного правила:

Код: plaintext

date_fm > sysdate- 1

Оракл на этот счёт уже не париться. Например, он уже определил UNIQUE без проверки. Т.е. старые данные, которые были заведены до создания UNIQUE могут содержать дубликаты, вновь создаваемые записи будут подвергаться проверке. Такое декларативное ограничение целостности можно рассматривать как бизнес правило, которое действует только во время изменения данных, но не является инвариантом всей БД.

...

Рейтинг:

0 / 0

21.11.2008, 13:48:34

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668099

Bely

Участник

Откуда: Москва

Сообщения: 1 650

Рейтинг: 0 / 0

вопросик_Чтений там будет меньше, чем у вас раза в полтора-два (думаю, вы и сами это проверили) - за счет однократного прохода индекса.1.Вы думаете, что поиск значения в индексе - медленнее, чем сканирование части индекса?
Веть для того, чтобы отсортировать результат - именно так и придется делать.
Одна надежда на то, что оптимизатор сам перевернет этот запрос к поиску max(dt_start)
2. Если строить индекс только по одной колонке, то это слабо отличается от варианта одной даты.
Я бы сказал - практически никак.

...

Рейтинг:

0 / 0

21.11.2008, 13:56:44

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668104

Bogdanov Andrey

Участник

Откуда: Да уже и сам не знаю...

Сообщения: 1 871

Рейтинг: 0 / 0

вопросик_Bogdanov AndreyПриведенные выше примеры как раз иллюстируют то, что "извращения" намного быстрее . Не буду спорить с тем, что у меня руки кривые, но других цифр пока никто не привел. Только теоретизируют. Ссылаясь на "практика показывает" постарайтесь приводить хоть какие-то доказательства. Передергиваете. Я приводил пример оптимизированного запроса с двумя датами для вашей модели. Индекс только по start_dt. Чтений там будет меньше, чем у вас раза в полтора-два (думаю, вы и сами это проверили) - за счет однократного прохода индекса.Вы как раз приводили пример с "извращениями" - когда используется поиск минимального значения одной даты. expla утверждал, что "извращения с min(dt) ни чуть не быстрее сканирования индекса с ДВУМЯ датами" вы при этом ссылаетесь на пример с индексом по ОДНОЙ дате и говорите, что я передергиваю. Предлагаю извиниться.

...

Рейтинг:

0 / 0

21.11.2008, 13:58:49

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668111

Bely

Участник

Откуда: Москва

Сообщения: 1 650

Рейтинг: 0 / 0

explaОракл на этот счёт уже не париться. Например, он уже определил UNIQUE без проверки. Т.е. старые данные, которые были заведены до создания UNIQUE могут содержать дубликаты, вновь создаваемые записи будут подвергаться проверке.Имеете ввиду NOVALIDATE?
Ну - это не совсем то же, что и "сегодня вставленная запись правильная, а завтра стала неверной".
Это скорее "Я знаю, что у меня нормальные данные - не надо зря шуршать дисками".

...

Рейтинг:

0 / 0

21.11.2008, 13:59:36

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668126

вопросик_

Гость

Bely ...Вы думаете, что поиск значения в индексе - медленнее, чем сканирование части индекса? ... Если строить индекс только по одной колонке, то это слабо отличается от варианта Я бы сказал - практически никак.
У вас появилось время ? выполните тест, чтений там наверняка будет меньше. И это простейшем запросе по одному товару. Когда позиций будет больше - ситуация будет еще значительней отличаться.
Две даты оставляют больше места для оптимизации при необходимости. При том, что в ряде случаев запросы при двух датах будут проще.

...

Рейтинг:

0 / 0

21.11.2008, 14:05:30

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668129

KOT MATPOCKuH

Участник

Откуда: г.Верхняя Салда, Урал, Россия, Земля, Млечный путь,Вселенная

Сообщения: 263

Рейтинг: 0 / 0

expla...с min(dt) требуется двойной поиск по индексу, сначала чтобы вычислить min, потом, чтобы найти ROWID искомой записи
А зачем искать "...ROWID искомой записи"? Дата есть в индексе (речь о конкретном запросе)
И зачем двойной поиск? В одном все делается не плохо

...

Рейтинг:

0 / 0

21.11.2008, 14:06:17

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668136

KOT MATPOCKuH

Участник

Откуда: г.Верхняя Салда, Урал, Россия, Земля, Млечный путь,Вселенная

Сообщения: 263

Рейтинг: 0 / 0

вопросик_
При том, что в ряде случаев запросы при двух датах будут проще.
Проще для программиста или быстрее для оракла?
Пока не ответим на этот вопрос - бодаться бессмысленно

...

Рейтинг:

0 / 0

21.11.2008, 14:08:33

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668138

expla

Гость

Bely,

Да я NOVALIDATE. Я о том, что обычно декларативные ограничения целостности рассматривают только как инвариант всей БД. Но не редко нам нужно проверить только постусловие транзакции, и это постусловие может меняться со временем, как из-за недетерминированных функций, типа sysdate, так и из-за изменения кода процедуры проверки. Видимо речь об этом.

...

Рейтинг:

0 / 0

21.11.2008, 14:08:42

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668140

Bogdanov Andrey

Участник

Откуда: Да уже и сам не знаю...

Сообщения: 1 871

Рейтинг: 0 / 0

explaУ каждого саоя практика.Нисколько не сомневаюсь в вашей практике, но здесь от вас вижу одну лишь теорию.

explaЕсли нужна взвешенная оценка, составте таблицу вида "аспект" X "вариант решения".В данном случае меня не интересуют ни взвешенные оценки, ни выбор какого-то варианта. В данном топике я лишь приводил примеры, доказывающие, что вопрос быстродействия для случая с двумя датами не столь очевиден. Вы взялись это оспорить, но ни одного подтверждающего примера не привели. В вопросе о быстродействии я воспринимаю только результаты экспериментов. Все остальные аргументы адресуйте кому-нибудь другому.

...

Рейтинг:

0 / 0

21.11.2008, 14:08:54

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668143

ChA

Участник

Откуда: Москва

Сообщения: 10 913

Рейтинг: 0 / 0

MasterZivФункции можно как правило. Запросы нельзя.А что мешает убрать запрос под функцию ?
MS SQL 2000

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.

USE pubs
GO
CREATE TABLE t (id int PRIMARY KEY)
GO
CREATE FUNCTION tcnt()
RETURNS int
BEGIN
RETURN (SELECT COUNT(*) FROM t)
END
GO
ALTER TABLE t ADD CONSTRAINT tcheck CHECK (dbo.tcnt() <  3 )
GO
INSERT INTO t SELECT  1 
INSERT INTO t SELECT  2 
INSERT INTO t SELECT  3 
SELECT * FROM t
GO
DROP TABLE t
DROP FUNCTION tcnt

Эффект практически тот же самый. Невозможность указания запроса в констрейнте может являтся лишь формальным, синтаксическим, ограничением.

...

Рейтинг:

0 / 0

21.11.2008, 14:11:05

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668166

вопросик_

Гость

Bogdanov Andrey но других цифр пока никто не привел. Только теоретизируют. Ссылаясь на "практика показывает" постарайтесь приводить хоть какие-то доказательства
...
Вы как раз приводили пример с "извращениями" - когда используется поиск минимального значения одной даты. expla утверждал, что "извращения с min(dt) ни чуть не быстрее сканирования индекса с ДВУМЯ датами" вы при этом ссылаетесь на пример с индексом по ОДНОЙ дате и говорите, что я передергиваю. Предлагаю извиниться.
Отвечал именно на выделенное.
Далее - про "ссылаетесь на пример с индексом по ОДНОЙ" - индекс по двум датам - ситуация будет еще лучше в общем случае (например, когда нет актуальной записи на заданную дату), т.к. проверка по end_dt будет выполнена на индексном уровне.

...

Рейтинг:

0 / 0

21.11.2008, 14:16:55

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668168

expla

Гость

KOT MATPOCKuHexpla...с min(dt) требуется двойной поиск по индексу, сначала чтобы вычислить min, потом, чтобы найти ROWID искомой записи
А зачем искать "...ROWID искомой записи"? Дата есть в индексе (речь о конкретном запросе)
И зачем двойной поиск? В одном все делается не плохо

Как оракл выполняет запрос

Код: plaintext

1.
2.
3.
4.
5.
6.

select *
from t e
where (id, dt) in
 (select id, min(dt)
  from t i
  where e.id=i.id and :p < i.dt
 )

1. В индексе находит наименьшее значение dt большее :p, это и есть min(td)
... Замечу, что в старых версиях оракл SQL машина выгребала из индекса все подходящие ключи, сортировала их с группировкой, а затем возвращала min(dt).
2. В индексе находит ключ для искомой записи. Это уже второй поиск по индексу.
3. Используя полученный ROWID находит блок таблицы и извлекает из него нужную запись.

...

Рейтинг:

0 / 0

21.11.2008, 14:17:13

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668193

expla

Гость

Bogdanov AndreyВ данном топике я лишь приводил примеры, доказывающие, что вопрос быстродействия для случая с двумя датами не столь очевиден.

Так и я о том же. И без всяких тестов ясно, что производительность будет зависеть от данных. Только, ИМХО, в данном случае производительность дело десятое.

...

Рейтинг:

0 / 0

21.11.2008, 14:24:26

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668203

вопросик_

Гость

explaИ без всяких тестов ясно, что производительность будет зависеть от данных. Только, ИМХО, в данном случае производительность дело десятое.
+1.
Если уже сильно прижмет (или запросы изначально часто выполняться будут) - всегда можно оптимизировать.

...

Рейтинг:

0 / 0

21.11.2008, 14:27:08

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668229

Bely

Участник

Откуда: Москва

Сообщения: 1 650

Рейтинг: 0 / 0

вопросик_Если уже сильно прижмет (или запросы изначально часто выполняться будут) - всегда можно оптимизировать.Ну-ну...
"Пытайтесь все делать как можно лучше! Плохо - оно само получится" (с) Гоблин

...

Рейтинг:

0 / 0

21.11.2008, 14:35:33

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668260

вопросик_

Гость

Прикинем что-нибудь более приближенное к жизни. по товару - как часто меняется цена ?
Пусть блок в бд - 8K. Пусть в среднем ключ займет leaf-блоке 40 байт. Т.е. в одном блоке поместятся примерно >~200 изменений цены. Поэтому в таком случае простой запрос с двумя датами будет работать шустро без всяких оптимизаций.
Для каких-то особых случаев повторяться не буду.

...

Рейтинг:

0 / 0

21.11.2008, 14:42:03

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668297

Bely

Участник

Откуда: Москва

Сообщения: 1 650

Рейтинг: 0 / 0

вопросик_Для каких-то особых случаев повторяться не буду.Да никаких особых случаев...
табличка SYS_FBA_HIST_xxx по одной нашей таблице за месяц ТЕСТИРОВАНИЯ уже насобирала 4 млн. записей. Данные пока загружены не в полном объеме (одна сотая часть).
эта системная таблица выглядит так:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

CREATE TABLE sys_fba_hist_19511
    (rid                            VARCHAR2( 4000 ),
    startscn                       NUMBER,
    endscn                         NUMBER,
    xid                            RAW( 8 ),
    operation                      VARCHAR2( 1 ),
    list_id                        NUMBER( 38 , 0 ),
    object_id                      NUMBER( 9 , 0 ),
    status_id                      NUMBER( 38 , 0 ),
    priority                       NUMBER( 38 , 0 ),
    workflow_step_id               NUMBER( 38 , 0 ),
    recall_date                    DATE)

Для незнакомых с Oracle - SCN можно перетранслировать в TIMESTAMP.
Так что для кого-то работа с такими данными "ничего можно не делать", для кого-то потенциальная головная боль.

...

Рейтинг:

0 / 0

21.11.2008, 14:51:22

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668302

вопросик_

Гость

Belyвопросик_Если уже сильно прижмет (или запросы изначально часто выполняться будут) - всегда можно оптимизировать.Ну-ну...
Извините, вы реально сталкивались с процессом разработки ?

1) Примерно известно цели систем, характер данных, которые она будет обрабатывать, исходя из этого выстраивается логика обработки данных
2) Всегда прикидываются критичные запросы, они "вылизываются".
3) Выполняется тестирование системы.
На этапе пробной эксплуатации(и последующей) выявляются "узкие" места.

Вот про строить суперуниверсальную систему, сразу оптимизированную на зарнее неизвестные, все возможные в жизни случаи, которые неожиданно, не понятно откуда могут возникнут, вот это действительно - "ну-ну..."

...

Рейтинг:

0 / 0

21.11.2008, 14:52:21

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668331

expla

Гость

Belyвопросик_Если уже сильно прижмет (или запросы изначально часто выполняться будут) - всегда можно оптимизировать.Ну-ну...
"Пытайтесь все делать как можно лучше! Плохо - оно само получится" (с) Гоблин

Вариант с двумя датами это расширение варианта с одной датой, так что если где то производительность окажется хуже требуемой, можно будет перейти на псевдо первый вариант.

Тем временем тест - "выбрать текущие состояния всех объектов":

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.

select count(sddc) from (
select /*+ no_merge index(e tp$id) use_nl(e) */ *
from tp e
where (id, d_to) in
 (select /*+ leading(i) index(e tp$id) */ id, min(d_to)
  from tp i
  where sysdate <= i.d_to
  group by id
 )
)

~  0 . 1  sec

select count(sddc) from (
select /*+ no_merge index(e tp$id)  */ *
from tp e
where sysdate between d_from and d_to
)

~  0 . 05  sec

Индекс tp$id это (id, d_to, d_from). Возможно доработка индекса немного ускорит первый запрос (но скорее всего и первый запрос тоже ускорится), но даже в силу того, что первый код существенно сложнее я не буду его использовать.

Замечу, что оракл в данном случае предпочитает не использовать индексы вообще, но тут суть в том, чтобы запрос выполнил много операций поиска по индексу.

...

Рейтинг:

0 / 0

21.11.2008, 14:59:08

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668360

Bely

Участник

Откуда: Москва

Сообщения: 1 650

Рейтинг: 0 / 0

вопросик_Извините, вы реально сталкивались с процессом разработки ?
...
Вот про строить суперуниверсальную систему, сразу оптимизированную на зарнее неизвестные, все возможные в жизни случаи, которые неожиданно, не понятно откуда могут возникнут, вот это действительно - "ну-ну..."Сталкивался и продолжаю сталкиваться .

Кроме этого видел как реально работающие и протестированные системы начинали загибаться после того как менялась учетная политика организации и в системе появлялось в 10 раз больше проводимых документов.

Так что к вашим пунктам надо добавить "планирование будующих потоков данных".

...

Рейтинг:

0 / 0

21.11.2008, 15:05:45

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668373

вопросик_

Гость

Belyвопросик_Для каких-то особых случаев повторяться не буду.Да никаких особых случаев...
табличка SYS_FBA_HIST_xxx по одной нашей таблице за месяц ТЕСТИРОВАНИЯ уже насобирала 4 млн. записей. Данные пока загружены не в полном объеме (одна сотая часть).
эта системная таблица выглядит так:
Ну и ? Не можете оптимизировать обработку и, почитав этот топик решили, что без end_scn будет быстрее ? :)

Андрей специально привел некий особый случай данных, на которых "лобовой" запрос с двумя данными проигрывал. Для тех же данных я привел другой (не сложнее по содержанию запроса Андрея) запрос с двумя датами, который работает оптимальней для поставленной задачи.

...

Рейтинг:

0 / 0

21.11.2008, 15:08:16

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668403

expla

Гость

вопросик_,

+1. С двумя датами открывается широкое поле возможностей оптимизации. И индексы можно покрутить и запросы и планы. Оратная сторона вопроса, легко наткнуться на плохой вариант.

...

Рейтинг:

0 / 0

21.11.2008, 15:14:07

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668410

Bely

Участник

Откуда: Москва

Сообщения: 1 650

Рейтинг: 0 / 0

вопросик_Ну и ? Не можете оптимизировать обработку и, почитав этот топик решили, что без end_scn будет быстрее ? :) Да можем мы все, просто не стоит забывать, что песочницы у всех разного размера. Если данных мало - то индекс вобще лучше не строить.

Почитав этот топик я понял, что когда придет время - надо будет тестировать, а не просто строить индекс по двум SCN.

...

Рейтинг:

0 / 0

21.11.2008, 15:16:03

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35668666

призрак коммунизма

Участник

Откуда: СССР

Сообщения: 207

Рейтинг: 0 / 0

select * from table1 where sysdate between start_date and end_date
принципиально не используете?

...

Рейтинг:

0 / 0

21.11.2008, 16:25:01

| Ответить | Цитировать | Написать

История одна дата vs две. Что лучше?

#35669543

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

expla пишет:

> У каждого саоя практика. Речь лишь о том, что на разных СУБД, на разных
> экземплярах СУБД и на разных экземплярах БД результат может быть разным,
> в пользу любого из решений.

Я очень сильно сомневаюсь, что здесь есть какая-то специфика СУБД.
B+tree индексы есть в любой СУБД, и почти одинаковы. А вот от специфики задачи
может зависить многое. Хорошую вы табличку нарисовали.
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

22.11.2008, 13:37:39

| Ответить | Цитировать | Написать

25 сообщений из 129, страница 5 из 6

все

Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / История одна дата vs две. Что лучше?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=32&msg=35668373&tid=1543554]:	0ms
get settings:	8ms
get forum list:	21ms
check forum access:	3ms
check topic access:	3ms
track hit:	64ms
get topic data:	13ms
get forum data:	3ms
get page messages:	88ms
get tp. blocked users:	2ms
others:	253ms

total:	458ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы