Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Таблицы измерений, как я понимаю, не должны содержать повторяющихся значений. Поэтому когда требуется подкачать в хранилище данные за последний день, возникает вопрос - а как добавить свежие данные в эти таблицы чтобы там не получилось одинаковых записей? Пока придумал вот что (см. часть WHERE): Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. т.е. идёт проверка для каждого нового значения на уже присутствие его в данной таблице измерений. Но таблица измерений со временем может вырасти достаточно сильно (особенно это актуально для измерения "Дата"). Функция "IN" и так не очень рекомендуется как слишком медленная, а тут и вовсе тормоза пойдут. Может эта проблема имеет какое-нибудь более оптимальное решение? Подскажите плиз. P.S. Или успокойте меня тем, что ничего иного сделать нельзя ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 01:35 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Код: plaintext ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 12:21 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Гедеван Александрович Может эта проблема имеет какое-нибудь более оптимальное решение? Угу, называется оно Incremental update измерения. Код: plaintext 1. 2. 3. 4. 5. А DISTINCT Analysis Services и сам вставит, когда будет данные для измерения получать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 12:25 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Я почему-то решил, что речь обязательно об Analysis Services, если не это не так, то простите что влез :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 12:27 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Инкрементальная часть. Код: plaintext 1. 2. 3. 4. Не совсем понятно присутствие таблицы Product. Можно дополнительно довести и это ограничение, но тогда может случиться, что не все данные будут вставлены в измерение. Проверки лучше вести через where exists / not exists, чем через IN. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 12:58 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
А я все-таки не понимаю, зачем в принципе определять инкрементальную часть, а не оставлять это на совести сервера? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 13:13 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Загрузка идет в ЦХД (или витрину), а это БД SQL Server, но не Analysis Server. Измерение можно залить либо инкрементально, либо целиком предварительно очистив его в витрине. При инкрементальном обновлении измерения MSAS действительно сам обнаружит все изменения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 13:35 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
А DISTINCT Analysis Services и сам вставитОй, правда? (AS и используется). Т.е. в таблицу измерений можно загонять дублирующиеся данные, а в измерения они попадут в единственной копии? Проверки лучше вести через where exists / not exists, чем через IN.Спасибо, учту на будущее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 13:40 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Ну так и создать в витрине вьюшку, которая будет грести данные из базы... Хотя это наверное уже дело вкуса. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 13:40 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
Как вариант, можно создать тригерные таблицы изменений ключевых таблиц, при классическом построение хранилища, это даст возможность работы как с поддержкой историчности, так и без нее. На больших объемах и разнесение серверов на узкие каналы, проверка на наличие работать будет медленно В данной задаче изменения задним числом не присутствуют? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 15:53 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
joni А DISTINCT Analysis Services и сам вставит, когда будет данные для измерения получать. Пока вставит, но в Юконе эта халява для ленивых закончилась и о дуплетах надо самому заботится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 16:50 |
|
||
|
Подгрузка новой информации в DWH
|
|||
|---|---|---|---|
|
#18+
AAronИнкрементальная часть. Код: plaintext 1. 2. 3. 4. Не совсем понятно присутствие таблицы Product. Можно дополнительно довести и это ограничение, но тогда может случиться, что не все данные будут вставлены в измерение. Проверки лучше вести через where exists / not exists, чем через IN. top 1 совершенно без надобности. Смотри план запроса. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2005, 16:53 |
|
||
|
|

start [/forum/topic.php?fid=49&fpage=358&tid=1871315]: |
0ms |
get settings: |
6ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
43ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
45ms |
get tp. blocked users: |
1ms |
| others: | 236ms |
| total: | 364ms |

| 0 / 0 |
