Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
|
|||
|---|---|---|---|
|
#18+
Есть Azure SQL Data Warehouse (обслуживаемый не нами), сегодня в очередной раз копался в структурах - измерения (Dim_...) некоторые в режиме Replicate, некоторые в Round_Robin по количеству строк кореляции режима Distribution не заметил, Отсюда вопрос: на основании чего может приниматься решение о приоритете между Distribution = Replicate и Distribution = Round_Robin (Hash не видел, поэтому пока не вопрос) Просто рано или поздно придётся у них спрашивать - не хотелось-бы попасть в неловкую ситуацию... По идее я-бы все мелкие сделал Replicate , есть тяжелые измерения по десятку миллионов записей - там в принципе имеет смысл разносить по нодам. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.01.2019, 23:42 |
|
||
|
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
|
|||
|---|---|---|---|
|
#18+
vikkivПо идее я-бы все мелкие сделал Replicate , есть тяжелые измерения по десятку миллионов записей - там в принципе имеет смысл разносить по нодам.Ну да, небольшой объём, и редкие изменения - делаем везде копии, чтоб выполнялось локально, где бы не были нужны эти данные, если данные большие, то распределяем. Что нет хэша, странно, видимо, не нашлось, по чему распределять? Ведь хэш вроде лучше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.02.2019, 00:08 |
|
||
|
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
|
|||
|---|---|---|---|
|
#18+
alexeyvg...и редкие изменения...если-бы, они из ADLS / Azure Data Lake Storage тянут Master-данные каждый раз по новой не заморачиваясь alexeyvgЧто нет хэша, странно, видимо, не нашлось, по чему распределять? Ведь хэш вроде лучше.немного другой Hash - это третья опция для Distribution = ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.02.2019, 00:56 |
|
||
|
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
|
|||
|---|---|---|---|
|
#18+
vikkivalexeyvgЧто нет хэша, странно, видимо, не нашлось, по чему распределять? Ведь хэш вроде лучше.немного другой Hash - это третья опция для Distribution = ...Да, я понимаю, но хэш же строится по колонке. Соответственно, нужно, что бы было либо достаточно много уникальных значений в этой колонке, либо мало, но с равномерным распределением количества записей. Обычно это не проблема, но могут же быть исключения... Вот, например, рекомендации от Kent Sharkey, вроде авторитетный чел. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.02.2019, 11:27 |
|
||
|
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
|
|||
|---|---|---|---|
|
#18+
alexeyvg, Разобрался, у них это только на деве "бардак" (в кавычках т.к. размеры образцов такие), в QA всё нормально настроено. недавно где-то на youtube презентацию MS смотрел по их Azure DWH - утверждают что на новом поколении практически минимизировали ненужный Data Movement ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.02.2019, 02:23 |
|
||
|
|

start [/forum/topic.php?fid=46&fpage=116&tid=1688356]: |
0ms |
get settings: |
10ms |
get forum list: |
20ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
66ms |
get topic data: |
14ms |
get forum data: |
3ms |
get page messages: |
50ms |
get tp. blocked users: |
2ms |
| others: | 279ms |
| total: | 452ms |

| 0 / 0 |
