Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ? / 5 сообщений из 5, страница 1 из 1
31.01.2019, 23:42
    #39767850
vikkiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
Есть Azure SQL Data Warehouse (обслуживаемый не нами),
сегодня в очередной раз копался в структурах - измерения (Dim_...)
некоторые в режиме Replicate, некоторые в Round_Robin
по количеству строк кореляции режима Distribution не заметил,

Отсюда вопрос: на основании чего может приниматься решение о приоритете
между Distribution = Replicate и Distribution = Round_Robin (Hash не видел, поэтому пока не вопрос)

Просто рано или поздно придётся у них спрашивать - не хотелось-бы попасть в неловкую ситуацию...

По идее я-бы все мелкие сделал Replicate , есть тяжелые измерения по десятку миллионов записей - там в принципе имеет смысл разносить по нодам.
...
Рейтинг: 0 / 0
01.02.2019, 00:08
    #39767853
alexeyvg
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
vikkivПо идее я-бы все мелкие сделал Replicate , есть тяжелые измерения по десятку миллионов записей - там в принципе имеет смысл разносить по нодам.Ну да, небольшой объём, и редкие изменения - делаем везде копии, чтоб выполнялось локально, где бы не были нужны эти данные, если данные большие, то распределяем.

Что нет хэша, странно, видимо, не нашлось, по чему распределять? Ведь хэш вроде лучше.
...
Рейтинг: 0 / 0
01.02.2019, 00:56
    #39767855
vikkiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
alexeyvg...и редкие изменения...если-бы, они из ADLS / Azure Data Lake Storage тянут Master-данные каждый раз по новой не заморачиваясь
alexeyvgЧто нет хэша, странно, видимо, не нашлось, по чему распределять? Ведь хэш вроде лучше.немного другой Hash - это третья опция для Distribution = ...
...
Рейтинг: 0 / 0
01.02.2019, 11:27
    #39768001
alexeyvg
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
vikkivalexeyvgЧто нет хэша, странно, видимо, не нашлось, по чему распределять? Ведь хэш вроде лучше.немного другой Hash - это третья опция для Distribution = ...Да, я понимаю, но хэш же строится по колонке. Соответственно, нужно, что бы было либо достаточно много уникальных значений в этой колонке, либо мало, но с равномерным распределением количества записей.
Обычно это не проблема, но могут же быть исключения...
Вот, например, рекомендации от Kent Sharkey, вроде авторитетный чел.
...
Рейтинг: 0 / 0
02.02.2019, 02:23
    #39768594
vikkiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ?
alexeyvg,

Разобрался, у них это только на деве "бардак" (в кавычках т.к. размеры образцов такие), в QA всё нормально настроено.
недавно где-то на youtube презентацию MS смотрел по их Azure DWH - утверждают что на новом поколении практически минимизировали ненужный Data Movement
...
Рейтинг: 0 / 0
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Azure SQL Data Warehouse - Create Table ... Distribution = Replicate vs Round_Robin ? / 5 сообщений из 5, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]