powered by simpleCommunicator - 2.0.18     © 2024 Programmizd 02
Map
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / BigData : ворчалка
25 сообщений из 30, страница 1 из 2
BigData : ворчалка
    #40130780
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Привет.

Здесь я буду ворчать и нудеть про BigData.

Подписался на курс.

В части подразделов есть
- helm
- terraform

Кто знает зачем эти штуки нужны?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40130807
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
это судя по гуглу девопс тулы

вам, как говорит Рустам Гаджимурадов, в форум "Вопросы и Ответы"

так как по девопсу нет форума
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40130828
Фотография Дедушка
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

BigData, она знаете ли разная...
Что там у вас за курс известно только вам.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40130832
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Прошу пока не перемещайте в Вопрос-Ответ.

Дальше вопросы будут получше.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40130937
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Прошу пока не перемещайте в Вопрос-Ответ.

Дальше вопросы будут получше.


Важно, чтобы ответы были получше
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40130998
witte
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton

В части подразделов есть
- helm
- terraform

Кто знает зачем эти штуки нужны?

Helm используют в сборке образов докера. Например можно создать чарты под разные окружения для того чтобы достучаться к правильной БД.
Terraform - это про PaaC.

Зачем это в курсе про Big Data - я не понимаю. Ну Ок, Terraform ещё можно натянуть на глобус для быстрого разворачивания нужного окружения, но это больше devops-овый инструмент.
Что за курс?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131005
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Да. Элемент девопса там будет.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131663
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Для широты обзора послушал лекции этого господина.

https://www.youtube.com/playlist?list=PLlb7e2G7aSpRb95_Wi7lZ-zA6fOjV3_l7
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131757
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В инфраструктуре Hadoop многие компоненты близки или повторяют друг друга.

Например NameNode и ZooKeeper. Зачем они нужны вместе?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131803
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
а на курсах что говорят?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131808
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
неймнода это реестр для хдфс, она управляет файловой системой

а зуукипер управляет кластером приложений

это написано в википедии

Более подробно можно почитать в Hadoop: The Definitive Guide, довольно толковая книжка.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131813
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
В инфраструктуре Hadoop многие компоненты близки или повторяют друг друга.

Например NameNode и ZooKeeper. Зачем они нужны вместе?

NameNode говорит клиенту где искать блоки от файлов, ZooKeeper следит кто жив, а кто умер. Если кто важный помер - нового лидера выбрать.
они нужны вместе...
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131816
Фотография Дедушка
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
мне кажется, что это какой-то троллинг...
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131853
Ролг Хупин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Да. Элемент девопса там будет.


Кстати, что такое "девопс"? а то многие упоминают, а что это - так и не ясно
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131872
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DataBrix использует Z-Ordering (multi-dimensional clustering)
для оптимизации поиска по большим данным.

Пример.

Код: sql
1.
2.
3.
OPTIMIZE events
WHERE date >= current_timestamp() - INTERVAL 1 day
ZORDER BY (eventType)


Как это работает внутри?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131873
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ролг Хупин
mayton
Да. Элемент девопса там будет.


Кстати, что такое "девопс"? а то многие упоминают, а что это - так и не ясно

Много раз в команде у нас были девопсы. Сначала они назывались системный инженер. Сисадмин.
Инженер инфраструктуры.

Сейчас вроде как термин устоялся. С моей точки зрения это специалист по эксплуатации системы.
А также промежуточное звено между разработчиком и сисадмином. Сисадмин для аутсорсинга
это просто экзотический фрукт. Если говорить о ремоне мышей и ноутбуков - это да он есть.
Но если говорить об задачах кастомера - то сисадмины - это недоступные люди которые где-то
в AWS или Google cloud через 3 линии поддержки могут отвечать на вопросы.

Тоесть девопс - это сидящий рядом почти сисадмин которого можно толкнуть кулаком в бок
и заставить пойти обновить JWT-токены на всех конфигурациях или подготовить новый env
в облаке к примеру.

База того чего должен знать девопс очень меняется постоянно. Есть курсы для девопсов
и ЗП - более соблазнительные чем у тестировщиков. Ну... по крайней мере если я-бы выбирал
то точно выбрал бы девопс чем QA.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40131898
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Насколько я понял. Платные решения которые доступны On-Premise

  • Cloudera
  • Hortonworks
  • MapR
представляет (для меня) россыпь нескольких различных проектов которые надо конфигурить
и поднимать отдельно (hdfs, namenode, workers, zookeeper e.t.c.)

Тоесть нету видения целого проекта.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132119
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
DataBrix использует Z-Ordering (multi-dimensional clustering)
для оптимизации поиска по большим данным.

Пример.

Код: sql
1.
2.
3.
OPTIMIZE events
WHERE date >= current_timestamp() - INTERVAL 1 day
ZORDER BY (eventType)


Как это работает внутри?

такие вещи надо в их engineering blog смотреть
https://databricks.com/blog/2018/07/31/processing-petabytes-of-data-in-seconds-with-databricks-delta.html

mayton
Насколько я понял. Платные решения которые доступны On-Premise

  • Cloudera
  • Hortonworks
  • MapR
представляет (для меня) россыпь нескольких различных проектов которые надо конфигурить
и поднимать отдельно (hdfs, namenode, workers, zookeeper e.t.c.)

Тоесть нету видения целого проекта.

MapR мертв, Hortonworks поглащен Cloudera. Cloudera свежие свои сборки бесплатно больше не дает пощупать.
тут есть линки на старую, еще на базе Hadoop 2.x quickstart vm
https://community.cloudera.com/t5/Support-Questions/Cloudera-Quickstart-VM-Download/td-p/291225

я бы посмотрел на apache bigtop https://bigtop.apache.org/ https://cwiki.apache.org/confluence/display/BIGTOP/Bigtop 3.0.0 Release
вроде как это опенсорс сборка
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132123
Фотография vikkiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
Платные решения которые доступны On-Premise

есть бесплатные cloud, тот-же Databricks который community edition на одной ноде (т.е. только Driver без Workers), но тем не менее PySpark / Scala там параллелят на таски по имеющимся core без проблем.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132131
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А почему mapR мертв? Версия comunity вроде доступна для скачивания.
https://mapr.com/download/

Нет развития?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132133
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
А почему mapR мертв? Версия comunity вроде доступна для скачивания.
https://mapr.com/download/

Нет развития?

компания давно умерла
это в википедии написано

что вам там на курсах рассказывают?
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132135
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
там даже на этом сайте половина кнопок редиректят в неизвестность
туда попасть еще надо умудрится
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132136
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Бумбараш
mayton
А почему mapR мертв? Версия comunity вроде доступна для скачивания.
https://mapr.com/download/

Нет развития?

компания давно умерла
это в википедии написано

что вам там на курсах рассказывают?

Видимо курс - тухляк. Даже про bigtop нет упоминания. Впрочем мне курс не сильно важен. Просто
для себя хочу инфу подкорректировать.
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132138
Фотография Дедушка
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
H5N1
MapR мертв
MapR куплен HP )
mayton
Версия comunity вроде доступна для скачивания.
Нет развития?
MapR смотреть не нужно, они пошли своим путём сильного переписывания ванильной версии. В отличии от хортона и клаудеры, которые дорабатывали ваниль.
Комьюнити сборку можно качнуть с сайта Аренадаты (сборка изначально делается на базе Хортона). Правда, там только под центос и шапку...
mayton
Apache Hadoop
представляет (для меня) россыпь нескольких различных проектов которые надо конфигурить
и поднимать отдельно
Любая сборка, от любого вендора будет требовать конфигурирования. Максимум, что вы получите это клиентский UI. Да, вы будете редактировать конфиг файлы в UI, а не в консоли, но только и всего (да и не всё можно настроить через UI).
...
Рейтинг: 0 / 0
BigData : ворчалка
    #40132140
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Дедушка,

HP там не саму контору купило, а остатки от тела с остановившимся сердцем. То есть там труп уже был.
...
Рейтинг: 0 / 0
25 сообщений из 30, страница 1 из 2
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / BigData : ворчалка
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (1): Анонимы (1)
Читали форум (1): Анонимы (1)
Пользователи онлайн (7): Анонимы (5), Yandex Bot 1 мин., Bing Bot 3 мин.
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]