Как двигаться в сторону BigData / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Как двигаться в сторону BigData

25 сообщений из 149, страница 5 из 6

все

Как двигаться в сторону BigData

#39057052

кириллk

Участник

Сообщения: 988

Рейтинг: 0 / 0

Ivan DurakApexТ.е. ты залил на виртуалку с хортоном 15 гигов и он подавился?
как в анекдоте: "выпил 3 бутылки водки, закусил печенькой - что-то мне плохо. Наверное отравился печенькой"

А что не так? я хотел его протестировать на большом объеме.

...

Рейтинг:

0 / 0

21.09.2015, 10:32

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39057878

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

кириллkIvan Durakпропущено...

как в анекдоте: "выпил 3 бутылки водки, закусил печенькой - что-то мне плохо. Наверное отравился печенькой"

А что не так? я хотел его протестировать на большом объеме.
Действительно, что может быть не так с нагрузочным тестированием на виртуальной машине...

...

Рейтинг:

0 / 0

22.09.2015, 00:19

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058037

GASTROPODA

Гость

Пару слов про Big Data.
Пож этими словами подразумавают:
1. Маркетинговое понятие. Когда очень МНОГО данных (счет идет на петабайты или сотни терабайтов), как правило НЕСТРУКТУРИРОВАННЫХ, и с ними нужно что-то делать.
2. Железка от Оракл которая называется BigData.

Решить проблему Big Data как правило пытаются через много дешевого железа + Hadoop (файловая система) + разнообразные примочки для упрощения обработки данных.

Тема в тренде, много всего меняется и развивается.

...

Рейтинг:

0 / 0

22.09.2015, 09:48

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058193

skyANA

Участник

Откуда: Зеленоград

Сообщения: 22 795

Рейтинг: 0 / 0

GASTROPODA, раскройте шире, что такое "проблема Big Data" :)

...

Рейтинг:

0 / 0

22.09.2015, 12:18

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058243

GASTROPODA

Гость

skyANA,

Понимаю, что у многих на сейчас такой проблемы нет. Но это не значит, что она не появится в будущем. Пока у нас многие данные проще спустить в утиль, т.к. они не приновят профита. Но на западе из этих данных научились выжимать деньги, соответственно, появилась ниша для Big Data.

Если по сути, то некоторым уже нужно что-то делать с этим:
"за 1 минуту интернета появляется 11 тыс. записей на Linkedin и 278 тыс. записей на Twitter".

Первый подход - спускать все на /dev/null.
Второй подход - пытаться как-то анализировать весь этот хаос.

...

Рейтинг:

0 / 0

22.09.2015, 12:53

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058257

a_voronin

Участник

Откуда: Москва

Сообщения: 4 636

Рейтинг: 0 / 0

GASTROPODAskyANA,

Понимаю, что у многих на сейчас такой проблемы нет. Но это не значит, что она не появится в будущем. Пока у нас многие данные проще спустить в утиль, т.к. они не приновят профита. Но на западе из этих данных научились выжимать деньги, соответственно, появилась ниша для Big Data.

Если по сути, то некоторым уже нужно что-то делать с этим:
"за 1 минуту интернета появляется 11 тыс. записей на Linkedin и 278 тыс. записей на Twitter".

Первый подход - спускать все на /dev/null.
Второй подход - пытаться как-то анализировать весь этот хаос.

Вот у нас такая проблема началась. Стали использовать вертику.

...

Рейтинг:

0 / 0

22.09.2015, 13:04

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058306

GASTROPODA

Гость

a_voronin,

Если информация не секретна, опишите в двух словах о преимуществах данного решения.

Вертика лицензируется потерабайтно. Сколько терабайт данных в вашем проекте уже есть и сколько прогнозируется?
Какие преимущества RDBMS вы использовали для обработки неструктурированых данных?

...

Рейтинг:

0 / 0

22.09.2015, 13:29

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058422

skyANA

Участник

Откуда: Зеленоград

Сообщения: 22 795

Рейтинг: 0 / 0

GASTROPODA, дак Вы суть проблемы описать можете, или нет? Всё вокруг да около ходите :)

...

Рейтинг:

0 / 0

22.09.2015, 14:55

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058459

GASTROPODA

Гость

skyANA,

Описал тремя постами выше.
Чем обработать большие объемы неструктурированных данных дешево?

...

Рейтинг:

0 / 0

22.09.2015, 15:16

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058536

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

GASTROPODAКакие преимущества RDBMS вы использовали для обработки неструктурированых данных?
дайте угадаю - структурируют и обрабатывают!!!!

...

Рейтинг:

0 / 0

22.09.2015, 15:49

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058549

GASTROPODA

Гость

Ivan Durak,

Т.е. возят картошку на мерседесе?

...

Рейтинг:

0 / 0

22.09.2015, 15:52

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058634

skyANA

Участник

Откуда: Зеленоград

Сообщения: 22 795

Рейтинг: 0 / 0

GASTROPODAskyANA,

Описал тремя постами выше.
Чем обработать большие объемы неструктурированных данных дешево?А зачем их вообще обрабатывать? Откуда они вдруг берутся большие? :)

...

Рейтинг:

0 / 0

22.09.2015, 16:57

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058717

кириллk

Участник

Сообщения: 988

Рейтинг: 0 / 0

a_voroninGASTROPODAskyANA,

Понимаю, что у многих на сейчас такой проблемы нет. Но это не значит, что она не появится в будущем. Пока у нас многие данные проще спустить в утиль, т.к. они не приновят профита. Но на западе из этих данных научились выжимать деньги, соответственно, появилась ниша для Big Data.

Если по сути, то некоторым уже нужно что-то делать с этим:
"за 1 минуту интернета появляется 11 тыс. записей на Linkedin и 278 тыс. записей на Twitter".

Первый подход - спускать все на /dev/null.
Второй подход - пытаться как-то анализировать весь этот хаос.

Вот у нас такая проблема началась. Стали использовать вертику.

А я еще под вертику положу хадуп )

Это вообще моя мечта
хадуп+вертика+ssas+эксель

...

Рейтинг:

0 / 0

22.09.2015, 18:01

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39058753

a_voronin

Участник

Откуда: Москва

Сообщения: 4 636

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

22.09.2015, 18:38

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39059059

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

кириллka_voroninпропущено...

Вот у нас такая проблема началась. Стали использовать вертику.

А я еще под вертику положу хадуп )

Это вообще моя мечта
хадуп+вертика+ssas+эксель
ну замени вертику на гринплам - и твоя шутка перестанет быть шуткой.
http://pivotal.io/big-data/pivotal-hawq
авторWorld’s Most Advanced Enterprise SQL on Hadoop Analytic Engine
Leverage advanced analytics for your data in Apache Hadoop using a massively-parallel processing SQL engine

...

Рейтинг:

0 / 0

23.09.2015, 09:08

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39059139

GVF112GVF

Гость

Ivan Durak,

FYI ...

Pivotal HD – HAWQ is based on Greenplum Database.

- HAWQ SQL access to Hadoop data (including HBase) is done via the Greenplum Database External Table feature
Part of what is now called PXF – Pivotal Extension Framework.

- HAWQ uses its own internal proprietary metadata
Does not use Apache Hadoop Hive Metadata Catalog (HCatalog)

PS: BigInsights with BigSQL - http://www.ibm.com/developerworks/library/bd-bigsql/

Kind regards,
Vadim.

...

Рейтинг:

0 / 0

23.09.2015, 10:17

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39061376

кириллk

Участник

Сообщения: 988

Рейтинг: 0 / 0

a_voroninкириллkпропущено...

А я еще под вертику положу хадуп )

Это вообще моя мечта
хадуп+вертика+ssas+эксель

Я пытаюсь сейчас сделать "вертика+ssas+эксель"

А как решили проблему разных операционных систем?

ssas винда
вертика линух

...

Рейтинг:

0 / 0

25.09.2015, 15:00

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39061397

a_voronin

Участник

Откуда: Москва

Сообщения: 4 636

Рейтинг: 0 / 0

кириллka_voroninпропущено...

Я пытаюсь сейчас сделать "вертика+ssas+эксель"

А как решили проблему разных операционных систем?

ssas винда
вертика линух

а что такое "проблема разных операционных систем"? И зачем её решать?

Поставили на винду последний драйвер вертики и законнектились.

Provider=VerticaOLEDB.1;Data Source=...;Persist Security Info=True;Password=**********;User ID=olap_user;Locale Identifier=1033;Initial Catalog=olap;Port=5433

...

Рейтинг:

0 / 0

25.09.2015, 15:21

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39119512

кириллk

Участник

Сообщения: 988

Рейтинг: 0 / 0

Cloudera предложила установить следующие компоненты:

Impala - which you will use for interactive query
Apache Hive - which you will use for structure storage (i.e. tables in the Hive metastore)
Hue - which you will use for end user query access
HDFS - which you will use for distributed data storage
YARN - processing framework used by Hive (includes MR2)

HDFS - понятно, чтобы все хранить

а чем отличаются:

Impala - which you will use for interactive query
Apache Hive - which you will use for structure storage (i.e. tables in the Hive metastore)
Hue - which you will use for end user query access

Как я понимаю запросы к hdfs надо писать на Apache Hive

...

Рейтинг:

0 / 0

03.12.2015, 14:52

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39119557

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Чем отличаются если коротко:

Impala - собственная коммерческая разработка Cloudera, in-memory SQL-engine on Hadoop, вроде самая быстрая, погуглите на тему SQL-engine on Hadoop, найдете сравнения. Аналоги от других вендоров: Spark-SQL, Drill, Apache что-то там (пока в инкубаторе). Использовать в качестве драйвера для BI систем с минимальной задержкой.

Apache Hive - это НЕ in-memory (на основе batch заданий MapReduce over HDFS, т.е. файловые операции ввода-вывода) SQL (HiveQL) engine on Hadoop. Для BI не подходит, т.к. высока задержка, но может лопатить петабайты, в основном для примитивного ETL или наполнения DHW из неструктурированных данных из Hadoop. Существуют оптимизации по скорости: Hive on Tez, Hive on Spark, но все равно до in-memory по скорости далеко, хотя кому-то хватит.

Hue - примитивный WEB-интерфейс для написания запросов к Impala и Hive.

...

Рейтинг:

0 / 0

03.12.2015, 15:21

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39120016

loki1984

Участник

Сообщения: 218

Рейтинг: 0 / 0

ВжикЧем отличаются если коротко:

Impala - собственная коммерческая разработка Cloudera, in-memory SQL-engine on Hadoop, вроде самая быстрая, погуглите на тему SQL-engine on Hadoop, найдете сравнения. Аналоги от других вендоров: Spark-SQL, Drill, Apache что-то там (пока в инкубаторе). Использовать в качестве драйвера для BI систем с минимальной задержкой.

Impala не in-memory (но map-reduce не использует за счет чего и правда быстрее). Да и не самый быстрый и технологичый (нет поддержки sql-99).

...

Рейтинг:

0 / 0

03.12.2015, 23:49

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39120221

haXbat

Участник

Сообщения: 398

Рейтинг: 0 / 0

loki1984Impala не in-memory (но map-reduce не использует за счет чего и правда быстрее). Да и не самый быстрый и технологичый (нет поддержки sql-99).
А что тогда быстрее и технологичнее импалы?

...

Рейтинг:

0 / 0

04.12.2015, 11:00

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39120982

loki1984

Участник

Сообщения: 218

Рейтинг: 0 / 0

haXbat,

IBM big sql
Pivotal hawq

Написаны на c++. Айбиэмовский движок умеет подтягивать данные из сторонних субд и join'ить их с данными в hadoop. В big sql поддержка sql 2011, hawq sql 2008, если не ошибаюсь.

Ни импала ни эти движки не являются in-memory, не путайте.

...

Рейтинг:

0 / 0

04.12.2015, 19:03

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39121968

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

loki1984haXbat,

IBM big sql
Pivotal hawq

Написаны на c++. Айбиэмовский движок умеет подтягивать данные из сторонних субд и join'ить их с данными в hadoop. В big sql поддержка sql 2011, hawq sql 2008, если не ошибаюсь.

Ни импала ни эти движки не являются in-memory, не путайте.
а спарк?

...

Рейтинг:

0 / 0

07.12.2015, 10:15

| Ответить | Цитировать | Написать

Как двигаться в сторону BigData

#39122803

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

haXbatloki1984Impala не in-memory (но map-reduce не использует за счет чего и правда быстрее). Да и не самый быстрый и технологичый (нет поддержки sql-99).
А что тогда быстрее и технологичнее импалы?
Teradata.

...

Рейтинг:

0 / 0

08.12.2015, 04:58

| Ответить | Цитировать | Написать

25 сообщений из 149, страница 5 из 6

все

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Как двигаться в сторону BigData

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&msg=39059139&tid=1856779]:	0ms
get settings:	6ms
get forum list:	9ms
check forum access:	2ms
check topic access:	2ms
track hit:	52ms
get topic data:	6ms
get forum data:	2ms
get page messages:	63ms
get tp. blocked users:	1ms
others:	209ms

total:	352ms