powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / ping/hive
4 сообщений из 4, страница 1 из 1
ping/hive
    #39248911
мигель1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добрый день!

Такая задача

Есть продажи продуктов в январе 2015 .
В некоторые дни продаж по определенным продуктам не было.

Задача, узнать сколько дней бесперебойно продавались товары в январе 2015.

В sql эту задачу можно решить через курсоры. а как ее решить в хадупе?
...
Рейтинг: 0 / 0
ping/hive
    #39249216
Фотография ASCRUS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
мигель1Добрый день!

Такая задача

Есть продажи продуктов в январе 2015 .
В некоторые дни продаж по определенным продуктам не было.

Задача, узнать сколько дней бесперебойно продавались товары в январе 2015.

В sql эту задачу можно решить через курсоры. а как ее решить в хадупе?
А зачем в SQL курсорами? Почему запросами ее не решить? Почитайте про OLAP functions в SQL, потом по аналогии по сортированному набору Вы сможете написать в том же PIG обработку данных.
...
Рейтинг: 0 / 0
ping/hive
    #39249376
мигель1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ASCRUSмигель1Добрый день!

Такая задача

Есть продажи продуктов в январе 2015 .
В некоторые дни продаж по определенным продуктам не было.

Задача, узнать сколько дней бесперебойно продавались товары в январе 2015.

В sql эту задачу можно решить через курсоры. а как ее решить в хадупе?
А зачем в SQL курсорами? Почему запросами ее не решить? Почитайте про OLAP functions в SQL, потом по аналогии по сортированному набору Вы сможете написать в том же PIG обработку данных.

у меня sql 2000 там нет оконных функций
...
Рейтинг: 0 / 0
ping/hive
    #39249728
Alexey Tomin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
мигель1В sql эту задачу можно решить через курсоры. а как ее решить в хадупе?

Как и везде- подумать. Для начала- что есть "бесперебойно"?
Какие данные есть?

Ping, кстати, это сетевая утилитка. А в hadoop есть pig- свинья. Большая, толстая и неопрятная

Может хватит того огрызка sql, что есть в hive.
Нет- лучше m/r писать- его проще локально отлаживать- можно прямо в среде разработки ставить точки отладки и т.п. В pig для этого надо сильно извращаться. Да и работает pig медленнее (он то же создаёт m/r задачи, но делает это хуже, чем разработчик).
...
Рейтинг: 0 / 0
4 сообщений из 4, страница 1 из 1
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / ping/hive
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]