Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше? / C++

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / C++ [игнор отключен] [закрыт для гостей] / Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

59 сообщений из 59, показаны все 3 страниц

все

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911388

ZirnayaKuro4ka

Гость

Есть большой объем данных, которые хочется "покрутить" на предмет наличия тех или иных закономерностей. Поэтому разумеется нужны стандартные механизмы BigData, ради которых использую Python.

Но все осложняется тем, что есть и сложные зависимости, под которые нет нужных Python библиотек (например, статистика неточных совпадений в последовательности данных), поэтому кое- что придется реализовывать самостоятельно.

Но и тут не все так просто: данных очень много, поэтому если реализовывать недостающие алгоритмы на Python придется очень долго ждать выполения. Так в проекте появляется великий и могучий С++: хочется из Python вызывать код, написанный на С++, который умеет работать с массивами NumPy, которые в свою очередь отлично пережевываются встроенными механизмами BigData. Можно сказать, что я хочу, чтобы массивы NumPy были способом передачи данных между Python и C++ (как в одну сторону, так и обратно).

Например, в Python создается массив NumPy, который заполняется в С++ и передается обратно в Python. Там выполняется начальная обработка данных с помощью станадартных алгоритмов для BigData, после которой этот массив опять передается в С++ для более тонкого анализа данных. Сам способ передачи данных в обе стороны у меня реализован (с помощью Cython), непонятно только как в С++ работать с массивами NumPy.

1. Не видите ли вы каких- то ошибок в моей идее?
2. Если все ок, то как научить С++ работать с массивами NumPy?

...

Рейтинг:

0 / 0

07.01.2020, 17:01

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911396

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

ZirnayaKuro4ka1. Не видите ли вы каких- то ошибок в моей идее?

Вариант 1: Ты знаешь С++. В этом случае проще выкинуть питон и найти недостающие
библиотеки матана на С++, их достаточно.
Вариант 2: Ты не знаешь С++. В этом случае даже медленная реализация на питоне будет
работать меньше времени, чем ты потратишь на его изучение.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

07.01.2020, 17:17

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911425

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

Может бигдату в SQL сервер какой залить? Дальше средствами SQL, а не самодельными велосипедами

...

Рейтинг:

0 / 0

07.01.2020, 19:44

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911450

OoCc

Участник

Откуда: с Кавказа

Сообщения: 2 210

Рейтинг: 0 / 0

ZirnayaKuro4ka

Как биг есть биг? Я бы использовал Amazon Redshift. И Питон там есть и Сиквэл и распараллеливание зависящее только от глубины кармана.

...

Рейтинг:

0 / 0

07.01.2020, 22:06

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911454

bk0010

Участник

Сообщения: 4 619

Рейтинг: 0 / 0

Dimitry Sibiryakov

ZirnayaKuro4ka1. Не видите ли вы каких- то ошибок в моей идее?

Вариант 1: Ты знаешь С++. В этом случае проще выкинуть питон и найти недостающие
библиотеки матана на С++, их достаточно.
Если у вас вариант 1, то начать рекомендую с Intel Math Kernel Library - работает весьма быстро, если там есть то, что вам надо, то очень повезло.

...

Рейтинг:

0 / 0

07.01.2020, 23:07

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911463

White Owl

Участник

Сообщения: 12 726

Рейтинг: 0 / 0

bk0010

Если у вас вариант 1, то начать рекомендую с Intel Math Kernel Library - работает весьма быстро, если там есть то, что вам надо, то очень повезло.

Не, у него как раз не тот вариант. А NumPy который уже используется TC это питоний враппер над Intel MKL.

...

Рейтинг:

0 / 0

08.01.2020, 06:14

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911485

ZirnayaKuro4ka

Гость

Dimitry Sibiryakov

Вариант 1: Ты знаешь С++. В этом случае проще выкинуть питон и найти недостающие
библиотеки матана на С++, их достаточно.
Вариант 2: Ты не знаешь С++. В этом случае даже медленная реализация на питоне будет
работать меньше времени, чем ты потратишь на его изучение.

C++ и Python знаю на достаточном для выполения работ уровне. Поэтому вопрос только в использовании массивов NumPy в С++ для реализации своих библиотечных алгоритмов.

...

Рейтинг:

0 / 0

08.01.2020, 10:35

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911486

ZirnayaKuro4ka

Гость

bk0010

Dimitry Sibiryakov

пропущено...

Вариант 1: Ты знаешь С++. В этом случае проще выкинуть питон и найти недостающие
библиотеки матана на С++, их достаточно.

Вы не представляете во сколько раз в Python больше математики. Целые книги по отдельным пакетам написаны.

...

Рейтинг:

0 / 0

08.01.2020, 10:36

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911526

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

ZirnayaKuro4ka, то что вы хотите - это не про BigData.

BitData это определённый стандарт на разработку ПО при котором ваши данные лежат на распределённых
дисках или памяти на разных хостах и процессятся через шаблоны отображения-свёртки.

То что вы говорите - это просто библиотеки математики и статистики. NumPy в этом смысле ничем не лучше
чем std.

...

Рейтинг:

0 / 0

08.01.2020, 13:00

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911536

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

ZirnayaKuro4kaC++ и Python знаю на достаточном для выполения работ уровне.

Каких работ? Лабораторных?

Просто найти в документации способы вызова Си из Питона и посмотреть соответствие типов
мешает что?
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

08.01.2020, 13:13

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911559

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Согласно вики, NumPy появилась в 1995 году. Первые упомниания о BigData/MapReduce примерно 2010 год.

Тоесть Нам-Пи примерно на 15 лет старше.

...

Рейтинг:

0 / 0

08.01.2020, 14:02

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911561

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

BigData как и HighLoad это просто маркетинговые нашлёпки, которыми прикрывают свою задницу
разработчики, система которых переросла их способности.

Поэтому-то data становится "big", когда перестаёт помещаться в ОЗУ, а load - "high" когда
всё начинает тормозить.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

08.01.2020, 14:10

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911577

ZirnayaKuro4ka

Гость

Dimitry Sibiryakov

Вы не правы: BigData- это СПОСОБ обработки информации (возможно даже небольшой по количеству), при котором аналитик не выдвигает каких- либо теорий относительно логической связи в данных, а использует алгоритмы, которые сами их находят. Именно так работают нейронные сети (сами находят взаимосвязи) и случайные леса. Тоже самое можно сказать и про кластеризацию (аналитик заранее не знает результат, а предлагает системе самостоятельно найти совокупности со сходными свойствами.

Да, сюда же подмешали много статистики, но тут ничего не поделаешь: всем нужен результат, а не абстрактная идея "какая BigData правильная".

...

Рейтинг:

0 / 0

08.01.2020, 14:35

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911578

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

ZirnayaKuro4ka

Dimitry Sibiryakov

Опять промах. Нейронные сети тоже возникли задолго до BigData.

...

Рейтинг:

0 / 0

08.01.2020, 14:37

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911603

ZirnayaKuro4ka

Гость

mayton

Опять промах. Нейронные сети тоже возникли задолго до BigData.

Какая разница что когда возникло? Сегодня под BigData подразумевают настолько большие данные, что их в ручном режиме нельзя проанализировать, поэтому придуманы механизмы, которые сами устанавливают взаимосвязи в данных.

Кстати, даже статистика используется только для выясления новых "фич", которые потом наравне с остальными переменными используются алгоритмами BigData для выявления закономерностей.

...

Рейтинг:

0 / 0

08.01.2020, 15:18

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911606

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

ZirnayaKuro4ka

mayton

Опять промах. Нейронные сети тоже возникли задолго до BigData.

Я не об этом. Ты, втащив в топик тему BigData сам себя ограничил. Я знаю много топиков в которых
на фоне buzzword была похоронена основная идея. А автор затащил buzzword просто так. Непонятно к чему.

Вот если тебе хочется покрутить объем данных - покрути их на меньшем объеме. Разработай модель.
Убедись что она хороша. И после этого начинай тихонько выводить ее в т.к. Big* пространство.

Пока ты это не сделал - в топике будет переливаение из пустого в порожнее.
Кроме того разберись с интеграцией Python и С++.

...

Рейтинг:

0 / 0

08.01.2020, 15:22

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911621

ZirnayaKuro4ka

Гость

mayton

По- моему в топике я все предельно понятно описал, а потому никак себя не ограничил. А вот ты наоборот из- за увиденного слова начинаешь вести себя неадекватно и тыкать в это слово палкой. Кто тут сам себя ограничил?

...

Рейтинг:

0 / 0

08.01.2020, 15:44

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911623

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

ZirnayaKuro4ka

Dimitry Sibiryakov

давай конкретный пример.
Для нейронных сетей конкретный пример - это выявление рака (конкр.объекта) по миллиону предъявляемых рентген снимков (больной\здоровый).
Система сама обучается.
Теперь твой пример...

...

Рейтинг:

0 / 0

08.01.2020, 15:45

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911625

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

ZirnayaKuro4ka

BigData- это СПОСОБ обработки информации (возможно даже небольшой по количеству), при котором аналитик не выдвигает каких- либо теорий относительно логической связи в данных, а использует алгоритмы, которые сами их находят.

какого рода связи находятся сами если на входе набор данных БЕЗ СВЯЗЕЙ?

...

Рейтинг:

0 / 0

08.01.2020, 15:48

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911629

ZirnayaKuro4ka

Гость

PetroNotC Sharp

какого рода связи находятся сами если на входе набор данных БЕЗ СВЯЗЕЙ?

Точно, на входе набор без связей, а на выходе со связями (например, предсказывается значение одной из колонок по совокупности других). Если рассматривать пример с раковыми больными, то на выходе у нас будет зависимость колонки со значением болен / здоров от остальных данных в наборе (причем эта связь может быть неформализуема).

...

Рейтинг:

0 / 0

08.01.2020, 15:54

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911634

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

ZirnayaKuro4ka

например, предсказывается значение одной из колонок по совокупности других)

каких колонок? В сабже разве есть "колонки" как понятие? Покажи))

...

Рейтинг:

0 / 0

08.01.2020, 15:59

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911635

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

ZirnayaKuro4ka

пример с раковыми больными, то на выходе у нас будет зависимость колонки

придумай свой пример. Этот я приводил.

...

Рейтинг:

0 / 0

08.01.2020, 16:00

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911645

Ржавый гвоздь

Гость

ZirnayaKuro4ka

Собственно, ещё одно доказательство, что слово BigData все используют как хотят и называют им что хотят. Я видел много разных определений бигдаты и все они в чем то да отличаются, то включая в него, то исключая различные инженерные и не очень области.

...

Рейтинг:

0 / 0

08.01.2020, 16:11

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911653

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

Ржавый гвоздь,
именно.
mayton, выше сказал - баззворд.

...

Рейтинг:

0 / 0

08.01.2020, 16:24

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911662

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

ZirnayaKuro4kaна выходе у нас будет зависимость колонки со значением болен / здоров от остальных данных
в наборе (причем эта связь может быть неформализуема).

Не хочу тебя огорчать, но корреляционный анализ не имеет отношения к BigData тоже.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

08.01.2020, 16:36

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911666

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Мое определение BigData (копипаста из старого).

- данные неструктурированы (грубо говоря нету desc table который даст метаинформацию о том что внутри)
- данные стали историческими (или изменяются настолько редко что этим можно прененбречь)
- есть возможность применить для анализа шаблон "отображение-свёртка" и есть горизонтальное мастабирование
- использование классических реляционных DBMS для анализа этих данных невыгодно по разным причинам

...

Рейтинг:

0 / 0

08.01.2020, 16:43

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911670

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

maytonМое определение BigData (копипаста из старого).

Звучит как NoSQL с приляпанной map-reduce.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

08.01.2020, 16:47

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911671

Ржавый гвоздь

Гость

Ладно, попробуем по делу поговорить.

ZirnayaKuro4ka

Например, в Python создается массив NumPy, который заполняется в С++ и передается обратно в Python. Там выполняется начальная обработка данных с помощью станадартных алгоритмов для BigData, после которой этот массив опять передается в С++ для более тонкого анализа данных.

Что такое в твоем понимании "стандартные алгоритмы для BigData" и что такое "тонкий анализ данных"? Приведи примеры хотя бы. Пока не будет конкретики, тема из сплошных перепирательств не выберется, потому что совершенно не понятно, что именно ты хочешь сделать и зачем.

ZirnayaKuro4ka

Но и тут не все так просто: данных очень много, поэтому если реализовывать недостающие алгоритмы на Python придется очень долго ждать выполения

Ты в этом уверен? Ну то есть ты уже проверил свои алгоритмы на питоне и убедился, что они действительно выполняются долго, а на C++ - быстро? Вполне может оказаться, что переписывать на C++ ничего не придется, ибо прирост в скорости не оправдает усилий, затраченных на переписывание.

ZirnayaKuro4ka

Не видите ли вы каких- то ошибок в моей идее?

Ошибки сможем увидеть, когда поймем задачу, которую ты решаешь.

...

Рейтинг:

0 / 0

08.01.2020, 16:47

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911675

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dimitry Sibiryakov

maytonМое определение BigData (копипаста из старого).

Звучит как NoSQL с приляпанной map-reduce.

Да. Согласен. Но у NoSQL еще более расплывчатое определение. Под нее подходит даже файловая система.
Поэтому это просто попадание пальцем в небо.

...

Рейтинг:

0 / 0

08.01.2020, 16:54

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911678

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

maytonНо у NoSQL еще более расплывчатое определение. Под нее подходит даже файловая система.
Поэтому это просто попадание пальцем в небо.

Ну, если пользоваться классическим "хрень для хранения и обработки слабо структурированных
данных", то таки да, файловая система тоже сойдёт. Правда, у неё "обработки" нет.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

08.01.2020, 16:59

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911680

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

А какая обработка у NoSQL?

...

Рейтинг:

0 / 0

08.01.2020, 17:01

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911686

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

mayton

NoSQL

Не sql в данном контексте просто отрицание структуированных данных по реляционной теории.

...

Рейтинг:

0 / 0

08.01.2020, 17:13

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911687

Ржавый гвоздь

Гость

mayton

А какая обработка у NoSQL?

Ну обычно, если кто-то начинает пиарить свою суперинновационную NoSQL систему, то он напирает не только на способ хранения данных, но и на возможности работать с этими данными - предоставляет свой язык запросов, который позволяет определенный вид действий делать быстрее и лучше. Например, вытаскивать связанные данные из графов. Но и без способа хранения тоже не обходится, конечно - какая-нибудь крутая кластеризация, например.
Но в целом ноэскуэль, как и бигдата - больше маркетинговый баззворд на хайпе, а не технический термин.

...

Рейтинг:

0 / 0

08.01.2020, 17:13

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911698

L.Otujktd

Гость

ZirnayaKuro4ka,

А зачем Вам вообще тут c++ в связке с python?
В принципе по уровню производительности c# уже сравнялся с плюсами, поэтому явного выигрыша тут особо не видно, на первый взгляд. И на c# гораздо удобнее и быстрее разрабатывать многие вещи.

...

Рейтинг:

0 / 0

08.01.2020, 17:54

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911702

OoCc

Участник

Откуда: с Кавказа

Сообщения: 2 210

Рейтинг: 0 / 0

mayton,

Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it

...

Рейтинг:

0 / 0

08.01.2020, 17:59

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911705

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Ржавый гвоздь

mayton

А какая обработка у NoSQL?

Из моего круга общения. Из того комьюнити в котором я существую. Когда говорят NoSQL имеют в виду:

- Elastic Search/Kibana (для текстовых поисков)
- Redis (для кешей веба)
- Apache Ignite (для более умных и сложных кешей и процессинга)
- EhCache
- InfiniSpan

Когда говорят о BigData, имеют в виду технологии HBase, Hive, Athena, S3, Spark, Apache ORC

Вот как-то так.

...

Рейтинг:

0 / 0

08.01.2020, 18:18

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911717

Ржавый гвоздь

Гость

mayton

Можно сюда еще добавить всякие хранилища графов (neo4j), документные хранилища (mongodb) и их смеси (arangodb), столбцовые хранилища (clickhouse). Ещё - хранилища ключ-значения (cassandra), которые отлично масштабируются и реплицируются, но поэтому имеют весьма ограниченный язык запросов.

mayton

Когда говорят о BigData, имеют в виду технологии HBase, Hive, Athena, S3, Spark, Apache ORC

Ну а тут куда же без стека hadoop. Более того, некоторые говоря BigData, имеют в виду hadoop. HBase и hive - это как раз часть hadoop. Ксатати, практически всё перечисленное из NoSQL (cassandra, clickhouse, ...) также нередко относят и к BigData.

...

Рейтинг:

0 / 0

08.01.2020, 18:51

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911722

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Видите. Нет ни у кого определения. Только перечисления.

Пока остается актуальным моё. Никто не предложил лучше.

...

Рейтинг:

0 / 0

08.01.2020, 19:10

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911723

Ржавый гвоздь

Гость

mayton, а я и не говорил, что у меня есть определения. Более того, я сразу сказал, что и BigData и NoSQL по моему мнению - маркетинговая шелуха. Никакого четкого технического определения у них нет.

...

Рейтинг:

0 / 0

08.01.2020, 19:15

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911739

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Да. Это размытые понятия. Как и гуманизм, демократия и толерантность.

...

Рейтинг:

0 / 0

08.01.2020, 20:16

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911891

ZirnayaKuro4ka

Гость

L.Otujktd

Модератор: Отредактировано
К тому же С++ обновляется, а С# сдувается: Рейтинг языков программирования от TIOBE

...

Рейтинг:

0 / 0

09.01.2020, 10:45

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39911912

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

ZirnayaKuro4ka,
По делу что есть? А то вы на площадную брань перешли.

...

Рейтинг:

0 / 0

09.01.2020, 11:25

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39913532

ну я

Участник

Откуда: Москва

Сообщения: 1 270

Рейтинг: 0 / 0

Dima T

Дальше средствами SQL, а не самодельными велосипедами

Прикольно. СУБД MSSQL для Microsoft, СУБД Oracle для компании Oracle это и есть, вообще-то их собственные велосипеды )))
Когда-то их не было, но нашлись сильные смелые ловкие и сделали. В Oracle сделали Oracle, в Sybase сделали Sybase SQL Server, а в Microsoft сильные смелые ловкие это дело прикупили и двигают далее. И bitmap индексы, и хранимые процедуры и пространственные индексы когда-то не были вообще, и когда появились то для кого-то были самодельными велосипедами ))))

Дайте наконец человеку изобретать, каждый программист имеет право на собственный самодельный велосипед, может она чудо планете подарит ))))

...

Рейтинг:

0 / 0

14.01.2020, 10:53

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39913718

ёёёёё

Участник

Сообщения: 2 086

Рейтинг: 0 / 0

ZirnayaKuro4ka

...К тому же С++ обновляется, а С# сдувается: Рейтинг языков программирования от TIOBE

Я всегда говорю: "С и Си++ - самые популярные". Потом открываю https://www.tiobe.com/tiobe-index/ - видишь, Си - 15%, С++ - 5%, в сумме - 20. Обычно соглашаются. :)

...

Рейтинг:

0 / 0

14.01.2020, 15:10

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39913782

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

ёёёёё

ZirnayaKuro4ka

...К тому же С++ обновляется, а С# сдувается: Рейтинг языков программирования от TIOBE

Вот жеж хитрый.

...

Рейтинг:

0 / 0

14.01.2020, 16:18

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39914157

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

ёёёёё

ZirnayaKuro4ka

...К тому же С++ обновляется, а С# сдувается: Рейтинг языков программирования от TIOBE

Ну так С и С++ -- это один язык.

...

Рейтинг:

0 / 0

15.01.2020, 11:01

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39914513

ёёёёё

Участник

Сообщения: 2 086

Рейтинг: 0 / 0

MasterZiv

ёёёёё

пропущено...

Я всегда говорю: "С и Си++ - самые популярные". Потом открываю https://www.tiobe.com/tiobe-index/ - видишь, Си - 15%, С++ - 5%, в сумме - 20. Обычно соглашаются. :)

Ну так С и С++ -- это один язык.

Вот.
И я об этом. :)

...

Рейтинг:

0 / 0

15.01.2020, 18:30

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39918686

exp98

Участник

Сообщения: 2 390

Рейтинг: 0 / 0

ТСу: попробуй аналогичный вопрос в разделе Питона (на ту же тему, т.к. здесь ответ не получен, только не дублируй и слей воду).

Заклевали ТСа.

А ведь вопросы были конкретные:
автор1. Не видите ли вы каких- то ошибок в моей идее?
2. Если все ок, то как научить С++ работать с массивами NumPy?

Вначале были неск. дельных советов, а потом как обычно свелось к советам "не зазнаваться". В мягком виде дедовщина: нас унижали, и мы будем с вами так же.

Единственную полезную мысль не смогли донести. Раньше говорили, что дифференцировать можно научить и обезияну, а интегрировать только чел-ка. Ничего не изменилось. Обрабатывать данные может и СверхСуперБигдата, а анализировать только чел-к. Ну и пусть ТС лопатит свой газон.

...

Рейтинг:

0 / 0

25.01.2020, 15:15

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39918717

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

exp98А ведь вопросы были конкретные:
Так ведь и ответы были конкретные: "да, мы видим" на первый вопрос, а второй,
соответственно, уже можно не затрагивать.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

25.01.2020, 19:46

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39918722

полудух

Участник

Откуда: планета орков, г.Зверополис

Сообщения: 1 099

Рейтинг: 0 / 0

ёёёёё

ZirnayaKuro4ka

...К тому же С++ обновляется, а С# сдувается: Рейтинг языков программирования от TIOBE

C++ какой-то донор для C и C#
хотя в нём столько полезного синтаксиса ввели
А питон опять себе 3е место выбил...

...

Рейтинг:

0 / 0

25.01.2020, 21:02

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39918724

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Я не считаю что введение синтаксических конфет делает язык лучше.
Вот в каком языке 19 (19 Карл!) способов инициализации переменной.
С одной стороны - это возможности. А с другой. Зачем? Неужели все 19
объективно нужны?

...

Рейтинг:

0 / 0

25.01.2020, 21:11

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39918734

полудух

Участник

Откуда: планета орков, г.Зверополис

Сообщения: 1 099

Рейтинг: 0 / 0

mayton

Вот в каком языке 19 (19 Карл!) способов инициализации переменной.

так они для сохранения работоспособности
сейчас то уже считай 1 способ:

Код: plaintext

string str {"my string"};

...

Рейтинг:

0 / 0

25.01.2020, 23:34

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922025

LocksmithPC

Участник

Сообщения: 280

Рейтинг: 0 / 0

Модератор: Данный форум не приветствует коверканье языка. Попробуйте переписать ваш вопрос в лучшей форме.

...

Рейтинг:

0 / 0

03.02.2020, 19:51

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922048

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

полудух

mayton

Вот в каком языке 19 (19 Карл!) способов инициализации переменной.

так они для сохранения работоспособности
сейчас то уже считай 1 способ:

Код: plaintext

string str {"my string"};

И зачем он мне нужен? Раньше я ставил один знак равно "=" а теперь вынужден ставить 2 bracers?

В чем профит?

...

Рейтинг:

0 / 0

03.02.2020, 21:17

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922051

полудух

Участник

Откуда: планета орков, г.Зверополис

Сообщения: 1 099

Рейтинг: 0 / 0

mayton

И зачем он мне нужен? Раньше я ставил один знак равно "=" а теперь вынужден ставить 2 bracers?

В чем профит?

uniform init

...

Рейтинг:

0 / 0

03.02.2020, 21:29

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922057

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Ты знаешь я когда учился в универе - изучал немного Lisp. Так вот. После недельки изучения
мне казалось что весь мир программирования состоит из S-выражений. И я этому находил
офигенские подтверждения. Любой ЯП и структуру данных я лихо раскидывал на вложенные
списки.

А Сальвадор Дали например видел во всём - рога носорогов. Во всех визуальных образах.

Вот такая вот у нас проф-деформация. Мдя...

Так что там эта Uniform Initialization даёт лично для меня?

Я просто напомню слова одного известного чела в нашей отрасли. Он говорил дескыть:

"ЯП должны быть в первую очередь для человека.... и только в редких случаях для машины"

...

Рейтинг:

0 / 0

03.02.2020, 21:46

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922077

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

mayton

В чем профит?

код чище.

и неявное сужение типа не пройдёт

...

Рейтинг:

0 / 0

03.02.2020, 22:59

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922199

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

(разводя руками)

Перестал все понимать. Этот код стал чище.

Код: plaintext

string str {"my string"};

А этот был грязный.

Код: plaintext

string str = "my string";

Возможно это был неудачный пример. И возможно такая комплексная инициализация
имеет смысл для конструирования объектов. Наподобие JavaScript. Но я надеюсь
что математическая форма инициализации все таки останется главенствующей
и простой к восприятию глазами.

...

Рейтинг:

0 / 0

04.02.2020, 12:06

| Ответить | Цитировать | Написать

Пишу программу, в которой будет как BigData, так и свои алгоритмы. Как лучше?

#39922323

PetroNotC Sharp

Участник

Сообщения: 10 098

Рейтинг: 0 / 0

mayton,
+1

...

Рейтинг:

0 / 0

04.02.2020, 15:20

| Ответить | Цитировать | Написать

59 сообщений из 59, показаны все 3 страниц

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?all=1&fid=57&tid=2017482]:	0ms
get settings:	8ms
get forum list:	12ms
check forum access:	3ms
check topic access:	3ms
track hit:	25ms
get topic data:	9ms
get forum data:	2ms
get page messages:	58ms
get tp. blocked users:	1ms
others:	201ms

total:	322ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы