powered by simpleCommunicator - 2.0.47     © 2025 Programmizd 02
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Запуск Hadoop
8 сообщений из 8, страница 1 из 1
Запуск Hadoop
    #37663135
lari
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Приветствую!

Пытаюсь запустить кластер Hadoop, ставлю по инструкции:
http://www.ibm.com/developerworks/ru/library/l-hadoop-2/index.html?ca=drs-

Все вроде бы устанавливается.
На мастере:
Код: powershell
1.
2.
3.
4.
5.
[hadoop@master conf]$ jps
21682 JobTracker
21951 Jps
21586 SecondaryNameNode
21398 NameNode


На слейвах:
Код: powershell
1.
2.
3.
4.
[hadoop@slave1 conf]$ jps
17591 Jps
17523 TaskTracker
17408 DataNode



Код: powershell
1.
2.
3.
4.
[hadoop@slave2 conf]$ jps
19805 TaskTracker
19854 Jps
19688 DataNode



Все вроде бы хорошо, но:

Код: powershell
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
[hadoop@master conf]$ hadoop fsck /
FSCK started by hadoop (auth:SIMPLE) from /127.0.0.1 for path / at Wed Feb 15 16:10:10 MSK 2012
Status: HEALTHY
 Total size:    0 B
 Total dirs:    5
 Total files:   0
 Total blocks (validated):      0
 Minimally replicated blocks:   0
 Over-replicated blocks:        0
 Under-replicated blocks:       0
 Mis-replicated blocks:         0
 Default replication factor:    2
 Average block replication:     0.0
 Corrupt blocks:                0
 Missing replicas:              0
 Number of data-nodes:          0
 Number of racks:               0
FSCK ended at Wed Feb 15 16:10:10 MSK 2012 in 1 milliseconds


The filesystem under path '/' is HEALTHY
[hadoop@master conf]$



Вот куда смотреть, что читать дальше не понимаю...
...
Рейтинг: 0 / 0
Запуск Hadoop
    #37890346
Денис1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте, lari,

Как у вас успехи - удалось запустить hadoop кластер?
Вроде бы с момента сообщения прошло 5 месяцев - я надеюсь что да. Раскажете о своём опыте?

Судя по отсутствию ответов, эта тема либо никого не интересует, либо немногие устанавливали кластер.
Я хочу поделиться своими наблюдениями.

По-моему, самый лучший способ начать работу с hadoop - виртуальная демо-машина от Cloudera.
Я на ней всегда тестирую скрипты, исправляю ошибки в логике, исходных данных и прочие важные мелочи.
У меня на сайте есть заметка с несколькими примерами использования hadoop - называется "Примеры использования Hadoop без программирования на Java" - если кому интересно - добро пожаловать.

После виртуальной машины я переношу те-же самые, уже проверенные, скрипты на настоящий кластер - либо на Амазоне, либо у себя, если могу пробиться :-)

Из моего опыта, для самой безболезненной установки кластера - опять же лучшее средство Cloudera с её бесплатным продуктом.

И уж последний вариант - ставить код из самого проекта Apache Hadoop.

Кроме того, я пришёл к выводу что чем проще mappers/reducers - тем быстрее всё начинает работать.
Если нужна сложная обработка - лучше сделать несколько последовательных "проходов", но с простыми алгоритмами, чем сразу пытаться сделать всё.

Удачи вам в "слоноводстве" :-)

=================================================
С уважением,
Денис

Библия для людей, работающих с командной строкой.
http://www.read-and-think.org/
=================================================
...
Рейтинг: 0 / 0
Запуск Hadoop
    #37905965
fleandr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Подняв некропост...

Лучше отдельно ставить NameNode и JobTracker

А дальше надо залить данные на HDFS и выполнить MapReduce задачку.
...
Рейтинг: 0 / 0
Запуск Hadoop
    #37911391
lark
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
fleandr,

Это если у ТС есть отдельная машина для JobTracker.
Насколько я понял там только 2 ноды :)
...
Рейтинг: 0 / 0
Запуск Hadoop
    #37918059
fleandr
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
larkfleandr,

Это если у ТС есть отдельная машина для JobTracker.
Насколько я понял там только 2 ноды :)
не... у топикстартера 3 ноды. одна мастер с джобтрекером и намингнодой и 2 датаноды/тасктрекер Лучше сделать 4 а не 3 разнести джобтрекер и неймноду.
в статусе хадуп кластера показывается кол-во "полезных" нод а их как раз 2. Тут еще реп фактор 2 что не совсем хорошо так как лучше 3 =) С 2 плохой фолт толеранс...
...
Рейтинг: 0 / 0
Запуск Hadoop
    #38035884
mijatovic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ну вот я и проделал путь от первой инсталяции до своего блога:
http://hadoop-hive.blogspot.ru/
...
Рейтинг: 0 / 0
Запуск Hadoop
    #38178002
_dodgy_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mijatovicНу вот я и проделал путь от первой инсталяции до своего блога:
http://hadoop-hive.blogspot.ru/

Спасибо! Интересный ресурс.
...
Рейтинг: 0 / 0
Запуск Hadoop
    #38465768
anryal
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mijatovic, очень интересно
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Запуск Hadoop
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]