Бесплатно скачать mrjob для Linux ::: Кластерные и распределеные сети

mrjob

Скриншот программы:

Детали программы:

Версия: 0.4

Дата загрузки: 20 Feb 15

Разработчик: David Marin

Тип распространения: Бесплатная

Популярность: 66

Скачать

Currently 2.00/5
1
2
3
4
5

Rating: 2.0/5 (Total Votes: 3)

mrjob модуль Python, что позволяет писать и запускать Hadoop Streaming рабочих мест.
mrjob полностью поддерживает упругой MapReduce (EMR) службы Amazon, которая позволяет выиграть время на кластере Hadoop в на почасовой основе. Она также работает с вашим собственным Hadoop кластера.
Установка
питон setup.py установить
Настройка EMR на Amazon
& NBSP; * создать веб-служб Amazon счет: http://aws.amazon.com/~~HEAD=dobj
& NBSP; * подписаться на упругом MapReduce: http://aws.amazon.com/elasticmapreduce/
& NBSP; * Получите ваш доступ и секретные ключи (перейти к http://aws.amazon.com/account/ и нажмите на кнопку "полномочий безопасности") и установить переменные окружения $ AWS_ACCESS_KEY_ID и $ AWS_SECRET_ACCESS_KEY соответственно

Попробуйте это!
# Локально
питон mrjob / примеры / mr_word_freq_count.py README.md> рассчитывает
# На ЭМИ
питон mrjob / примеры / mr_word_freq_count.py README.md -r EMR> рассчитывает
# На Hadoop кластера
питон mrjob / примеры / mr_word_freq_count.py README.md -r Hadoop> рассчитывает
Дополнительные настройки
Для запуска в других регионах AWS, загрузить исходный дерево, запустить сделать, и использовать другие расширенные функции mrjob, вам нужно настроить mrjob.conf. mrjob ищет его конф файл в:
& NBSP; * ~ / .mrjob
& NBSP; * mrjob.conf в любом месте $ PYTHONPATH
& NBSP; * /etc/mrjob.conf
См mrjob.conf.example для получения дополнительной информации

Особенности :.

Выполнить работы по ЭМИ, самостоятельно Hadoop кластера, или локально (для тестирования).
Написать многоступенчатые рабочие места (одна карта-уменьшить шаг каналы в следующем)
Duplicate производственной среды внутри Hadoop
Загрузить исходный дерево и поставить его в вашу работу за $ PYTHONPATH
Выполнить марка и другие настройки сценариев
Переменные среды указан (например $ TZ)
Легко установить питона пакеты из тарболов (ЭМИ только)
Настройка осуществляется прозрачно mrjob.conf файле конфигурации
Автоматически интерпретировать журналы ошибок от ЭМИ
SSH-туннель к Hadoop работы трекера на ЭМИ
Минимальная настройка
Для запуска на ЭМИ, установите $ AWS_ACCESS_KEY_ID и $ AWS_SECRET_ACCESS_KEY
Чтобы запустить на Hadoop кластера, установите $ HADOOP_HOME

Требования

Python

20 Feb 15 в Сеть, Кластерные и распределеные сети

Комментарии к mrjob

Поиск по категориям

mrjob

Похожие программы

Bolt

openMosix

Open MPI

Son of Grid Engine

Другие программы разработчика David Marin

doloop

Комментарии к mrjob

Комментарии не найдены

добавить комментарий

Поиск по категориям

Последние посещенные программы

Navicat Premium (Multiple Databases GUI) (32 -bit) 16 Jun 17

Broadcom 802.11g Network Adapter 26 Oct 15

TMS Scripter Studio Pro(Delphi 2009 and C++Builder 2009) 6 May 15

Network:Broadcom NetXtreme Gigabit Ethernet Driver Version A00 29 Oct 15

Aspose.Slides for .NET 21 Jan 15

MS Word Extract E-Mail Addresses from Multiple Fil 12 Jul 15

Toshiba Satellite Click LX5W-C Broadcom Bluetooth Filter Driver for Windows 10 64-bit 22 Apr 16

Randomly Copy Files Software 9 Dec 14

Data Migration Suite (32-bit) 23 Jan 15

Whizlabs Linux Certification (RHCE) Training 29 Oct 15

Поиск по категориям

Популярные программы

HPCC Systems Community Edition 19 Feb 15

Linux NFS Utilities 14 Apr 15

DRBD Management Console 11 May 15

cloud-calculator 12 May 15

JGroups 26 Apr 16

Dapper Dataflow Engine 12 May 15

Condor 20 Feb 15

mrjob

Похожие программы

Bolt

openMosix

Open MPI

Son of Grid Engine

Другие программы разработчика David Marin

doloop

Комментарии к mrjob

Комментарии не найдены

добавить комментарий

Последние посещенные программы

Navicat Premium (Multiple Databases GUI) (32 -bit) 16 Jun 17

Broadcom 802.11g Network Adapter 26 Oct 15

TMS Scripter Studio Pro(Delphi 2009 and C++Builder 2009) 6 May 15

Network:Broadcom NetXtreme Gigabit Ethernet Driver Version A00 29 Oct 15

Aspose.Slides for .NET 21 Jan 15

MS Word Extract E-Mail Addresses from Multiple Fil 12 Jul 15

Toshiba Satellite Click LX5W-C Broadcom Bluetooth Filter Driver for Windows 10 64-bit 22 Apr 16

Randomly Copy Files Software 9 Dec 14

Data Migration Suite (32-bit) 23 Jan 15

Whizlabs Linux Certification (RHCE) Training 29 Oct 15

Поиск по категориям

Популярные программы

Tentakel 15 Apr 15

Mrs 20 Feb 15

salt 20 Feb 15

Pyro4 14 Apr 15

Linux NFS Utilities 14 Apr 15

ThinLinc 20 Feb 15

GNU Parallel 17 Feb 15