Apache Hadoop

Apache Hadoop — свободно распространяемый набор утилит, библиотек и фреймворк для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов.

Используется для реализации поисковых и контекстных механизмов многих высоконагруженных веб-сайтов, в том числе, для Yahoo! и Facebook.

Разработан на Java в рамках вычислительной парадигмы MapReduce, согласно которой приложение разделяется на большое количество одинаковых элементарных заданий, выполнимых на узлах кластера и естественным образом сводимых в конечный результат.

Подробнее

Harenslak Bas P., de Ruiter Julian Rutger. Data Pipelines with Apache Airflow (Final)

djvu

Раздел: Распределенные вычисления и системы → Apache Hadoop

Manning Publications Co, 2021. — 482 p. — ISBN: 978-1617296901/ Data Pipelines with Apache Airflow teaches you the ins-and-outs of the Directed Acyclic Graphs (DAGs) that power Airflow, and how to write your own DAGs to meet the needs of your projects. With complete coverage of both foundational and lesser-known features, when you’re done you’ll be set to start using Airflow...

№1
6,67 МБ
добавлен 11.04.2021 18:51
описание отредактировано 11.04.2021 21:53

Подробнее

Sitto Kevin, Presser Marshall. Field Guide to Hadoop

djvu

Раздел: Распределенные вычисления и системы → Apache Hadoop

O’Reilly Media, 2015. — 132 p. — ISBN13: 978-1-491-94793-7. Целевая аудитория: опытные разработчики. Hadoop - это популярный проект, использующийся для надёжного хранения больших объёмов данных. Если вы собираетесь работать с большими данными, вам просто необходимо начать изучать Hadoop и его многочисленные компоненты. Это руководство рассматривает Hadoop на примере...

№2
2,33 МБ
добавлен 01.01.2019 03:53
описание отредактировано 01.01.2019 05:47

Подробнее

White Tom. Hadoop: The Definitive Guide

djvu

Раздел: Распределенные вычисления и системы → Apache Hadoop

4th еdition. — O’Reilly, 2015. — 756 p. — ISBN: 1491901632. Get ready to unlock the power of your data. With the fourth edition of this comprehensive guide, you’ll learn how to build and maintain reliable, scalable, distributed systems with Apache Hadoop. This book is ideal for programmers looking to analyze datasets of any size, and for administrators who want to set up and...

№3
7,98 МБ
добавлен 30.05.2019 16:42
описание отредактировано 30.05.2019 18:14

Подробнее

Лэм Чак. Hadoop в действии

djvu

Раздел: Распределенные вычисления и системы → Apache Hadoop

М.: ДМК Пресс, 2012. — 424 c. — ISBN: 978-5-94074-785-7. Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложении, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных. Если вам...

№4
19,29 МБ
добавлен 24.10.2012 02:24
описание отредактировано 21.08.2018 08:22

В этом разделе нет файлов.

Harenslak Bas P., de Ruiter Julian Rutger. Data Pipelines with Apache Airflow (Final)

Sitto Kevin, Presser Marshall. Field Guide to Hadoop

White Tom. Hadoop: The Definitive Guide

Лэм Чак. Hadoop в действии

Комментарии