Зарегистрироваться
Восстановить пароль
FAQ по входу

Apache Hadoop

Apache Hadoop — свободно распространяемый набор утилит, библиотек и фреймворк для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов.
Используется для реализации поисковых и контекстных механизмов многих высоконагруженных веб-сайтов, в том числе, для Yahoo! и Facebook.
Разработан на Java в рамках вычислительной парадигмы MapReduce, согласно которой приложение разделяется на большое количество одинаковых элементарных заданий, выполнимых на узлах кластера и естественным образом сводимых в конечный результат.
  • Без фильтрации типов файлов
H
Manning Publications Co, 2021. — 482 p. — ISBN: 978-1617296901/ Data Pipelines with Apache Airflow teaches you the ins-and-outs of the Directed Acyclic Graphs (DAGs) that power Airflow, and how to write your own DAGs to meet the needs of your projects. With complete coverage of both foundational and lesser-known features, when you’re done you’ll be set to start using Airflow...
  • №1
  • 6,67 МБ
  • добавлен
  • описание отредактировано
S
O’Reilly Media, 2015. — 132 p. — ISBN13: 978-1-491-94793-7. Целевая аудитория: опытные разработчики. Hadoop - это популярный проект, использующийся для надёжного хранения больших объёмов данных. Если вы собираетесь работать с большими данными, вам просто необходимо начать изучать Hadoop и его многочисленные компоненты. Это руководство рассматривает Hadoop на примере...
  • №2
  • 2,33 МБ
  • добавлен
  • описание отредактировано
W
4th еdition. — O’Reilly, 2015. — 756 p. — ISBN: 1491901632. Get ready to unlock the power of your data. With the fourth edition of this comprehensive guide, you’ll learn how to build and maintain reliable, scalable, distributed systems with Apache Hadoop. This book is ideal for programmers looking to analyze datasets of any size, and for administrators who want to set up and...
  • №3
  • 7,98 МБ
  • добавлен
  • описание отредактировано
Л
М.: ДМК Пресс, 2012. — 424 c. — ISBN: 978-5-94074-785-7. Обработка больших массивов данных с помощью традиционных СУБД может оказаться трудным делом. Apache Hadoop - это каркас для разработки приложении, предназначенных для выполнения в распределенном кластере, без применения SQL. Такие приложения прекрасно масштабируются и могут обрабатывать гигантские массивы данных. Если вам...
  • №4
  • 19,29 МБ
  • добавлен
  • описание отредактировано
В этом разделе нет файлов.

Комментарии

В этом разделе нет комментариев.