Book duration 306 pages
2015 year
Изучаем Spark. Молниеносный анализ данных
About the book
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Неплохая книга, чтобы начать знакомство со Spark. Книжка полезна всем: разработчикам, дата-инженерам и одна (последняя) глава для дата-сайнтистов. Недостаток книги – она устаревшая, т.к. в ней рассматриваются только RDD. Но для «прыжка» книжка весьма неплоха
Достоинства:
Практически все темы раскрыты
Недостатки:
Рассматриваемая версия Spark старовата
Подходит для понимания основ Spark. Действительно уже устарела, так как на носу версия Spark 3.0.0. В целом читается очень хорошо, материал изложено доступно
Reviews, 3 reviews3