Spark快速大数据分析 PDF电子书下载
内容简介
本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。
作者介绍
Holden Karau是Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。
Andy Konwinski是Databricks联合创始人,Apache Spark项目技术专家,还是Apache Mesos项目的联合发起人。
Patrick Wendell是Databricks联合创始人,也是Apache Spark项目技术专家。他还负责维护Spark核心引擎的几个子系统。
Matei Zaharia是Databricks的CTO,同时也是Apache Spark项目发起人以及Apache基金会副主席。
目录
版权声明
O'Reilly Media, Inc. 介绍
推荐序
译者序
序
前言
第 1 章 Spark 数据分析导论
第 2 章 Spark 下载与入门
第 3 章 RDD 编程
第 4 章 键值对操作
第 5 章 数据读取与保存
第 6 章 Spark 编程进阶
第 7 章 在集群上运行Spark
第 8 章 Spark 调优与调试
第 9 章 Spark SQL
第 10 章 Spark Streaming
第 11 章 基于 MLlib 的机器学习
作者简介和封面介绍
资源链接
Spark快速大数据分析 PDF电子书下载: http://pan.ishare1.cn/file/2973105-439515721标签
发布日期
2020-07-03
擦亮日期
2021-03-23