本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
Spark Contributor,Databricks工程师连城,华为大数据平台开发部部长陈亮,网易杭州研究院副院长汪源,TalkingData首席数据科学家张夏天联袂力荐
1.《Apache Spark源码剖析》全面、系统地介绍了Spark源码,深入浅出,细致入微
2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序
3.始终抓住资源分配、消息传递、容错处理等基本问题,抽丝拨茧
4.一步步寻找答案,所有问题迎刃而解,使读者知其然更知其所以然
★与Hadoop、Hive、Storm等老牌大数据系统相比,Spark的代码体积要小得多。然而这样一套精简的系统却同时承载了批处理、流处理、迭代计算、关系查询、图计算等多种计算范式,再加上Scala和函数式编程并不为普通程序员所熟悉,阅读和分析Spark源码并不是一件特别轻松的事情。本书记录了一系列分析Spark源码的实用技巧,并给出了一个合理的阅读顺序,相信可以令学习Spark的读者们事半功倍。
——Spark Contributor,Databricks工程师 连城
★介绍Spark的书籍很多,但一般不够全面,而这本书非常系统全面地介绍了Spark源码,深入浅出、细致入微,把Spark的由来、Spark整体框架、Spark各软件栈、Spark环境搭建、Spark部署模式等从源码角度一步步剖析得非常清楚。作者有很强的系统设计、软件工程功底,读者不仅可以从书中学到Spark知识,还可以学习到作者对新技术研究、源码研究很多好的方法和技巧。授人以鱼不如授人以渔,对在校大学生、Spark初学者、大数据开发工程师来说,这本书非常值得拥有。
——华为大数据平台开发部部长 陈亮
★难以置信,薄薄的一本书可以兼具如此的广度与深度。除了Spark核心系统,本书还介绍了Streaming、SQL、GraphX、MLLib等扩展库,内容相当全面。但更“赞”的是本书对Spark及各扩展库的运行机理,无不提纲挈领,一一阐明,让读者不但知其然,还能知其所以然。如果想在生产环境中用好Spark,本书值得细读。
——网易杭州研究院副院长 汪源
★Spark目前正在蓬勃发展,越来越多的公司把大数据计算任务迁移到Spark平台上来。Spark开发的学习曲线并不陡峭。但是处理大数据,需要的不仅是逻辑正确的程序,还需要高性能的程序。如果想把Spark的性能挖掘到更深,那就需要深入了解Spark的设计思想和运行机制,而要了解这些,没有比读源代码更直接的了。许鹏老师的这本书,对于那些没有时间、精力直接啃源代码或者对Scala语言还不太精通的读者来说是一个福音。
——TalkingData首席数据科学家 张夏天