书籍详情
《数据算法:Hadoop》[34M]百度网盘|亲测有效|pdf下载
  • 数据算法:Hadoop

  • 出版社:中国电力出版社
  • 出版时间:2016-10
  • 热度:7658
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

适读人群 :这本书面向了解Java基础知识并且想使用Hadoop和Spark 开发MapReduce 算法(数据挖掘、机器学习、生物信息技术、基因组和统计领域)和解决方案的软件工程师、软件架构师、数据科学家和应用开发人员。

  市面上N0.1本关于Hadoop与Spark大数据处理技巧的教程,提供了丰富的算法和工具。

内容简介

  《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。
  主要内容包括:
  ■ 完成超大量交易的购物篮分析。
  ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。
  ■ 使用超大基因组数据完成DNA和RNA测序。
  ■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。
  ■ 推荐算法和成对文档相似性。
  ■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。
  ■ 等位基因频率和DNA挖掘。
  ■ 社交网络分析(推荐系统、三角形计数和情感分析)。

作者简介

  Mahmoud Parsian,计算机科学博士,是一位热衷于实践的软件专家,作为开发人员、设计人员、架构师和作者,他有30多年的软件开发经验。目前领导着Illumina的大数据团队,在过去15年间,他主要从事Java (服务器端)、数据库、MapReduce和分布式计算的有关工作。Mahmoud还著有《JDBC Recipes》和《JDBC Metadata, MySQL,and Oracle Recipes》等书(均由Apress出版)。

精彩书摘

前言/序言