
会员
精通Spark数据科学
更新时间:2021-01-15 16:45:59 最新章节:14.6 小结
书籍简介
ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书,旨在教会读者利用Spark构建实用的数据科学解决方案。本书内容包括14章,由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。本书适合数据科学家以及对数据科学、机器学习感兴趣的读者阅读,需要读者具备数据科学相关的基础知识,并通过阅读本书进一步提升Spark运用能力,从而创建出高效且实用的数据科学解决方案。
品牌:人邮图书
译者:柯晟劼 刘少俊
上架时间:2020-09-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
(美)安德鲁·摩根 (英)安托万·阿门德 大卫·乔治 马修·哈利特
同类热门书
最新上架
- 会员《现代智能控制实用技术丛书》共分为四本,其内容按照信号传输的链条,即由传感器、调制与解调、信息的传输与通信技术和智能控制技术及其应用组成。本书先对智能控制的概念展开详细的介绍,随后针对智能控制的综合应用进行举例。选取了比较典型的实例,例如,中小学校教室智能照明系统、医疗机构智能照明系统、城市道路和公路隧道照明智能控制系统、自动驾驶汽车的智能控制系统,以及人脸识别技术在智能控制领域的应用等。各个实例工业13万字
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字