??Spark????: Chinese Edition
1146054714
??Spark????: Chinese Edition
47.99 In Stock
??Spark????: Chinese Edition

??Spark????: Chinese Edition

??Spark????: Chinese Edition

??Spark????: Chinese Edition


Available on Compatible NOOK devices, the free NOOK App and in My Digital Library.
WANT A NOOK?  Explore Now

Related collections and offers

Product Details

ISBN-13: 9781836203841
Publisher: Packt Publishing
Publication date: 05/23/2024
Sold by: Barnes & Noble
Format: eBook
Pages: 457
File size: 18 MB
Note: This product may take a few minutes to download.
Language: Chinese

About the Author

人民邮电出版社,1953年10月成立,隶属于中国工信出版传媒集团,是工业和信息化部主管的大型专业出版社。建社以来,人民邮电出版社始终坚持正确的出版导向,坚持为科技发展与社会进步服务、为繁荣社会主义文化服务,坚持积极进取、改革创新,围绕“立足工信事业,面向现代社会,传播科学知识,引领美好生活”的出版宗旨,已发展成为集图书、期刊、音像电子及数字出版于一体的综合性出版大社。 人民邮电出版社是全国优秀出版社、全国百佳图书出版单位,第一届、第二届、第三届、第五届“中国出版政府奖先进出版单位”,拥有“全国文明单位”、中央国家机关“五一劳动奖状”、中央国家机关“文明单位标兵”和“首都文明单位标兵”等重要荣誉,切实将社会效益放在首位、实现社会效益与经济效益相统一,综合实力位居行业前列。 人民邮电出版社出版领域涵盖科技出版、教育出版、大众出版,涉及信息技术、通信、工业技术、科普、经济管理、摄影、艺术、运动与休闲、心理学、少儿、大中专教材等10余个出版门类,年出版图书近万种,年销售码洋逾30亿元,在全国图书零售市场的占有率名列前茅,其中计算机类、艺术类、摄影类、运动与休闲类排名第一,设计类排名第二,科普类、美术类排名第四,经管类、少儿类位居前列。
"安德鲁·摩根(Andrew Morgan)是数据战略及其执行方面的专家,在支持技术、系统架构和实现数据科学方面拥有丰富的经验。他在数据行业拥有20多年的经验,曾为一些久负盛名的公司及其全球客户设计系统——通常是大型、复杂和国际性的项目。2013年,他创办了数据科学和大数据工程咨询公司ByteSumo,目前在与欧洲和美国的客户进行合作。Andrew是一位活跃的数据科学家,也是趋势演算(TrendCalculus)算法的发明者。该算法是他为自己的研究项目而开发的,该项目旨在研究基于机器学习的长期预测,这些预测可以在不断变化的文化、地缘政治和经济趋势中发现规律。他还是Hadoop Summit EU数据科学委员会的成员,并在许多会议上就各种数据主题发表过演讲。他也活跃于他的居住地伦敦的数据科学和大数据社区。 "
安托万·阿门德(Antoine Amend)是一位对大数据工程和可扩展计算充满热情的数据科学家。这本书的主题是“折腾”天文数字量级的非结构化数据以获得新的见解,这主要源于Antoine的理论物理学背景。他于2008年毕业并获得天体物理学硕士学位。在Hadoop的早期阶段,在大数据的概念普及之前,他曾在瑞士的一家大型咨询公司工作。从那时起,他就开始接触大数据技术。现在他在巴克莱银行担任网络安全数据科学部门的主管。通过将科学方法与核心IT技能相结合,Antoine连续两年获得了在得克萨斯州奥斯汀举行的大数据世界锦标赛决赛资格。他在2014年和2015年都名列前12位(超过2 000多名竞争对手),这两次比赛中他还使用了本书介绍的方法和技术赢得了创新奖。
大卫·乔治(David George)是一位杰出的分布式计算专家,拥有超过15年的数据系统从业经验,主要服务于全球闻名的IT咨询机构和品牌。他很早以前就开始使用Hadoop核心技术,并做过大规模的实施。David总是采用务实的方法进行软件设计,并重视简约中的优雅。如今,他继续作为首席工程师为金融行业客户设计可扩展的应用,并满足一些较为严苛的需求。他的新项目侧重于采用先进的人工智能技术来提高知识产业的自动化水平。
马修·哈利特(Matthew Hallett)是一名软件工程师和计算机科学家,拥有超过15年的从业经验。他是一名面向对象的“专家级程序员”和系统工程师,拥有丰富的底层编程范式知识。在过去的几年里,他在Hadoop和关键业务环境中的分布式编程方面积累了丰富的专业知识,这些环境由数千节点的数据中心组成。Matthew在分布式算法和分布式计算体系结构的实施方面拥有多种语言的咨询经验,目前是“四大审计公司”数据科学与工程团队的数据工程师顾问。

Table of Contents

Table of Contents
  1. 数据科学生态系统
  2. 数据获取
  3. 输入格式与模式
  4. 探索性数据分析
  5. 利用Spark进行地理分析
  6. 采集基于链接的外部数据
  7. 构建社区
  8. 构建推荐系统
  9. 新闻词典和实时标记系统
  10. 故事除重和变迁
  11. 情感分析中的异常检测
  12. 趋势演算
  13. 数据保护
  14. 可扩展算法
From the B&N Reads Blog

Customer Reviews