山西大同大学图书馆书目检索系统

| 暂存书架(0) | 登录

首记录 上一条 1 / 15 下一条 尾记录 MARC状态:审校 文献类型:中文图书 浏览次数:3

题名/责任者:
Python和PySpark数据分析/(加) 乔纳森·里乌著 殷海英译
出版发行项:
北京:清华大学出版社,2023
ISBN及定价:
978-7-302-64536-8/CNY118.00
载体形态项:
xiii, 402页:图;24cm
统一题名:
Data analysis with Python and PySpark
丛编项:
数据科学与大数据技术
个人责任者:
里乌 (Rioux, Jonathan)
个人次要责任者:
殷海英
学科主题:
数据处理
学科主题:
软件工具-程序设计
中图法分类号:
TP311.561
中图法分类号:
TP274
相关题名附注:
英文题名原文取自版权页
责任者附注:
乔纳森·里乌, 作为一家数据驱动软件公司的ML总监, 每天都在使用PySpark。他向数据科学家、数据工程师和精通数据的业务分析师讲授PySpark的用法。
提要文摘附注:
本书是一本精心设计的教程, 可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据 (从基于Hadoop的集群到Excel工作表) 扩大多台机器的处理能力。通过阅读本书, 读者将学习如何将大型分析任务分解为可管理的块, 以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后, 您将能够编写和运行速度极快的PySpark程序, 这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码, 管理跨多台机器扩展的数据, 在PySpark中重写Pandas、R和SAS作业, 排查常见数据流水线问题, 并创建可靠的长期工作。
使用对象附注:
本书适用于程序设计人员
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置
TP311.561/662 B0203160   库本     新书:正在上架 库本
TP311.561/662 B0203159   基本书库     新书:正在上架 基本书库
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架