机读格式显示(MARC)
- 000 01771nam0 2200337 450
- 010 __ |a 978-7-302-64536-8 |d CNY118.00
- 100 __ |a 20231024d2023 em y0chiy50 ea
- 200 1_ |a Python和PySpark数据分析 |f (加) 乔纳森·里乌著 |g 殷海英译 |A Python he PySpark shu ju fen xi
- 210 __ |a 北京 |c 清华大学出版社 |d 2023
- 215 __ |a xiii, 402页 |c 图 |d 24cm
- 225 2_ |a 数据科学与大数据技术 |A shu ju ke xue yu da shu ju ji shu
- 314 __ |a 乔纳森·里乌, 作为一家数据驱动软件公司的ML总监, 每天都在使用PySpark。他向数据科学家、数据工程师和精通数据的业务分析师讲授PySpark的用法。
- 330 __ |a 本书是一本精心设计的教程, 可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据 (从基于Hadoop的集群到Excel工作表) 扩大多台机器的处理能力。通过阅读本书, 读者将学习如何将大型分析任务分解为可管理的块, 以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后, 您将能够编写和运行速度极快的PySpark程序, 这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码, 管理跨多台机器扩展的数据, 在PySpark中重写Pandas、R和SAS作业, 排查常见数据流水线问题, 并创建可靠的长期工作。
- 410 _0 |a 数据科学与大数据技术 |1 2001
- 500 10 |a Data analysis with Python and PySpark |A Data Analysis With Python And Pyspark |m Chinese
- 606 0_ |a 数据处理 |A shu ju chu li
- 606 0_ |a 软件工具 |x 程序设计 |A ruan jian gong ju
- 701 _1 |a 里乌 |g (Rioux, Jonathan) |4 著 |A li wu
- 702 _0 |a 殷海英 |4 译 |A yin hai ying
- 801 _0 |a CN |b SXDTDX |c 20240908
- 905 __ |a SXDTDX |d TP311.561/662