
会员
The Data Wrangling Workshop
更新时间:2021-06-18 18:12:06 最新章节:9. Applications in Business Use Cases and Conclusion of the Course
书籍简介
Whileahugeamountofdataisreadilyavailabletous,itisnotusefulinitsrawform.Fordatatobemeaningful,itmustbecuratedandrefined.Ifyou’reabeginner,thenTheDataWranglingWorkshopwillhelptobreakdowntheprocessforyou.You’llstartwiththebasicsandbuildyourknowledge,progressingfromthecoreaspectsbehinddatawrangling,tousingthemostpopulartoolsandtechniques.ThisbookstartsbyshowingyouhowtoworkwithdatastructuresusingPython.Throughexamplesandactivities,you’llunderstandwhyyoushouldstayawayfromtraditionalmethodsofdatacleaningusedinotherlanguagesandtakeadvantageofthespecializedpre-builtroutinesinPython.Later,you’lllearnhowtousethesamePythonbackendtoextractandtransformdatafromanarrayofsources,includingtheinternet,largedatabasevaults,andExcelfinancialtables.Tohelpyouprepareformorechallengingscenarios,thebookteachesyouhowtohandlemissingorincorrectdata,andreformatitbasedontherequirementsfromyourdownstreamanalyticstool.Bytheendofthisbook,youwillhavedevelopedasolidunderstandingofhowtoperformdatawranglingwithPython,andlearnedseveraltechniquesandbestpracticestoextract,clean,transform,andformatyourdataefficiently,fromadiversearrayofsources.
品牌:中图公司
上架时间:2020-07-29 00:00:00
出版社:Packt Publishing
本书数字版权由中图公司提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
Brian Lipp Shubhadeep Roychowdhury Dr. Tirthajyoti Sarkar
最新上架
- 会员本书以R语言常见数据处理方法、ggplot2可视化为主线,希望解决大多数R学习者在学习过程中碰到的难点。本书以实战为目的,聚焦R语言本身数据处理、可视化特点,以一个个例子循序渐进的讲述R语言数据处理及可视化中用到的经典软件包。以便读者能快速将所学内容运用到在实际场景中。本书共6章,第1~3章分别介绍R语言及其软件安装、数据可视化入门介绍、数据存储结构及数据处理方法;第4章和第5章分别介绍ggplo计算机8.4万字
- 会员本书涵盖深度学习的专业基础理论知识,包括深度学习概述、机器学习基础、神经网络基础、卷积神经网络、循环神经网络、正则化与深度学习优化,以及比较流行的应用场景实践。本书共11章外加3个附录,系统讲解深度学习的基础知识与领域应用实践。本书内容包括深度学习概述、机器学习基础、神经网络基础、卷积神经网络和循环神经网络、正则化与深度学习优化、计算机视觉应用、目标检测应用、文本分析应用、深度强化学习应用、Ten计算机17.9万字
- 会员《PHP从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用PHP进行网络开发需要掌握的各种技术。全书分为4篇共26章:基础知识篇包括初识PHP、PHP环境搭建和开发工具、PHP语言基础、流程控制语句、字符串操作、正则表达式、PHP数组、PHP与Web页面交互、PHP与JavaScript交互以及日期和时间;核心技术篇包括Cookie与Session、图形计算机16.4万字
- 会员全书共6章,第1章:介绍本书所使用到的主要工具和一些需要心里有数的预备知识;第2章:解析最简单、常用的基础语法,帮助读者适应本书的节奏;第3章:为进阶知识,会从CPU、操作系统的角度,深入分析函数的工作原理和实现细节;第4章:解析经典的C++语法,背后的实现逻辑,并介绍面向对象的编程思想及优缺点;第5章:讨论跟操作系统强相关的软件技术,会将所有章节的内容贯穿起来,初步形成一个现代操作系统的运作模型计算机9万字
- 会员本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计8章。第1章讲解STL,涉及双端队列、优先队列、位图、集合、映射和STL中的常用函数;第2章讲解实用的数据结构,涉及并查集、倍增、稀疏表、区间最值查询、最近公共祖先、树状数组和线段树;第3章讲解查找算法,涉及散列表、字符串模式匹配和字典树;第4章讲解平衡树,涉及树高与性能计算机10.7万字
- 会员《Java项目驱动开发教程》是一本以项目驱动教学模式理念设计的Java入门书。全书内容以软件项目案例驱动,代码实例丰富,项目实训任务饱满,语言通俗易懂,不仅能够使读者全面掌握Java面向对象编程技术,还能够提升读者使用Java语言开发软件项目的能力。《Java项目驱动开发教程》分为3个专题,共14章,3个专题分别以面向过程版的商超购物管理系统、面向对象版的超市购物系统、端对端聊天系统为贯穿项目,内计算机8.9万字
- 会员本书采用理论与实践相结合的原则,在各章的开篇会采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能是本书创作的初衷。全书共分为6篇:第一篇为入门篇(第1章和第2章),第二篇为基础篇(第3章和第4章),第三篇为强化篇(第5~7章),第四篇为进阶篇(第8章和第9章),第五篇为高阶篇(第10章和第11章),第六计算机11.8万字
同类书籍最近更新
- 会员Frombankingandmanufacturingthroughtoeducationandentertainment,usingdatascienceforbusinesshasrevolutionizedalmosteverysectorinthemodernworld.Ithasanimportantroletoplayine程序设计5.9万字
- 会员本书系统介绍了如何入门Python并利用Python进行数据处理与机器学习实战。本书从Python的基础安装开始介绍,系统梳理了Python的入门语法知识,归纳介绍了图像处理、数据文件读写、数据库操作等Python基本技能;然后详细讲解了NumPy、Matplotlib、Pandas、Scipy、Scikit-learn等在数据处理、机器学习领域的应用。代码实例涵盖网络爬虫、数据处理、视觉识别、机程序设计15.6万字
- 会员本书从零开始讲解Python自动化运维工具和及其使用,通过上百个实际运维场景案例,帮助读者理解并掌握自动化运维技术。本书分为16章,内容包括Python自动化运维概述、Python基础运维技能、实战多进程、实战多线程、实战协程、自动化运维工具(Ansible)、定时任务模块(APScheduler)、执行远程命令的工具(Paramiko)、任务调度神器(Airflow)、分布式任务队列(Celer程序设计11.6万字
- 会员本书从Kafka的基础概念切入,循序渐进地转入对其内部原理的剖析。本书主要阐述了Kafka中生产者客户端、消费者客户端、主题与分区、日志存储、原理解析、监控管理、应用扩展及流式计算等内容。虽然Kafka的内核使用Scala语言编写,但本书基本以Java语言作为主要的示例语言,方便大多数读者的理解。虽然本书没有明确的界定,但总体上可以划分为三个部分:基础篇、原理篇和扩展篇,前4章为基础篇,包括基础概程序设计19.5万字
- 会员本书包含14例经典的乐高EV3结构设计及其编程指导,采用高清全彩的多角度图片展示,并辅以搭建过程中的要点、技巧和注意事项,每一个实例还附有精心制作的视频二维码,扫码即可观看搭建步骤和演示视频,让读者更加方便地学习和观摩,乐高机器人爱好者、机器人培训机构、学校科技课程的老师和学生都可用来作为重要参考。程序设计2055字