The Data Wrangling Workshop在线阅读
会员

The Data Wrangling Workshop

计算机网络编程语言与程序设计8.9万字

更新时间:2021-06-18 18:12:06 最新章节:9. Applications in Business Use Cases and Conclusion of the Course

立即阅读
加书架
下载
听书

书籍简介

Whileahugeamountofdataisreadilyavailabletous,itisnotusefulinitsrawform.Fordatatobemeaningful,itmustbecuratedandrefined.Ifyou’reabeginner,thenTheDataWranglingWorkshopwillhelptobreakdowntheprocessforyou.You’llstartwiththebasicsandbuildyourknowledge,progressingfromthecoreaspectsbehinddatawrangling,tousingthemostpopulartoolsandtechniques.ThisbookstartsbyshowingyouhowtoworkwithdatastructuresusingPython.Throughexamplesandactivities,you’llunderstandwhyyoushouldstayawayfromtraditionalmethodsofdatacleaningusedinotherlanguagesandtakeadvantageofthespecializedpre-builtroutinesinPython.Later,you’lllearnhowtousethesamePythonbackendtoextractandtransformdatafromanarrayofsources,includingtheinternet,largedatabasevaults,andExcelfinancialtables.Tohelpyouprepareformorechallengingscenarios,thebookteachesyouhowtohandlemissingorincorrectdata,andreformatitbasedontherequirementsfromyourdownstreamanalyticstool.Bytheendofthisbook,youwillhavedevelopedasolidunderstandingofhowtoperformdatawranglingwithPython,andlearnedseveraltechniquesandbestpracticestoextract,clean,transform,andformatyourdataefficiently,fromadiversearrayofsources.
品牌:中图公司
上架时间:2020-07-29 00:00:00
出版社:Packt Publishing
本书数字版权由中图公司提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

Brian Lipp Shubhadeep Roychowdhury Dr. Tirthajyoti Sarkar
主页

最新上架

  • 这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、
    于君泽 曹洪伟 李伟山 秦金卫 陈龙泉计算机23.3万字
  • 会员
    本书以R语言常见数据处理方法、ggplot2可视化为主线,希望解决大多数R学习者在学习过程中碰到的难点。本书以实战为目的,聚焦R语言本身数据处理、可视化特点,以一个个例子循序渐进的讲述R语言数据处理及可视化中用到的经典软件包。以便读者能快速将所学内容运用到在实际场景中。本书共6章,第1~3章分别介绍R语言及其软件安装、数据可视化入门介绍、数据存储结构及数据处理方法;第4章和第5章分别介绍ggplo
    杨德春编著计算机8.4万字
  • 会员
    本书涵盖深度学习的专业基础理论知识,包括深度学习概述、机器学习基础、神经网络基础、卷积神经网络、循环神经网络、正则化与深度学习优化,以及比较流行的应用场景实践。本书共11章外加3个附录,系统讲解深度学习的基础知识与领域应用实践。本书内容包括深度学习概述、机器学习基础、神经网络基础、卷积神经网络和循环神经网络、正则化与深度学习优化、计算机视觉应用、目标检测应用、文本分析应用、深度强化学习应用、Ten
    邓立国 李剑锋 林庆发 邓淇文计算机17.9万字
  • 会员
    《PHP从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用PHP进行网络开发需要掌握的各种技术。全书分为4篇共26章:基础知识篇包括初识PHP、PHP环境搭建和开发工具、PHP语言基础、流程控制语句、字符串操作、正则表达式、PHP数组、PHP与Web页面交互、PHP与JavaScript交互以及日期和时间;核心技术篇包括Cookie与Session、图形
    明日科技编著计算机16.4万字
  • 会员
    全书共6章,第1章:介绍本书所使用到的主要工具和一些需要心里有数的预备知识;第2章:解析最简单、常用的基础语法,帮助读者适应本书的节奏;第3章:为进阶知识,会从CPU、操作系统的角度,深入分析函数的工作原理和实现细节;第4章:解析经典的C++语法,背后的实现逻辑,并介绍面向对象的编程思想及优缺点;第5章:讨论跟操作系统强相关的软件技术,会将所有章节的内容贯穿起来,初步形成一个现代操作系统的运作模型
    阿布编程计算机9万字
  • 会员
    本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计8章。第1章讲解STL,涉及双端队列、优先队列、位图、集合、映射和STL中的常用函数;第2章讲解实用的数据结构,涉及并查集、倍增、稀疏表、区间最值查询、最近公共祖先、树状数组和线段树;第3章讲解查找算法,涉及散列表、字符串模式匹配和字典树;第4章讲解平衡树,涉及树高与性能
    陈小玉计算机10.7万字
  • 会员
    《企业微信开发详解》从零基础开始,详细地讲解了企业微信开发相关的知识点。本书重点介绍了企业微信的三大核心开发方式——回调开发方式、主动开发方式和网页开发方式,每种开发方式都从基础知识、架构设计建议、开发案例3个方面进行讲解。同时,针对企业微信开发的重要技术接口,给出了示例程序和执行结果,以方便读者清晰、明了地学习。读者可以按各技术点的讲解顺序学习,也可以根据个人需要有针对性地学习。
    翟东平计算机3.8万字
  • 会员
    《Java项目驱动开发教程》是一本以项目驱动教学模式理念设计的Java入门书。全书内容以软件项目案例驱动,代码实例丰富,项目实训任务饱满,语言通俗易懂,不仅能够使读者全面掌握Java面向对象编程技术,还能够提升读者使用Java语言开发软件项目的能力。《Java项目驱动开发教程》分为3个专题,共14章,3个专题分别以面向过程版的商超购物管理系统、面向对象版的超市购物系统、端对端聊天系统为贯穿项目,内
    迟殿委 刘丽贞 黄甜甜 杨嘉耀计算机8.9万字
  • 会员
    本书采用理论与实践相结合的原则,在各章的开篇会采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能是本书创作的初衷。全书共分为6篇:第一篇为入门篇(第1章和第2章),第二篇为基础篇(第3章和第4章),第三篇为强化篇(第5~7章),第四篇为进阶篇(第8章和第9章),第五篇为高阶篇(第10章和第11章),第六
    黄福星编著计算机11.8万字

同类书籍最近更新

  • 会员
    Frombankingandmanufacturingthroughtoeducationandentertainment,usingdatascienceforbusinesshasrevolutionizedalmosteverysectorinthemodernworld.Ithasanimportantroletoplayine
    Alex Galea程序设计5.9万字
  • 会员
    本书基于C++语言编写,从趣味故事引入算法复杂性计算及数据结构基础内容,涵盖线性结构、树形结构和图形结构,包括链表、栈和队列、树和图的应用等。本书内容还涉及数据结构的基本应用(包括各种查找、排序等)和高级应用(包括优先队列、并查集、B-树、B+树和红黑树等)。通过大量图解将抽象数据模型简单通俗化,语言表述浅显易懂,并结合有趣的实例帮助读者轻松掌握数据结构。
    陈小玉程序设计15.1万字
  • 会员
    本书系统介绍了如何入门Python并利用Python进行数据处理与机器学习实战。本书从Python的基础安装开始介绍,系统梳理了Python的入门语法知识,归纳介绍了图像处理、数据文件读写、数据库操作等Python基本技能;然后详细讲解了NumPy、Matplotlib、Pandas、Scipy、Scikit-learn等在数据处理、机器学习领域的应用。代码实例涵盖网络爬虫、数据处理、视觉识别、机
    许向武程序设计15.6万字
  • 会员
    本书从零开始讲解Python自动化运维工具和及其使用,通过上百个实际运维场景案例,帮助读者理解并掌握自动化运维技术。本书分为16章,内容包括Python自动化运维概述、Python基础运维技能、实战多进程、实战多线程、实战协程、自动化运维工具(Ansible)、定时任务模块(APScheduler)、执行远程命令的工具(Paramiko)、任务调度神器(Airflow)、分布式任务队列(Celer
    郑征程序设计11.6万字
  • 会员
    本书从Kafka的基础概念切入,循序渐进地转入对其内部原理的剖析。本书主要阐述了Kafka中生产者客户端、消费者客户端、主题与分区、日志存储、原理解析、监控管理、应用扩展及流式计算等内容。虽然Kafka的内核使用Scala语言编写,但本书基本以Java语言作为主要的示例语言,方便大多数读者的理解。虽然本书没有明确的界定,但总体上可以划分为三个部分:基础篇、原理篇和扩展篇,前4章为基础篇,包括基础概
    朱忠华程序设计19.5万字
  • 会员
    本书包含14例经典的乐高EV3结构设计及其编程指导,采用高清全彩的多角度图片展示,并辅以搭建过程中的要点、技巧和注意事项,每一个实例还附有精心制作的视频二维码,扫码即可观看搭建步骤和演示视频,让读者更加方便地学习和观摩,乐高机器人爱好者、机器人培训机构、学校科技课程的老师和学生都可用来作为重要参考。
    码高机器人教育程序设计2055字