
会员
网络数据采集技术:Java网络爬虫实战
更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结
书籍简介
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
最新上架
- 会员本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti计算机27.5万字
- 会员虽然技术在进步,硬件也越来越物美价廉,但如今软件工程师仍需要关注程序的性能优化。本书将介绍软件效率问题、Go语言快速入门知识、如何实现高效编程,告诉大家如何高效进行性能优化,以及何时进行,并给出需要的工具和相关知识,让你使用较少的资源实现高效编程。计算机27.3万字
- 会员本书是Java入门书籍,适合初学者使用。全书共13章,第1章主要讲解Java的特点与发展史、JDK的使用、Java程序的编写与运行机制、Java开发环境的搭建等;第2~6章主要讲解Java编程基础知识,包括Java基本语法、面向对象、JavaAPI和集合;第7~12章主要讲解Java进阶知识,包括I/O、多线程、网络编程、JDBC、GUI、Java反射机制;第13章带领读者开发一个综合项目——基计算机20万字
- 会员本书介绍了Docker和Kubernetes的相关知识,可以帮助读者快速了解并熟练配置Kubernetes。本书共分为16章。首先介绍了Docker基础和Docker进阶;然后介绍了Kubernetes的基础操作,包括部署Kubernetes集群、升级Kubernetes、创建及管理Pod等;之后重点介绍了存储管理、密码管理、Deployment、DaemonSet及其他控制器、探针、Job、服务计算机8.6万字
- 会员本书从初学者的角度出发,详细介绍了JavaWeb开发需要掌握的相关技术。全书分4个部分,共17章,由浅入深地介绍了HTTP、Tomcat、Servlet、Maven、数据库基础知识、JDBC、MyBatis、JSP、框架原理、如何设计自己的框架,以及在线购书商城、个人云文件系统、论坛、个人博客项目开发的完整过程。本书理论联系实际,不但能让读者全面掌握JavaWeb开发基本技术,而且能让读者开发计算机8.5万字
- 会员本书书分为以下几部分:第一部分:预备知识:介绍数据结构和算法的基本概念,并演示如何搭建开发环境、编写测试用例。第二部分:数据结构:介绍常见的数据结构,包括数组、链表、矩阵、栈、队列、跳表、散列、树、图等。第三部分:常用算法:介绍常用的算法,包括分而治之、动态规划、贪婪算法、回溯、分支界定、遗传算法等。第四部分:商业实战:介绍汉诺塔及五子棋两款游戏的实现。计算机0字
- 会员本书共11章,第1章讲解Python基础,第2章讲解数据处理与分析,第3章讲解科研绘图与学术图表绘制库,第4章讲解绘制单变量图形,第5章讲解绘制双变量图形,第6章讲解绘制多变量图形,第7章讲解绘制其他2D图形,第8章讲解绘制3D图形,第9章讲解地理信息可视化,第10章讲解数据学术报告、论文和出版,第11章讲解实战训练营。计算机9万字
同类书籍最近更新
- 会员《零基础学Struts》由浅入深、循序渐进地介绍了Struts2框架的知识点。重点介绍了Struts2的类型转换、输入校验、拦截器、国际化、标签库以及Struts2的Ajax支持。后通过两个实际案例来演示如何将Struts运用到实际项目开发中。Struts2框架继承了Struts和WebWork两个框架的易用性,其功能相比Struts和WebWork要更加强大。Struts2从诞生至今,以其功能的程序设计13.8万字