
会员
自己动手写网络爬虫(修订版)
罗刚编著更新时间:2021-04-02 22:21:53
最新章节:本章小结开会员,本书免费读 >
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
自己动手写网络爬虫(修订版)最新章节
查看全部- 本章小结
- 10.2 网页聚类
- 10.1 网页分类
- 第10章 分类与聚类的应用
- 本章小结
- 9.4 分布式文档排重
- 9.3 SimHash排重
- 9.2 利用“语义指纹”排重
- 9.1 何为“重复”的文档
- 第9章 去掉“重复”的文档
罗刚编著
主页
同类热门书
最新上架
- 会员
编程改变生活:用Python提升你的能力(基础篇·微课视频版)
本书以Python的实际应用为主线,以理论基础为核心,引导读者渐进式学习Python的编程基础和实际应用。本书共17章,可分为4部分。第一部分Python编程环境搭建和Python的基础知识(第1~6章)、第二部分数学运算(第7~9章)、第三部分绘制图像(第10~12章)、第四部分办公自动化(第13~17章)。本书示例代码丰富,实用性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。计算机15.9万字 - 会员
智能优化算法与MATLAB编程实践
《智能优化算法与MATLAB编程实践》介绍了国内外新研发的10种智能优化算法,对每种算法的灵感来源、实现过程、函数编程、案例应用都进行了细致描述并给出详细的MATLAB代码,使读者快速掌握智能优化算法的学习和应用方法。全书共分为12章,前10章分别介绍10种智能优化算法的原理、MATLAB实现、具体函数寻优求解过程和应用案例;第11章列举了23种衡量智能优化算法性能的常见测试函数,并给出MATLA计算机6.1万字 - 会员
Python GUI设计tkinter菜鸟编程(增强版)
本书是国内首先使用Pythontkinter设计GUI的中文书籍之一。本书主要讲解如何在窗口内使用Python的内部模块tkinter设计图形用户接口(GUI)程序,让用户可以利用图形接口与计算机沟通。tkinter模块是一个跨平台的窗口应用程序,使用它设计的程序可以在Windows、macOS、Linux系统上执行。2019年《PythonGUI设计tkinter菜鸟编程》一经出版便受到广大读者计算机6.4万字 - 会员
FFmpeg开发实战:从零基础到短视频上线
《FFmpeg开发实战:从零基础到短视频上线》是一本FFmpeg开发的实战教程,由浅入深,由基础到高级,带领读者一步一步走进音视频开发的神奇世界。全书共分为12章。其中,第1~5章是基础部分,主要讲解FFmpeg的环境搭建、FFmpeg的开发基础、FFmpeg的编解码、FFmpeg处理图像和FFmpeg处理音频;第6~10章是进阶部分,主要讲解FFmpeg加工视频、FFmpeg添加图文、FFmpe计算机20.1万字 - 会员
Python量化交易实战:使用vn.py构建交易系统
本书就Python基础知识和交易策略的基本原理为切入点,由浅入深介绍了如何从零基础使用vn.py搭建自己交易系统。本书从原理着手到代码实践,内容由最基本的Python基础知识与Python中金融分析的常用包,逐步由浅入深介绍常用的指标并将使用vn.py进行实现。本书共分为8章,第1章与第2章介绍vn.py的环境搭建与Python常用的工具包,为后面使用vn.py实现交易策略做准备;第3章与第4章介计算机8.2万字 - 会员
ASP.NET Core从入门到精通
《ASP.NETCore从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了进行ASP.NETCore应用开发应该掌握的各方面技术。全书分为4篇,共18章,包括ASP.NETCore入门、.NETCore环境搭建、.NETCore命令行工具及包管理、C#新语法、异步编程、LINQ编程、.NETCore核心组件、ASP.NETCoreWeb应用、Razor与A计算机11.6万字 - 会员
Python数据分析快速上手
《Python数据分析快速上手》通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行数据分析应该掌握的各方面技术。本书内容包括Python基础,用NumPy进行数据计算,用Pandas进行数据分析,用SciPy进行数据分析,用Scikit-learn进行数据分析、数据预处理、数据可视化,用Matplotlib进行可视化等内容。本书示例丰富,所有涉及的程序代码都给出了详细的注释,读者可计算机11.5万字 - 会员
C#从入门到精通(第7版)
《C#从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用C#进行Windows应用程序开发方方面面的技术。全书分为4篇,共25章,包括初识C#及其开发环境、C#程序基本结构、变量与常量、表达式与运算符、字符与字符串、流程控制语句、数组和集合、面向对象编程、Windows窗体应用程序设计、Windows窗体应用程序常用控件、Windows窗体应用程序高级控件计算机17.8万字 - 会员
HTML5从入门到精通(第4版)
《HTML5从入门到精通(第4版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详尽地讲解了与HTML5开发相关的知识。全书分为3篇,共22章,包括HTML简介、HTML5基础、设计网页文本内容、使用列表、超链接、使用图像、表格的应用、布局标签、全局属性、编辑表单、嵌入多媒体元素、文件操作、拖放操作、绘制图形、SVG的使用、数据存储、使用WebWorkers处理线程、HTML5消息通信计算机17.3万字
同类书籍最近更新
- 会员
Java Web程序设计与案例教程(微课版)
本书基于作者多年的实践教学与开发经验,深入浅出地介绍了JavaWeb程序设计的核心知识和技巧,主要内容包括Servlet编程、Cookie与Session、JSP编程、EL表达式与JSTL标签、数据库整合开发、过滤器与监听器等。同时,本书以留言本为案例,分别讲解了JSP和JavaBean应用开发、JSP/Servlet和JavaBean整合开发、JavaWeb常用组件应用开发、Struts2/程序设计10.8万字 - 会员
C++从入门到精通(第5版)
《C++从入门到精通(第5版)》从初学者角度出发,以通俗易懂的语言和丰富多彩的实例,详细讲解了C++程序开发需要掌握的知识。本书分为4篇共18章:第1篇是基础知识,包括绪论,数据类型,运算符与表达式,条件判断语句,循环语句,函数,数组、指针和引用,以及构造数据类型;第2篇是核心技术,包括面向对象编程,类和对象,以及继承与派生;第3篇是高级应用,包括模板、标准模板库、RTTI与异常处理、程序调试、文程序设计15.1万字 - 会员
Python机器学习开发实战
本书一共分为19章,1~7章是编程基础,为了让那些没有编程经验的但是又想从事数据分析工作的学员有个入门的基础。8~19章则介绍了机器学习领域中常用的算法,他们分别是线性回归,逻辑回归,神经网络,线性判别,最近邻算法,决策树与随机森林,朴素贝叶斯,支持向量机,主成分分析,奇异值分解,k-means聚类。在第19章中则着重介绍了现在比较流行的深度学习框架。程序设计7.5万字 - 会员
Unity 3D脚本编程与游戏开发
本书以游戏开发为主要线索,全面讲解Unity3D的编程技术,涵盖Unity3D引擎的各个系统与模块。全书从帮助读者迅速建立脚本编程和游戏开发的框架思路开始讲起,逐步阐述Unity3D游戏开发的核心概念,以及对游戏开发至关重要的物理系统和3D数学基础等技术基础。然后针对游戏中的界面、动画、特效与音频等Unity3D各个常用模块的使用方法进行讲解,并详细介绍游戏开发中数据管理与资源管理相关的知程序设计17.9万字 - 会员
Spring Data JPA从入门到精通
《SpringDataJPA从入门到精通》以SpringBoot为技术基础,从入门到精通,由浅入深地介绍SpringDataJPA的使用。有语法,有实践,有原理剖析。《SpringDataJPA从入门到精通》分为12章,内容包括整体认识JPA、JPA基础查询方法、定义查询方法、注解式查询方法、@Entity实例里面常用注解详解、JpaRepository扩展详解、JPA的MVC扩展程序设计4.6万字 - 会员
深入浅出Go语言编程
本书是一部从核心概念、设计原理、应用场景、操作方法和实战技巧等维度全面、深入探讨Go语言的著作。书中首先介绍Go语言的基本概念,并通过“helloworld”程序引导读者熟悉Go的工具链。接下来逐步深入,介绍面向包的设计、测试框架、错误与异常处理等内容。第8章开始探讨指针和内存逃逸分析,这对于理解Go语言的内存模型至关重要。随后的章节涉及数据结构、面向对象和接口编程等核心知识。从第15章开始,重程序设计25.1万字