-
内容大纲
《Python网络爬虫技术手册:基础·实战·强化》是“计算机科学与技术手册系列”图书之一,该系列图书内容全面,以理论联系实际、能学到并做到为宗旨,以技术为核心,以案例为辅助,引领读者全面学习基础技术、代码编写方法和具体应用项目,旨在为想要进入相应领域或者已经在该领域深耕多年的技术人员提供新而全的技术性内容及案例。
本书是一本侧重编程基础+实践的Python爬虫图书,从基础、实战、强化三个层次循序渐进地介绍了网络爬虫入门必备知识:基础篇主要讲解网络爬虫的基础内容;实战篇主要讲解目前应用最广的各类数据库爬虫相关技术和案例;强化篇结合数据库、数据分析、可视化等进行大型项目综合实战练习。本书内容充实,给读者提供了较为丰富全面的技术支持和案例强化,通过各种示例将学习与应用相结合,打造轻松学习、零压力学习的环境,通过案例对所学知识进行综合应用,通过开发实际项目将网络爬虫的各项技能应用到实际工作中,帮助读者实现学以致用,快速掌握网络爬虫的各项技能。
本书提供丰富的资源,包含109个实例、13个实战案例、2个应用强化项目,力求为读者打造一本基础+实战+强化一体化的、精彩的Python网络爬虫图书。
本书不仅适合初学者、数据采集相关技术人员、对数据感兴趣的人员,而且适合从事其他岗位想掌握一定的数据采集能力的职场人员阅读参考。 -
作者介绍
-
目录
第1篇 基础篇
第1章 爬虫基础
1.1 什么是网络爬虫
1.2 网络爬虫的分类
1.3 网络爬虫的原理
1.4 HTTP基本原理
1.4.1 什么是URL
1.4.2 HTTP协议
1.4.3 HTTP与Web服务器
1.4.4 浏览器中的请求和响应
1.5 网页的基本结构
1.5.1 了解HTML
1.5.2 了解CSS
1.5.3 了解JavaScript
第2章 搭建网络爬虫开发环境
2.1 Anaconda的安装
2.2 下载与安装PyCharm
2.3 配置PyCharm
2.4 测试PyCharm
第3章 网络请求urllib模块
3.1 了解urllib
3.2 发送网络请求
3.2.1 发送GET请求
实例3.1 演示常用的方法与属性
3.2.2 发送POST请求
实例3.2 发送POST请求
3.2.3 请求超时
实例3.3 处理网络超时
3.2.4 设置请求头
实例3.4 设置请求头
3.2.5 获取与设置Cookie
实例3.5 模拟登录
实例3.6 获取Cookie
实例3.7 保存Cookie文件
实例3.8 获取登录后页面中的信息
3.2.6 代理IP的设置
实例3.9 设置代理IP
3.3 处理请求异常
实例3.10 处理URLError异常
实例3.11 使用HTTPError类捕获异常
实例3.12 双重异常的捕获
3.4 解析URL
3.4.1 URL的拆分(urlparse、urlsplit)
实例3.13 使用urlparse()方法拆分URL
实例3.14 使用urlsplit()方法拆分URL
3.4.2 URL的组合(urlunparse、urlunsplit)
……
第2篇 实战篇
第3篇 强化篇
附录
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...