-
内容大纲
《Python数据可视化方法实践与应用》循序渐进、深入讲解了使用Python语言实现数据可视化分析的核心知识,并通过具体实例的实现过程演练了数据可视化分析的方法和流程。全书共10章,内容包括数据采集、使用数据库保存数据、绘制散点图和折线图、绘制柱状图、绘制饼状图、绘制其他图形以及商业应用——电影票房数据可视化、房地产市场数据可视化、交通数据可视化、招聘信息可视化。讲解简洁而不失深度,内容丰富、全面,历史资料翔实完整。本书以极简的文字介绍了复杂的案例,易于理解。《Python数据可视化方法实践与应用》适用于已经了解了Python语言基础语法的读者,也适用于希望进一步提高自己Python开发水平的读者,还可以作为大专院校相关专业的师生用书和培训机构的教材。 -
作者介绍
王振丽,华中科技大学计算机硕士,资深Python开发工程师,热衷于移动开底层系统架构、驱动开发、AI开发的研究和具体工作,对Python人工智能的架构设计和实现原理有非常深刻的认识和理解,应用开发经验也十分丰富。 -
目录
第1章 数据采集
1.1 处理网络数据
1.1.1 解析HTML和XML数据
1.1.2 处理HTTP 数据
1.1.3 处理URL 数据
1.2 网络爬虫技术
1.2.1 网络爬虫基础
1.2.2 使用Beautiful Soup爬取网络数据
1.2.3 使用XPath爬取网络数据
1.2.4 爬取体育新闻信息并保存到XML文件
1.2.5 爬取XX百科
1.3 使用专业爬虫库Scrapy
1.3.1 Scrapy框架基础
1.3.2 搭建Scrapy环境
1.3.3 创建第一个Scrapy项目
1.3.4 爬取某电影网的热门电影信息
1.3.5 爬取某网站中的照片并保存到本地
1.3.6 爬取某网站中的主播照片并保存到本地
第2章 使用数据库保存数据
2.1 操作SQLite 3数据库
2.1.1 sqlite3模块介绍
2.1.2 使用sqlite3模块操作SQLite 3数据库
2.1.3 SQLite和Python的类型
2.2 操作MySQL数据库
2.2.1 搭建PyMySQL环境
2.2.2 实现数据库连接
2.2.3 创建数据库表
2.3 使用MariaDB数据库
2.3.1 搭建MariaDB数据库环境
2.3.2 在Python程序中使用MariaDB数据库
2.3.3 使用MariaDB创建MySQL数据库
2.4 使用MongoDB数据库
2.4.1 搭建MongoDB环境
2.4.2 在Python程序中使用MongoDB数据库
2.5 使用ORM(对象关系映射)操作数据库
2.5.1 Python和ORM
2.5.2 使用SQLAlchemy
2.5.3 使用mongoengine
第3章 绘制散点图和折线图
3.1 绘制散点图
3.1.1 绘制一个简单的点
3.1.2 添加标题和标签
3.1.3 绘制10个点
3.1.4 修改散点的大小
3.1.5 设置散点的颜色和透明度
3.1.6 修改散点的形状
3.1.7 绘制两组数据的散点图
3.1.8 为散点图设置图例
3.1.9 自定义散点图样式
3.1.10 使用pygal绘制散点图
3.2 绘制折线图
3.2.1 绘制最简单的折线
3.2.2 设置标签文字和线条粗细
3.2.3 绘制1000个点组成折线图
3.2.4 绘制渐变色的折线图
3.2.5 绘制多幅子图
3.2.6 绘制正弦函数和余弦函数曲线
3.2.7 绘制3条不同的折线
3.2.8 绘制浏览器市场占有率变化折线图
3.2.9 绘制XY线图
3.2.10 绘制水平样式的浏览器市场占有率变化折线图
3.2.11 绘制叠加折线图
3.2.12 绘制某网站用户访问量折线图
3.3 绘制其他类型的散点图和折线图
3.3.1 绘制随机漫步图
3.3.2 大数据可视化分析某地的天气情况
3.3.3 在Tkinter中使用Matplotlib绘制图表
3.3.4 绘制包含点、曲线、注释和箭头的统计图
3.3.5 在两栋房子之间绘制箭头指示符
3.3.6 根据坐标绘制行走路线图
3.3.7 绘制方程式曲线图
3.3.8 绘制星空图
3.4 绘制BTC(比特币)和ETH(以太币)的价格走势图
3.4.1 抓取数据
3.4.2 绘制BTC/美元价格曲线
3.4.3 绘制BTC和ETH的历史价格曲线图
3.5 Flask+pygal+SQLite实现数据分析
3.5.1 创建数据库
3.5.2 绘制统计图
第4章 绘制柱状图
4.1 绘制基本的柱状图
4.1.1 绘制只有一个柱子的柱状图
4.1.2 绘制有两个柱子的柱状图
4.1.3 设置柱状图的标签
4.1.4 设置柱状图的颜色
4.1.5 绘制堆叠柱状图
4.1.6 绘制并列柱状图
4.1.7 绘制2002—2013年网页浏览器使用变化柱状图
4.1.8 绘制直方图
4.1.9 绘制横向柱状图
4.1.10 绘制有图例横向柱状图
4.1.11 绘制分组柱状图
4.1.12 模拟电影票房柱状图
4.1.13 绘制正负柱状图
4.1.14 绘制不同商品销量的统计 柱状图
4.2 可视化分析掷骰子游戏的结果次数
4.2.1 使用库pygal实现模拟掷骰子功能
4.2.2 同时掷两个骰子
4.3 可视化分析最受欢迎的开源项目
4.3.1 统计前30名最受欢迎的Python库
4.3.2 使用pygal实现数据可视化
4.4 可视化统计显示某网店各类口罩的销量
4.4.1 准备CSV文件
4.4.2 可视化CSV文件中的数据
4.5 数据挖掘:可视化处理文本情感分析数据
4.5.1 准备CSV文件
4.5.2 可视化两个剧本的情感分析数据
第5章 绘制饼状图
5.1 绘制基本的饼状图
5.1.1 绘制简易的饼状图
5.1.2 修饰饼状图
5.1.3 突出显示某个饼状图的部分
5.1.4 为饼状图添加图例
5.1.5 使用饼状图可视化展示某地区程序员的工龄
5.1.6 绘制多个饼状图
5.1.7 绘制多系列饼状图
5.1.8 绘制圈状饼状图
5.1.9 绘制环状饼状图
5.1.10 绘制半饼状图
5.1.11 使用库pandas、numpy 和matplotlib绘制饼状图
5.2 爬取热门电影信息并制作可视化分析饼状图
5.2.1 创建MySQL数据库
5.2.2 爬取并分析电影数据
5.3 机器学习实战:Scikit-Learn聚类分析并可视化处理
5.3.1 准备饼状图
5.3.2 聚类处理
5.3.3 生成统计柱状图
5.4 可视化展示名著《西游记》中出现频率最多的文字
5.4.1 单元测试文件
5.4.2 GUI界面
5.4.3 设置所需显示的出现频率
第6章 绘制其他图形
6.1 绘制雷达图
6.1.1 创建极坐标图
6.1.2 设置极坐标的正方向
6.1.3 绘制一个基本的雷达图
6.1.4 绘制XX战队2020绝地求生战绩的雷达图
6.1.5 使用雷达图比较两名研发部同事的能力
6.1.6 绘制汽车性能雷达图
6.1.7 使用pygal绘制雷达图
6.1.8 绘制主流编程语言的雷达图
6.2 绘制热力图
6.2.1 绘制热力图的函数
6.2.2 绘制一个简单的热力图
6.2.3 使用库matplotlib绘制热力图
6.3 将Excel文件中的地址信息可视化为交通热力图
6.3.1 将地址转换为JS格式
6.3.2 将JS地址转换为坐标
6.3.3 在地图中显示地址的热力信息
6.4 使用热点图可视化展示电视剧的收视率
6.4.1 爬虫爬取电视剧资料
6.4.2 使用热点图实现可视化
6.5 行人重识别并绘制行走热力图
6.5.1 安装第三方库pytorch
6.5.2 编写识别程序和绘图程序
6.6 绘制词云图
6.6.1 绘制B站词云图
6.6.2 绘制知乎词云图
6.7 使用热力图可视化展示某城市的房价信息
6.7.1 准备数据
6.7.2 使用热力图可视化展示信息
第7章 商业应用:电影票房数据可视化
7.1 需求分析
7.2 模块架构
7.3 爬虫抓取数据
7.3.1 分析网页
7.3.2 破解反爬
7.3.3 构造请求头
7.3.4 实现具体爬虫功能
7.3.5 将爬取的信息保存到数据库
7.4 数据可视化分析
7.4.1 电影票房TOP10
7.4.2 电影评分TOP10
7.4.3 电影人气TOP10
7.4.4 每月电影上映数量
7.4.5 每月电影票房
7.4.6 中外票房对比
7.4.7 名利双收TOP10
7.4.8 叫座不叫好TOP10
7.4.9 电影类型分布
第8章 商业应用:房地产市场数据可视化
8.1 背景介绍
8.2 需求分析
8.3 模块架构
8.4 系统设置
8.4.1 选择版本
8.4.2 保存日志信息
8.4.3 设置创建的文件名
8.4.4 设置抓取城市
8.4.5 处理区县信息
8.5 破解反爬机制
8.5.1 定义爬虫基类
8.5.2 浏览器用户代理
8.5.3 在线IP代理
8.6 爬虫抓取信息
8.6.1 设置解析元素
8.6.2 爬取二手房信息
8.6.3 爬取楼盘信息
8.6.4 爬取小区信息
8.6.5 抓取租房信息
8.7 数据可视化
8.7.1 爬取数据并保存到数据库
8.7.2 可视化济南市房价最贵的4个小区
8.7.3 可视化济南市主要地区的房价均价
8.7.4 可视化济南市主要地区的房源数量
8.7.5 可视化济南市各区的房源数量所占百分比
第9章 商业应用:交通数据可视化
9.1 系统架构分析
9.2 从CSV文件读取数据
9.2.1 读取显示CSV文件中的前3条骑行数据
9.2.2 读取显示CSV文件中指定列的数据
9.2.3 用统计图可视化CSV文件中的数据
9.2.4 选择指定数据
9.3 日期相关操作
9.3.1 统计每个月的骑行数据
9.3.2 展示某街道前5天的骑行数据信息
9.3.3 统计周一到周日每天的数据
9.3.4 使用matplotlib图表可视化展示统计数据
第10章 商业应用:招聘信息 可视化
10.1 系统背景介绍
10.2 系统架构分析
10.3 系统设置
10.4 网络爬虫
10.4.1 建立和数据库的连接
10.4.2 设置HTTP请求头 User-Agent
10.4.3 抓取信息
10.4.4 将抓取的信息添加到 数据库
10.4.5 处理薪资数据
10.4.6 清空数据库数据
10.4.7 执行爬虫程序
10.5 信息分离统计
10.5.1 根据“工作经验”分析 数据
10.5.2 根据“工作地区”分析 数据
10.5.3 根据“薪资水平”分析 数据
10.5.4 根据“学历水平”分析 数据
10.6 数据可视化
10.6.1 Flask Web架构
10.6.2 Web主页
10.6.3 数据展示页面
10.6.4 数据可视化页面
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...