-
内容大纲
本书循序渐进地讲解了使用Python语言实现数据分析的核心知识,并通过具体实例的实现过程演示了数据分析的方法和流程。全书共12章,内容包括Python语言基础、处理网络数据、网络爬虫实战、处理特殊文本格式、使用数据库保存数据、操作处理CSV文件、操作处理JSON数据、使用库matplotlib实现数据可视化处理、使用库pygal实现数据可视化处理、使用库numPy实现数据可视化处理、使用库pandas实现数据可视化处理和大数据实战案例。全书简洁而不失技术深度,内容丰富全面。不仅易于阅读,同时涵盖了其他同类图书中很少涉及的参考资料,是学习Python数据分析的实用教程。
本书适用于已了解Python语言基础语法、希望进一步提高自己Python开发水平的读者,还可作为大中专院校和培训学校相关专业师生的学习参考用书。 -
作者介绍
-
目录
前言
第1章 Python语言基础
1.1 Python语言介绍
1.1.1 Python语言的地位
1.1.2 Python语言的优点
1.2 安装Python
1.2.1 在Windows系统中下载并安装
Python
1.2.2 在MacOS系统中下载并安装
Python
1.2.3 在Linux系统中下载并安装
Python
1.3 Python开发工具介绍
1.3.1 使用Python自带的开发工具
IDLE
1.3.2 使用流行工具PyCharm
1.4 认识第壹段Python程序
1.4.1 使用IDLE编码并运行
1.4.2 使用命令行方式运行Python
程序
1.4.3 使用交互式方式运行Python
程序
1.4.4 使用PyCharm实现第壹个Python
程序
第2章 处理网络数据
2.1 处理HTML和XML数据
2.1.1 解析XML数据
2.1.2 使用库beautiful soup解析数据
2.1.3 使用库bleach解析数据
2.1.4 使用库cssutils解析数据
2.1.5 使用库html5lib解析数据
2.1.6 使用库markupsafe解析数据
2.1.7 使用库pyquery解析数据
2.2 处理HTTP 数据
2.2.1 使用内置的http包处理数据
2.2.2 使用库requests处理数据
2.2.3 使用库httplib2处理数据
2.2.4 使用库urllib3处理数据
2.3 处理URL 数据
2.3.1 使用urllib包
2.3.2 使用库furl处理数据
2.3.3 使用库purl处理数据
2.3.4 使用库webargs处理数据
2.4 爬取新闻保存到XML文件并分析
特征关系
2.4.1 爬虫抓取数据
2.4.2 使用Stanford CoreNLP提取XML
数据的特征关系
第3章 网络爬虫实战
3.1 网络爬虫基础
3.2 开发简单的网络爬虫应用程序
3.2.1 爬虫抓取某高校教师信息
3.2.2 抓取某吧的信息
3.2.3 抓取XX百科
3.2.4 爬虫抓取某网站的信息并保存到
本地
3.3 使用爬虫框架Scrapy
3.3.1 Scrapy框架基础
3.3.2 搭建Scrapy环境
3.3.3 创建第壹个Scrapy项目
3.3.4 抓取某电影网的热门电影信息
3.3.5 抓取某网站中的照片并保存到
本地
3.3.6 抓取某网站中的主播照片并保存到
本地
第4章 处理特殊文本格式
4.1 使用tablib模块
4.1.1 基本用法
4.1.2 操作数据集中的指定行和列
4.1.3 删除并导出不同格式的数据
4.1.4 生成一个Excel文件
4.1.5 处理多个数据集
4.1.6 使用标签过滤数据
4.1.7 分离表格中的数据
4.2 使用openpyxl处理Office
文件
4.2.1 openpyxl基础
4.2.2 使用openpyxl读取Excel文件的
数据
4.2.3 将4组数据导入Excel文件
4.2.4 在Excel文件中检索某关键字
数据
4.2.5 将数据导入Excel文件并生成一个
图表
4.3 使用pyexcel处理Office
文件
4.3.1 使用pyexcel读取并写入CSV
文件
4.3.2 使用pyexcel读取指定Excel文件中
每个单元格数据
4.3.3 按列读取并显示指定Excel文件中
每个单元格数据
4.3.4 读取显示Excel文件中的所有
数据
4.3.5 将3组数据导入新建的Excel
文件
4.3.6 以多种方式获取Excel数据
4.3.7 将数据分别导入Excel文件和SQLite
数据库
4.3.8 在Flask Web项目中使用pyexcel处理
数据
4.4 使用python-docx处理Office
文件
4.4.1 使用python-docx处理Office文件的
流程
4.4.2 创建Word文档
4.4.3 在Word中插入图片
4.4.4 创建结构文档
4.4.5 读取Word文档
4.5 使用xlrd和xlwt读写Excel
4.5.1 使用库xlrd
4.5.2 使用库xlwt
4.6 使用xlsxwriter操作Excel
文件
4.6.1 使用库xlsxwriter的基本流程
4.6.2 创建一个表格
4.6.3 设置表格样式
4.6.4 向Excel文件中插入图像
4.6.5 向Excel文件中插入数据并绘制
柱状图
4.6.6 向Excel文件中插入数据并绘制
散点图
4.6.7 向Excel文件中插入数据并绘制
柱状图和饼状图
第5章 使用数据库保存数据
5.1 操作SQLite3数据库
5.1.1 sqlite3模块介绍
5.1.2 使用sqlite3模块操作SQLite
数据库
5.1.3 使用Flask+ SQLite3+ ECharts2实现
降水数据可视化系统
5.2 操作MySQL数据库
5.2.1 搭建PyMySQL环境
5.2.2 实现数据库连接
5.2.3 创建数据库表
5.2.4 爬取XX站用户信息并保存到
MySQL数据库
5.3 使用MariaDB数据库
5.3.1 搭建MariaDB数据库环境
5.3.2 在Python程序中使用MariaDB
数据库
5.4 使用MongoDB数据库
5.4.1 搭建MongoDB环境
5.4.2 在Python程序中使用MongoDB
数据库
5.5 使用ORM操作数据库
5.5.1 Python和ORM
5.5.2 使用SQLAlchemy
5.5.3 使用mongoengine
第6章 操作处理CSV文件
第7章 操作处理JSON数据
第8章 使用库matplotlib实现数据可视化处理
第9章 使用库pygal实现数据可视化处理
第10章 使用库numPy实现数据可视化处理
第11章 使用库pandas实现数据可视化处理
第12章 大数据实战:电影票房
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...