-
内容大纲
本书以构建完整的知识体系为目标,按照从简单到复杂的思路,贯穿了数据处理与挖掘的各个环节,具体包括:Python快速入门、Python数据类型、Python常用模块、Python数据获取、Python数据挖掘基础、Python数据挖掘算法、Python大数据挖掘和Python数据可视化。此外,针对各知识点,本书均设计了相应的Python案例,并给出了实现代码、效果图以及相应的解释,以强化读者对各知识点的理解与掌握。
本书可作为高等院校人工智能、计算机科学与技术、经济与金融等专业的教材,也可供大数据分析与处理等领域的技术人员学习使用,还可作为数据分析与挖掘研究人员的参考用书。 -
作者介绍
吴振宇 北京航空航天大学工学博士,南京邮电大学物联网学院教师,中国指挥与控制学会认知与行为专业委员会委员,中国计算机学会网络与数据通信专业委员会委员。具有长达4年的外商投资企业软件开发经验,长期从事数据分析、人工智能、Linux编程等课程的教学工作。主要研究方向包括大数据分析与挖掘、智能驾驶等。 -
目录
第1章 Python快速入门
1.1 一种简单的编程语言
1.1.1 Python--解释型编程语言
1.1.2 Python应用
1.2 Python开发环境
1.2.1 搭建简单的Python开发环境
1.2.2 功能强大的集成开发环境
1.2.3 交互式开发环境
1.3 Python中简单的程序结构
1.3.1 文件是代码的基本组成单元
1.3.2 模块化地组织代码
1.3.3 代码缩进区分逻辑关系
1.3.4 输入和输出提升程序交互性
1.3.5 常见的Python解释器
1.4 习题
第2章 Python数据类型
2.1 数据类型是数据表示的基础
2.1.1 Python中一切皆对象
2.1.2 数字类型
2.1.3 布尔类型
2.1.4 字符串类型
2.1.5 自定义数据类型
2.1.6 变量
2.2 语句组成逻辑结构
2.2.1 运算符和表达式
2.2.2 语句
2.3 控制程序的执行
2.3.1 顺序结构
2.3.2 分支结构
2.3.3 循环结构
2.4 有效存储数据
2.4.1 列表
2.4.2 元组
2.4.3 字典
2.4.4 集合
2.4.5 特殊运算符
2.5 函数实现代码复用
2.5.1 自定义函数
2.5.2 内置函数
2.5.3 字符串处理函数
2.5.4 函数式编程
2.6 存储数据
2.6.1 文件操作
2.6.2 JSON和XML
2.7 案例:传感器数据分析
2.8 习题
第3章 Python常用模块
3.1 模块的概念
3.2 自定义模块
3.3 正则表达式模块
3.4 NumPy和SciPy模块
3.4.1 NumPy
3.4.2 SciPy
3.5 Pandas库
3.6 习题
第4章 Python数据获取
4.1 Web的客户端/服务器工作模式
4.1.1 Web数据传输协议
4.1.2 Web页面标记语言
4.1.3 Web样式设计
4.2 Python设计爬虫软件
4.2.1 页面请求库URLLib
4.2.2 增强的网络请求库Requests
4.2.3 页面内容解析库BeautifulSoup
4.2.4 案例:在互联网上获取电影评论数据
4.2.5 浏览器中模拟点击的Selenium库
4.3 多线程提升数据获取的效率
4.3.1 多线程的使用方法
4.3.2 案例:多线程在页面数据获取中的应用
4.4 习题
第5章 Python数据挖掘基础
5.1 数据挖掘的基本概念
5.1.1 数据挖掘中常用的术语
5.1.2 数据挖掘的流程
5.2 数据集是数据挖掘的基础
5.2.1 各领域公开了大量的数据集
5.2.2 自定义数据
5.3 Python中常用的 数据挖掘库
5.3.1 自然语言处理常用的NLTK库
5.3.2 机器学习常用的Sklearn库
5.4 习题
第6章 Python数据挖掘算法
6.1 数据挖掘中的分类
6.1.1 分类问题的基本思想
6.1.2 常见的分类算法
6.1.3 朴素贝叶斯分类算法的原理
6.1.4 案例:从头实现朴素贝叶斯分类算法
6.2 数据挖掘中的聚类
6.2.1 聚类的基本思想
6.2.2 常见的聚类算法
6.2.3 K-means聚类算法的原理
6.2.4 案例:从头实现K-means聚类算法
6.3 习题
第7章 Python大数据挖掘
7.1 深度学习是大数据处理的重要手段
7.1.1 深度学习来源于神经网络
7.1.2 深度学习已有大量模型
7.1.3 深度学习框架提升使用效率
7.1.4 卷积神经网络的工作原理
7.1.5 LSTM网络的工作原理
7.1.6 案例:使用卷积神经网络实现蔬菜识别系统
7.2 习题
第8章 Python数据可视化
8.1 可视化技术自然地展现数据规律
8.2 最为常用的Matplotlib库
8.2.1 使用Matplotlib库绘制各种图形
8.2.2 Pandas库中直接绘图
8.3 Seaborn库增强绘图效果
8.4 Plotnine库弥补可视化不足
8.5 案例:房价数据采集及可视化
8.6 习题
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...