-
内容大纲
本书从Python语言的基本特性入手,详细介绍了各类数据编码和存取技术、网络爬虫相关技术、数据预处理和数据可视化技术等,内容覆盖本地文件、网络数据、大数据访问及数据预处理等编程中的主要知识和技术,在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示了数据采集、处理与存储的核心流程。
本书可作为高等院校数据科学与大数据技术、计算机科学与技术、软件工程等专业的本科教材,也适合Python语言初学者、网络爬虫技术爱好者、数据分析从业人士阅读。 -
作者介绍
付东普,管理学博士,产业经济学博士后,首都经济贸易大学信息学院副教授,主要关注互联网金融及电子商务领域研究。 1992-1996年就读于合肥工业大学材料科学与工程系,获本科工学学士学位;2005-2007年就读于北京理工大学软件学院,获软件工程硕士学位;2011-2014年就读于中国人民大学商学院,获管理学博士学位;2015-2017年在北京交通大学中国产业安全研究中心博士后科研工作站从事应用经济学博士后研究。 曾从事十余年的软件系统设计、开发和管理工作,后于2011年转入学术理论研究,在国内外学术会议和期刊上发表了二十余篇学术论文,并出版专著两部。 -
目录
第一章 概述
第一节 数据科学概述
第二节 数据采集概述
第三节 数据存储概述
第四节 Python相关数据科学工具
思考与练习
延伸阅读材料
第二章 Python基础
第一节 Python简介
第二节 Python基本语法与命令
第三节 运算符、表达式与内置对象
第四节 函数
第五节 异常及其处理
思考与练习
延伸阅读材料
第三章 numpy与pandas基础
第一节 numpy基础
第二节 pandas基础
思考与练习
延伸阅读材料
第四章 数据可视化
第一节 数据可视化概述
第二节 matplotlib绘图工具
第三节 其他数据可视化工具
思考与练习
延伸阅读材料
第五章 文件读写与操作
第一节 文件读写基本操作
第二节 CSV文件读写
第三节 XML文件读写
第四节 JSON文件读写
第五节 HDF文件读写
第六节 Office文件读写
第七节 PDF文件读写
第八节 图像文件读写
思考与练习
延伸阅读材料
第六章 统计与概率基础
第一节 统计基础
第二节 概率与分布
思考与练习
延伸阅读材料
第七章 数据清洗与预处理
第一节 数据清洗
第二节 数据整合
第三节 数据变换
第四节 聚合与分组统计
第五节 数据归约
思考与练习
延伸阅读材料
第八章 网络数据采集
第一节 爬虫的相关概念与知识
第二节 HTML与基础
第三节 静态网页内容爬取与解析
第四节 动态网页内容爬取
第五节 爬虫框架Scrapy与应用
思考与练习
延伸阅读材料
第九章 关系型数据库连接与访问
第一节 关系型数据库概述
第二节 SQLite数据库连接与访问
第三节 MySQL数据库连接与访问
思考与练习
延伸阅读材料
第十章 大数据存储与访问技术
第一节 大数据技术
第二节 非关系型数据库简介
第三节 MongoDB数据库连接与访问
思考与练习
延伸阅读材料
第十一章 数据集成与ETL技术
第一节 数据集成
第二节 ETL相关技术与工具
思考与练习
延伸阅读材料
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...