-
内容大纲
本书以DeepSeek大模型为核心工具,系统讲解其在数据分析与可视化中的创新应用。本书共12章。第1章简要介绍DeepSeek的技术架构、本地部署与在线开发环境,为后续分析奠定技术基础。第2-4章聚焦多源数据获取、数据清洗及预处理,提供标准化操作流程与代码实例。第5-8章介绍描述性统计、频数分析、相关性分析、线性/曲线/逻辑回归、K-Means聚类、时间序列分析等核心算法,结合GDP分析、商品评论挖掘等案例解析其应用逻辑。第9、10章通过混淆矩阵、ROC曲线、交叉验证等工具评估模型效果,剖析欠拟合/过拟合现象,并讲述如何生成结构化分析报告。第11、12章以金融量化和电商平台为场景,串联Jieba分词、词云生成、雷达图等工具,还原真实业务问题的解决路径。
本书内容新颖,案例丰富,每章配备可复用的实战代码,适合数据分析师及相关从业者,以及对AI数据分析感兴趣的人员阅读,也可作为各类学校相关专业的教学用书或参考书。 -
作者介绍
王国平,毕业于上海海洋大学,资深数据分析专家,从业10余年,主要从事数据可视化、数据挖掘和大数据分析与研究工作。已出版《动手学PyTorch建模与应用:从深度到大模型》《动手学Excel数据分析与可视化》等图书。 -
目录
第1章 DeepSeek概述
1.1 DeepSeek大模型:重塑数据分析范式
1.2 核心技术体系:构建智能分析闭环
1.3 本地部署DeepSeek
1.3.1 安装Ollama
1.3.2 安装DeepSeek
1.3.3 安装Chatbox
1.3.4 API调用实战
1.4 使用DeepSeek在线开发环境进行工作
1.4.1 AI代码编辑器——Cursor
1.4.2 如何用DeepSeek开始数据分析
1.5 本章小结
第2章 利用DeepSeek进行数据加载
2.1 读取本地离线数据
2.1.1 读取CSV文本数据
2.1.2 读取Excel文件数据
2.1.3 读取本地图片数据
2.1.4 读取PDF文件数据
2.1.5 读取XML格式数据
2.2 读取数据库数据
2.2.1 读取Oracle数据库数据
2.2.2 读取MySQL数据库数据
2.2.3 读取SQL Server数据库数据
2.2.4 读取Kingbase数据库数据
2.2.5 读取OceanBase数据库数据
2.3 读取Web在线数据
2.3.1 如何获取并解析Web数据
2.3.2 读取UCI红酒在线数据
2.4 本章小结
第3章 利用DeepSeek进行数据清洗
3.1 重复值的检测与处理
3.1.1 重复值的检测方法
3.1.2 重复值的处理
3.2 缺失值的检测与处理
3.2.1 缺失值的检测
3.2.2 缺失值的处理
3.3 异常值的检测与处理
3.3.1 异常值的检测
3.3.2 异常值的处理
3.4 本章小结
第4章 利用DeepSeek进行数据预处理
4.1 数据集成
4.1.1 数据集成概述
4.1.2 数据横向合并
4.1.3 数据纵向合并
4.2 数据转换
4.2.1 数据转换概述
4.2.2 数据标准化处理方法
4.2.3 数据二值化处理方法
4.2.4 数据离散化处理方法
4.3 数据集划分
4.3.1 数据集划分概述
4.3.2 训练集和测试集法
4.3.3 训练集/验证集/测试集法
4.3.4 分层抽样法
4.4 本章小结
第5章 利用DeepSeek进行数据探索
5.1 描述性分析
5.1.1 描述性分析概述
5.1.2 案例:国内生产总值描述性分析
5.2 频数分析
5.2.1 频数分析概述
5.2.2 案例:居民消费水平频数分析
5.3 探索分析
5.3.1 探索分析概述
5.3.2 案例:商品评论得分探索分析
5.4 交叉表分析
5.4.1 交叉表分析概述
5.4.2 案例:商品颜色交叉表分析
5.5 相关分析
5.5.1 相关关系概述
5.5.2 案例:铁路和公路货运量分析
5.6 偏相关分析
5.6.1 偏相关分析概述
5.6.2 案例:铁路和公路货运量分析
5.7 本章小结
第6章 利用DeepSeek进行回归分析
6.1 线性回归
6.1.1 线性回归概述
6.1.2 案例:贷款申请人负债率分析
6.2 曲线回归
6.2.1 曲线回归概述
6.2.2 案例:信用额度使用率分析
6.3 逻辑回归
6.3.1 逻辑回归概述
6.3.2 案例:贷款客户是否违约分析
6.4 本章小结
第7章 利用DeepSeek进行聚类分析
7.1 聚类分析简介
7.2 K-Means聚类
7.2.1 K-Means算法
7.2.2 案例:水质监测聚类分析
7.3 手肘法判断聚类数
7.3.1 手肘法概述
7.3.2 案例:手肘法判断聚类数
7.4 轮廓系数法判断聚类数
7.4.1 轮廓系数法
7.4.2 案例:轮廓系数法判断聚类数
7.5 本章小结
第8章 利用DeepSeek进行时间序列分析
8.1 时间序列分析概述
8.1.1 时序数据简介
8.1.2 时间序列算法
8.2 指数平滑法及其案例
8.2.1 指数平滑法
8.2.2 案例:制造业采购经理指数预测
8.3 ARIMA模型及其案例
8.3.1 ARIMA模型
8.3.2 案例:居民消费价格指数预测
8.4 本章小结
第9章 利用DeepSeek进行模型评估
9.1 模型评估方法
9.1.1 混淆矩阵及案例
9.1.2 ROC曲线及案例
9.1.3 R平方及案例
9.1.4 残差及案例
9.1.5 交叉验证及案例
9.1.6 学习曲线及案例
9.2 欠拟合及其案例
9.2.1 欠拟合及其影响
9.2.2 案例:波士顿房价回归分析
9.3 过拟合及其案例
9.3.1 过拟合及其影响
9.3.2 案例:基于随机森林的鸢尾花分类
9.4 本章小结
第10章 利用DeepSeek撰写分析报告
10.1 数据分析报告的作用
10.2 DeepSeek撰写数据分析报告的注意事项
10.3 案例:电商数据分析报告
10.3.1 分析背景
10.3.2 理解数据
10.3.3 数据清洗
10.3.4 数据分析
10.3.5 案例总结
10.4 本章小结
第11章 案例:DeepSeek金融量化数据分析
11.1 案例概述
11.1.1 K线图技术理论
11.1.2 案例数据采集
11.2 数据基础分析
11.2.1 查看数据集信息
11.2.2 数据描述性分析
11.2.3 数据可视化分析
11.3 股票数据分析
11.3.1 指标相关性分析
11.3.2 指标趋势性分析
11.3.3 股票交易时机分析
11.4 本章小结
第12章 案例:DeepSeek电商平台数据分析
12.1 案例背景
12.2 商品销售数据分析
12.2.1 每日商品订单量日历图
12.2.2 每月商品销售额折线图
12.2.3 不同区域销售业绩雷达图
12.3 商品评论文本分析
12.3.1 中文Jieba分词概述
12.3.2 商品评论关键词分析
12.3.3 商品评论关键词词云
12.4 本章小结
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
