欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • DeepSeek高效数据分析(从数据清洗到行业案例)
      • 作者:王国平|责编:王金柱
      • 出版社:清华大学
      • ISBN:9787302703785
      • 出版日期:2025/11/01
      • 页数:310
    • 售价:35.6
  • 内容大纲

        本书以DeepSeek大模型为核心工具,系统讲解其在数据分析与可视化中的创新应用。本书共12章。第1章简要介绍DeepSeek的技术架构、本地部署与在线开发环境,为后续分析奠定技术基础。第2-4章聚焦多源数据获取、数据清洗及预处理,提供标准化操作流程与代码实例。第5-8章介绍描述性统计、频数分析、相关性分析、线性/曲线/逻辑回归、K-Means聚类、时间序列分析等核心算法,结合GDP分析、商品评论挖掘等案例解析其应用逻辑。第9、10章通过混淆矩阵、ROC曲线、交叉验证等工具评估模型效果,剖析欠拟合/过拟合现象,并讲述如何生成结构化分析报告。第11、12章以金融量化和电商平台为场景,串联Jieba分词、词云生成、雷达图等工具,还原真实业务问题的解决路径。
        本书内容新颖,案例丰富,每章配备可复用的实战代码,适合数据分析师及相关从业者,以及对AI数据分析感兴趣的人员阅读,也可作为各类学校相关专业的教学用书或参考书。
  • 作者介绍

        王国平,毕业于上海海洋大学,资深数据分析专家,从业10余年,主要从事数据可视化、数据挖掘和大数据分析与研究工作。已出版《动手学PyTorch建模与应用:从深度到大模型》《动手学Excel数据分析与可视化》等图书。
  • 目录

    第1章  DeepSeek概述
      1.1  DeepSeek大模型:重塑数据分析范式
      1.2  核心技术体系:构建智能分析闭环
      1.3  本地部署DeepSeek
        1.3.1  安装Ollama
        1.3.2  安装DeepSeek
        1.3.3  安装Chatbox
        1.3.4  API调用实战
      1.4  使用DeepSeek在线开发环境进行工作
        1.4.1  AI代码编辑器——Cursor
        1.4.2  如何用DeepSeek开始数据分析
      1.5  本章小结
    第2章  利用DeepSeek进行数据加载
      2.1  读取本地离线数据
        2.1.1  读取CSV文本数据
        2.1.2  读取Excel文件数据
        2.1.3  读取本地图片数据
        2.1.4  读取PDF文件数据
        2.1.5  读取XML格式数据
      2.2  读取数据库数据
        2.2.1  读取Oracle数据库数据
        2.2.2  读取MySQL数据库数据
        2.2.3  读取SQL Server数据库数据
        2.2.4  读取Kingbase数据库数据
        2.2.5  读取OceanBase数据库数据
      2.3  读取Web在线数据
        2.3.1  如何获取并解析Web数据
        2.3.2  读取UCI红酒在线数据
      2.4  本章小结
    第3章  利用DeepSeek进行数据清洗
      3.1  重复值的检测与处理
        3.1.1  重复值的检测方法
        3.1.2  重复值的处理
      3.2  缺失值的检测与处理
        3.2.1  缺失值的检测
        3.2.2  缺失值的处理
      3.3  异常值的检测与处理
        3.3.1  异常值的检测
        3.3.2  异常值的处理
      3.4  本章小结
    第4章  利用DeepSeek进行数据预处理
      4.1  数据集成
        4.1.1  数据集成概述
        4.1.2  数据横向合并
        4.1.3  数据纵向合并
      4.2  数据转换
        4.2.1  数据转换概述
        4.2.2  数据标准化处理方法
        4.2.3  数据二值化处理方法
        4.2.4  数据离散化处理方法

      4.3  数据集划分
        4.3.1  数据集划分概述
        4.3.2  训练集和测试集法
        4.3.3  训练集/验证集/测试集法
        4.3.4  分层抽样法
      4.4  本章小结
    第5章  利用DeepSeek进行数据探索
      5.1  描述性分析
        5.1.1  描述性分析概述
        5.1.2  案例:国内生产总值描述性分析
      5.2  频数分析
        5.2.1  频数分析概述
        5.2.2  案例:居民消费水平频数分析
      5.3  探索分析
        5.3.1  探索分析概述
        5.3.2  案例:商品评论得分探索分析
      5.4  交叉表分析
        5.4.1  交叉表分析概述
        5.4.2  案例:商品颜色交叉表分析
      5.5  相关分析
        5.5.1  相关关系概述
        5.5.2  案例:铁路和公路货运量分析
      5.6  偏相关分析
        5.6.1  偏相关分析概述
        5.6.2  案例:铁路和公路货运量分析
      5.7  本章小结
    第6章  利用DeepSeek进行回归分析
      6.1  线性回归
        6.1.1  线性回归概述
        6.1.2  案例:贷款申请人负债率分析
      6.2  曲线回归
        6.2.1  曲线回归概述
        6.2.2  案例:信用额度使用率分析
      6.3  逻辑回归
        6.3.1  逻辑回归概述
        6.3.2  案例:贷款客户是否违约分析
      6.4  本章小结
    第7章  利用DeepSeek进行聚类分析
      7.1  聚类分析简介
      7.2  K-Means聚类
        7.2.1  K-Means算法
        7.2.2  案例:水质监测聚类分析
      7.3  手肘法判断聚类数
        7.3.1  手肘法概述
        7.3.2  案例:手肘法判断聚类数
      7.4  轮廓系数法判断聚类数
        7.4.1  轮廓系数法
        7.4.2  案例:轮廓系数法判断聚类数
      7.5  本章小结
    第8章  利用DeepSeek进行时间序列分析

      8.1  时间序列分析概述
        8.1.1  时序数据简介
        8.1.2  时间序列算法
      8.2  指数平滑法及其案例
        8.2.1  指数平滑法
        8.2.2  案例:制造业采购经理指数预测
      8.3  ARIMA模型及其案例
        8.3.1  ARIMA模型
        8.3.2  案例:居民消费价格指数预测
      8.4  本章小结
    第9章  利用DeepSeek进行模型评估
      9.1  模型评估方法
        9.1.1  混淆矩阵及案例
        9.1.2  ROC曲线及案例
        9.1.3  R平方及案例
        9.1.4  残差及案例
        9.1.5  交叉验证及案例
        9.1.6  学习曲线及案例
      9.2  欠拟合及其案例
        9.2.1  欠拟合及其影响
        9.2.2  案例:波士顿房价回归分析
      9.3  过拟合及其案例
        9.3.1  过拟合及其影响
        9.3.2  案例:基于随机森林的鸢尾花分类
      9.4  本章小结
    第10章  利用DeepSeek撰写分析报告
      10.1  数据分析报告的作用
      10.2  DeepSeek撰写数据分析报告的注意事项
      10.3  案例:电商数据分析报告
        10.3.1  分析背景
        10.3.2  理解数据
        10.3.3  数据清洗
        10.3.4  数据分析
        10.3.5  案例总结
      10.4  本章小结
    第11章  案例:DeepSeek金融量化数据分析
      11.1  案例概述
        11.1.1  K线图技术理论
        11.1.2  案例数据采集
      11.2  数据基础分析
        11.2.1  查看数据集信息
        11.2.2  数据描述性分析
        11.2.3  数据可视化分析
      11.3  股票数据分析
        11.3.1  指标相关性分析
        11.3.2  指标趋势性分析
        11.3.3  股票交易时机分析
      11.4  本章小结
    第12章  案例:DeepSeek电商平台数据分析
      12.1  案例背景

      12.2  商品销售数据分析
        12.2.1  每日商品订单量日历图
        12.2.2  每月商品销售额折线图
        12.2.3  不同区域销售业绩雷达图
      12.3  商品评论文本分析
        12.3.1  中文Jieba分词概述
        12.3.2  商品评论关键词分析
        12.3.3  商品评论关键词词云
      12.4  本章小结