- Python机器学习及实践--从零开始通往Kaggle竞赛之路(2022年度版)/高等学校创意创新创业教育系列丛书
- - 作者：范淼//徐晟桐|责编:谢琛
  - 出版社：清华大学
  - ISBN：9787302614241
  - 出版日期：2022/10/01
  - 页数：353
- 售价：39.6

内容大纲
本书在不涉及大量数学模型与复杂编程知识的前提下，从零开始逐步带领读者熟悉并掌握当下流行的基于Python 3的数据分析，以及支持单机、深度和分布式机器学习的开源程序库，如pandas、Scikit-learn、PyTorch、TensorFlow、PaddlePaddle、PySpark-ML等。全书分4部分。入门篇包括对全书核心概念的指南性介绍，以及在多种主流操作系统（Windows、macOS、Ubuntu）上配置基本编程环境的详细说明。基础篇涵盖Python 3的编程基础、基于pandas的数据分析，以及使用Scikit-learn解决大量经典的单机（单核/多核）机器学习问题。进阶篇介绍如何使用PyTorch、TensorFlow、PaddlePaddle搭建多种深度学习网络框架，以及如何基于PySpark的ML编程库完成一些常见的分布式机器学习任务。实践篇利用全书所讲授的Python编程、数据分析、机器学习知识，帮助读者挑战和参与Kaggle多种类型的竞赛实战，同时介绍如何使用Git在Gitee、GitHub平台上维护和管理日常代码与编程项目。
本书适合所有对人工智能领域，特别是机器学习、数据挖掘、自然语言处理等技术及其实践感兴趣的初学者。
作者介绍
目录
第1部分  入门篇
  第1章  全书指南
    1.1  Python编程
    1.2  数据分析
    1.3  机器学习
      1.3.1  任务
      1.3.2  经验
      1.3.3  性能
    1.4  Kaggle竞赛
    1.5  Git代码管理
    1.6  章末小结
  第2章  基本环境搭建与配置
    2.1  Windows操作系统下基本环境的搭建与配置
      2.1.1  查看Windows的版本与原始配置
      2.1.2  下载并安装Anaconda3（Windows）
      2.1.3  使用Anaconda Navigator创建虚拟环境python_env（Windows）
      2.1.4  在虚拟环境python_env下使用Anaconda Navigator安装Jupyter Notebook与PyCharm Professional（Windows）
    2.2  macOS操作系统下基本环境的搭建与配置
      2.2.1  查看macOS的版本与原始配置
      2.2.2  下载并安装Anaconda3（macOS）
      2.2.3  使用Anaconda Navigator创建虚拟环境python_env（macOS）
      2.2.4  在虚拟环境python_env下使用Anaconda Navigator安装Jupyter Notebook与PyCharm Professional（macOS）
    2.3  Ubuntu操作系统下基本环境的搭建与配置
      2.3.1  查看Ubuntu的版本与原始配置
      2.3.2  下载并安装Anaconda3（Ubuntu）
      2.3.3  在终端中创建虚拟环境python_env（Ubuntu）
      2.3.4  在虚拟环境python_env下使用conda命令安装Jupyter Notebook（Ubuntu）
    2.4  Jupyter Notebook使用简介
      2.4.1  在虚拟环境python_env下启动Jupyter Notebook
      2.4.2  创建一个.ipynb文件
      2.4.3  试运行.ipynb文件内的Python 3程序
    2.5  PyCharm使用简介
      2.5.1  在虚拟环境python_env下启动PyCharm
      2.5.2  基于虚拟环境python_env的Python 3.8解释器创建一个.py文件
      2.5.3  试运行.py文件内的Python 3程序
    2.6  章末小结
第2部分  基础篇
  第3章  Python编程基础
    3.1  Python编程环境配置
      3.1.1  基于命令行/终端的交互式编程环境
      3.1.2  基于Web的交互式开发环境
      3.1.3  集成式开发环境
    3.2  Python基本语法
      3.2.1  赋值
      3.2.2  注释
      3.2.3  缩进
    3.3  Python数据类型
    3.4  Python数据运算
    3.5  Python流程控制
      3.5.1  分支语句

      3.5.2  循环控制
    3.6  Python函数设计
    3.7  Python面向对象编程
    3.8  Python编程库（包）导入
    3.9  Python编程综合实践
    3.10  章末小结
  第4章  pandas数据分析
    4.1  pandas环境配置
      4.1.1  使用Anaconda Navigator搭建和配置环境
      4.1.2  使用conda命令搭建和配置环境
    4.2  pandas核心数据结构
      4.2.1  Series
      4.2.2  DataFrame
    4.3  pandas读取/写入文件数据
      4.3.1  读取/写入CSV文件数据
      4.3.2  读取/写入JSON文件数据
      4.3.3  读取/写入Excel文件数据
    4.4  pandas数据分析的常用功能
      4.4.1  添加数据
      4.4.2  删除数据
      4.4.3  查询/筛选数据
      4.4.4  修改数据
      4.4.5  数据统计
      4.4.6  数据排序
      4.4.7  函数应用
    4.5  pandas数据合并
    4.6  pandas数据清洗
    4.7  pandas数据分组与聚合
    4.8  章末小结
  第5章  Scikit-learn单机机器学习
    5.1  Scikit-learn环境配置
      5.1.1  使用Anaconda Navigator搭建和配置环境
      5.1.2  使用conda命令搭建和配置环境
    5.2  Scikit-learn无监督学习
      5.2.1  降维学习与可视化
      5.2.2  聚类算法
    5.3  Scikit-learn监督学习模型
      5.3.1  分类预测
      5.3.2  数值回归
    5.4  Scikit-learn半监督学习模型
      5.4.1  自学习框架
      5.4.2  标签传播算法
    5.5  单机机器学习模型的常用优化技巧
      5.5.1  交叉验证
      5.5.2  特征工程
      5.5.3  参数正则化
      5.5.4  超参数寻优
      5.5.5  并行加速训练
    5.6  章末小结
第3部分  进阶篇

  第6章  PyTorch/TensorFlow/PaddlePaddle深度学习
    6.1  PyTorch/TensorFlow/PaddlePaddle环境配置
    6.2  前馈神经网络
      6.2.1  前馈神经网络的PyTorch实践
      6.2.2  前馈神经网络的TensorFlow实践
      6.2.3  前馈神经网络的PaddlePaddle实践
    6.3  卷积神经网络
      6.3.1  卷积神经网络的PyTorch实践
      6.3.2  卷积神经网络的TensorFlow实践
      6.3.3  卷积神经网络的PaddlePaddle实践
    6.4  循环神经网络
      6.4.1  循环神经网络的PyTorch实践
      6.4.2  循环神经网络的TensorFlow实践
      6.4.3  循环神经网络的PaddlePaddle实践
    6.5  自动编码器
      6.5.1  自动编码器的PyTorch实践
      6.5.2  自动编码器的TensorFlow实践
      6.5.3  自动编码器的PaddlePaddle实践
    6.6  神经网络模型的常用优化技巧
      6.6.1  随机失活
      6.6.2  批量标准化
    6.7  章末小结
  第7章  PySpark-ML分布式机器学习
    7.1  PySpark环境配置
      7.1.1  使用Anaconda Navigator搭建和配置环境
      7.1.2  使用conda命令搭建和配置环境
      7.1.3  安装JRE
    7.2  PySpark分布式数据结构
      7.2.1  RDD
      7.2.2  DataFrame
    7.3  PySpark分布式特征工程
      7.3.1  特征抽取
      7.3.2  特征转换
    7.4  PySpark-ML分布式机器学习模型
    7.5  分布式机器学习模型的常用优化技巧
      7.5.1  留一验证
      7.5.2  K-折交叉验证
    7.6  章末小结
第4部分  实践篇
  第8章  Kaggle竞赛实践
    8.1  泰坦尼克号罹难乘客预测
      8.1.1  数据分析
      8.1.2  数据预处理
      8.1.3  模型设计与寻优
      8.1.4  提交测试
    8.2  Ames房产价值评估
      8.2.1  数据分析
      8.2.2  数据预处理
      8.2.3  模型设计与寻优
      8.2.4  提交测试

    8.3  推特短文本分类
      8.3.1  数据分析
      8.3.2  数据预处理
      8.3.3  模型设计与寻优
      8.3.4  提交测试
    8.4  CIFAR-100图像识别
      8.4.1  数据分析
      8.4.2  数据预处理
      8.4.3  模型设计与寻优
      8.4.4  提交测试
    8.5  章末小结
  第9章  Git代码管理
    9.1  Git本地环境搭建
      9.1.1  Windows下Git工具的安装与配置
      9.1.2  macOS下Git工具的安装与配置
      9.1.3  Ubuntu下Git工具的安装与配置
    9.2  Git远程仓库配置
      9.2.1  GitHub介绍
      9.2.2  GitHub远程仓库的创建与配置
      9.2.3  Gitee介绍
      9.2.4  Gitee远程仓库的创建与配置
    9.3  Git基本指令
      9.3.1  克隆仓库
      9.3.2  提交修改
      9.3.3  远程推送
    9.4  Git分支管理
      9.4.1  创建分支
      9.4.2  分支合并
      9.4.3  合并冲突
      9.4.4  删除分支
    9.5  贡献Git项目
      9.5.1  Fork项目
      9.5.2  本地克隆、修改与推送
      9.5.3  发起拉取请求
    9.6  章末小结
后记

内容大纲

作者介绍

目录

同类热销排行榜

推荐书目