- 大语言模型基础(微课视频版)/21世纪人工智能创新与应用丛书
- - 作者：编者:周苏//杨武剑|责编:张玥
  - 出版社：清华大学
  - ISBN：9787302672869
  - 出版日期：2024/09/01
  - 页数：215
- 售价：23.92

内容大纲
    大语言模型（简称大模型）是一种基于深度学习技术的先进人工智能模型，特别适用于理解和生成自然语言文本，它具有文生文、文生图、文生视频甚至未来的文生X等多种多模态形式。大模型的多功能性和通用性，使其能够在未经专门训练的情况下处理多种类型的自然语言任务。随着技术的发展，大模型已经成为自然语言处理领域的重要基石，并持续推动着人工智能技术的进步和社会应用的拓展。学习大模型课程不仅有利于个人专业成长，更能对社会进步和技术创新产生积极影响。人工智能及其大模型技术，是每个高校学生甚至社会人必须关注、学习和重视的知识与现实。
    本书介绍的大模型知识主要包括大模型基础、模型与生成式AI、大模型架构、人工数据标注、大模型预训练数据、大模型开发组织、提示工程与微调、强化学习方法、大模型智能体、大模型应用框架、技术伦理与限制、大模型产品评估等。
    本书特色鲜明，易读易学，适合高等院校计算机、大数据、人工智能等相关专业学生学习，也适合对人工智能以及大模型相关领域感兴趣的读者阅读参考。
作者介绍
目录
第1章  大模型基础
  1.1  人工智能基础
    1.1.1  人工智能的实现途径
    1.1.2  机器学习和深度学习
    1.1.3  监督与无监督学习
  1.2  大模型定义
    1.2.1  模型预训练和微调
    1.2.2  大模型的特征
    1.2.3  大模型的优势
  1.3  大模型技术的形成
    1.3.1  Blockhead思维实验
    1.3.2  大模型的历史基础
    1.3.3  基于Transformer模型
    1.3.4  大模型的世界模型问题
    1.3.5  文化知识传递和语言支持
  1.4  通用人工智能
    1.4.1  什么是通用人工智能
    1.4.2  大模型与通用人工智能
    1.4.3  人工智能生成内容
  【作业】
  【实践与思考】了解典型的开源大模型
第2章  大模型与生成式AI
  2.1  什么是语言模型
    2.1.1  语言模型的定义
    2.1.2  注意力机制
    2.1.3  开源还是闭源
  2.2  大模型发展三阶段
    2.2.1  基础模型阶段
    2.2.2  能力探索阶段
    2.2.3  突破发展阶段
  2.3  Transformer模型
    2.3.1  Transformer过程
    2.3.2  Transformer结构
    2.3.3  Transformer模块
  2.4  生成式人工智能
    2.4.1  生成式AI定义
    2.4.2  生成式AI层次
    2.4.3  生成式预训练语言模型GPT
  【作业】
  【实践与思考】基于ChatGPT的免费工具：ChatAI小组件
第3章  大模型架构
  3.1  大模型生成原理
    3.1.1  上下文学习
    3.1.2  指令微调
    3.1.3  零样本/少样本
    3.1.4  深度学习架构
    3.1.5  训练策略及优化技术
    3.1.6  所谓世界模型
  3.2  多模态语言模型
    3.2.1  多模态指令微调

    3.2.2  多模态上下文学习
    3.2.3  多模态思维链
    3.2.4  大模型辅助视觉推理
  3.3  大模型的结构
    3.3.1  LLaMA的模型结构
    3.3.2  LLaMA的注意力机制
  3.4  应用技术架构
    3.4.1  指令工程
    3.4.2  函数调用
    3.4.3  检索增强生成
    3.4.4  微调
  3.5  OpenAI的Sora大模型
    3.5.1  Sora技术报告分析
    3.5.2  Sora的主要技术特点
    3.5.3  Sora的模型训练过程
  【作业】
  【实践与思考】熟悉阿里云大模型“通义千问”
第4章  人工数据标注
  4.1  知识表示方法
    4.1.1  知识的概念
    4.1.2  知识表示的定义
    4.1.3  知识表示的过程
  4.2  什么是数据标注
  4.3  数据标注分类
    4.3.1  图像标注
    4.3.2  语音标注
    4.3.33  D点云标注
    4.3.4  文本标注
  4.4  制定标注规则
  4.5  执行数据标注
  4.6  标注团队管理
  【作业】
  【实践与思考】熟悉百度大模型“文心一言”
第5章  大模型预训练数据
  5.1  数据来源
    5.1.1  通用数据
    5.1.2  专业数据
  5.2  数据处理
    5.2.1  质量过滤
    5.2.2  冗余去除
    5.2.3  隐私消除
    5.2.4  词元切分
  5.3  数据影响分析
    5.3.1  数据规模
    5.3.2  数据质量
  5.4  典型的开源数据集
    5.4.1  Pile数据集
    5.4.2  ROOTS数据集
  5.5  训练集、验证集、测试集的异同
    5.5.1  训练、验证与测试数据集的不同之处

    5.5.2  训练、验证与测试数据集的相似之处
  5.6  数据集面临的挑战
    5.6.1  规模和质量待提升
    5.6.2  大模型与数据集相辅相成
    5.6.3  标准规范需健全
    5.6.4  存储性能待提高
  【作业】
  【实践与思考】熟悉Globe Explorer智能搜索引擎
第6章  大模型开发组织
  6.1  大模型开发流程
  6.2  大模型的数据组织
    6.2.1  数据采集
    6.2.2  数据清洗和预处理
    6.2.3  数据标注
    6.2.4  数据集划分
    6.2.5  模型设计
    6.2.6  模型初始化
    6.2.7  模型训练
    6.2.8  模型验证
    6.2.9  模型保存
    6.2.10  模型测试
    6.2.11  模型部署
  6.3  分而治之的思想
    6.3.1  分布式计算
    6.3.2  消息传递接口（MPI）
    6.3.3  MapReduce模型
    6.3.4  批处理和流处理
  6.4  分布式训练与策略
    6.4.1  什么是分布式训练
    6.4.2  数据并行性
    6.4.3  模型并行性
    6.4.4  流水线并行性
    6.4.5  混合并行
    6.4.6  分布式训练集群架构
  【作业】
  【实践与思考】熟悉科大讯飞大模型“讯飞星火认知”
第7章  提示工程与微调
  7.1  什么是提示工程
    7.1.1  提示工程的原理
    7.1.2  提示工程应用技术
    7.1.3  提示的通用技巧
  7.2  大模型为什么要微调
  7.3  提示学习和语境学习
    7.3.1  提示学习
    7.3.2  语境学习
  7.4  上下文窗口扩展
  7.5  指令数据的构建
    7.5.1  手动构建指令
    7.5.2  自动构建指令
    7.5.3  开源指令数据集

  7.6  微调及其PEFT流行方案
    7.6.1  微调技术路线
    7.6.2  提示微调
    7.6.3  前缀微调
    7.6.4  LoRA
    7.6.5  QLoRA
  【作业】
  【实践与思考】文生图：注册使用Midjourney绘图工具
第8章  强化学习方法
  8.1  强化学习的概念
    8.1.1  强化学习的定义
    8.1.2  不同于监督和无监督学习
    8.1.3  不同于传统机器学习
    8.1.4  大模型的强化学习
    8.1.5  先验知识与标注数据
  8.2  强化学习基础
    8.2.1  基于模型与免模型环境
    8.2.2  探索与利用
    8.2.3  片段还是连续任务
    8.2.4  网络模型设计
  8.3  强化学习分类
    8.3.1  从奖励中学习
    8.3.2  被动与主动强化学习
    8.3.3  学徒学习
  8.4  深度强化学习
  【作业】
  【实践与思考】熟悉文生视频大模型Sora
第9章  大模型智能体
  9.1  智能体和环境
  9.2  智能体的良好行为
    9.2.1  性能度量
    9.2.2  理性
  9.3  环境的本质
    9.3.1  指定任务环境
    9.3.2  任务环境的属性
  9.4  智能体的结构
    9.4.1  智能体程序
    9.4.2  学习型智能体
    9.4.3  智能体组件的工作
  9.5  构建大模型智能体
  9.6  人工智能内容生成（AIGC）
    9.6.1  内容孪生
    9.6.2  内容编辑
  【作业】
  【实践与思考】人形机器人创业独角兽Figure AI
第10章  大模型应用框架
  10.1  大模型哲学问题
    10.1.1  组成性
    10.1.2  天赋论与语言习得
    10.1.3  语言理解与基础

    10.1.4  世界模型
    10.1.5  知识传递和语言支持
  10.2  大模型应用流程
    10.2.1  确定需求大小
    10.2.2  数据收集
    10.2.3  数据集预处理
    10.2.4  大模型预训练
    10.2.5  任务微调
    10.2.6  部署
  10.3  大模型应用场景
    10.3.1  机器翻译、文本理解与分析
    10.3.2  自然语言生成
    10.3.3  搜索与知识提取
    10.3.4  代码开发
    10.3.5  检测和预防网络攻击
    10.3.6  虚拟助理和客户支持
    10.3.7  SEO关键词优化
  10.4  案例：Magic突破Q算法
  【作业】
  【实践与思考】精通垃圾分类的ZenRobotics机器人
第11章  技术伦理与限制
  11.1  人工智能面临的伦理挑战
    11.1.1  人工智能与人类的关系
    11.1.2  人与智能机器的沟通
  11.2  数据隐私保护对策
    11.2.1  数据主权和数据权问题
    11.2.2  数据利用失衡问题
    11.2.3  构建隐私保护伦理准则
    11.2.4  健全道德伦理约束机制
  11.3  人工智能伦理原则
    11.3.1  职业伦理准则的目标
    11.3.2  创新发展道德伦理宣言
    11.3.3  欧盟可信赖的伦理准则
  11.4  大模型的知识产权保护
    11.4.1  大模型的诉讼案例
    11.4.2  大模型生成内容的知识产权保护
    11.4.3  尊重隐私，保障安全，促进开放
    11.4.4  边缘群体的数字平等
  【作业】
  【实践与思考】完全由人工智能完成的视觉艺术品无法获得版权
第12章  大模型产品评估
  12.1  模型评估概述
  12.2  大模型评估体系
    12.2.1  知识与能力
    12.2.2  伦理与安全
    12.2.3  垂直领域评估
  12.3  大模型评估实践
    12.3.1  基础模型评估
    12.3.2  学习模型评估
  12.4  大模型产品对比

  12.5  大模型的大趋势
  【作业】
  【实践与思考】大模型横向对比测试实践
附录A  作业参考答案
附录B  课程学习与实践总结
参考文献

内容大纲

作者介绍

目录

同类热销排行榜

推荐书目