-
内容大纲
随着信息技术的发展,大语言模型已然成为自然语言处理领域的重要基石,并持续推动着人工智能技术的进步和社会应用的拓展。学习语言模型课程不仅有利于个人专业成长,更能对社会进步和技术创新产生积极影响。人工智能及其大语言模型技术,是每个高校学生甚至社会人所必须关注、学习和重视的知识与现实。
本书介绍的大语言模型知识主要包括:概述、大模型基础、大模型的架构、数据标注、大模型预训练数据、大模型的开发组织、分布式训练、提示工程与微调、强化学习方法、基于大模型的智能体、大模型应用框架、技术伦理与限制、大模型的评估和大模型的健康未来等。
本书特色鲜明、易读易学,适合高等院校、职业院校的人工智能、信息技术相关专业学生学习,也适合对人工智能以及大语言模型相关领域感兴趣的读者阅读参考。 -
作者介绍
-
目录
前言
课程教学进度表
第1章 概述
1.1 人工智能基础
1.1.1 人工智能的定义
1.1.2 人工智能的实现途径
1.1.3 机器学习和深度学习
1.1.4 监督学习与无监督学习
1.2 大语言模型的定义
1.3 大语言模型形成基础
1.3.1 Blockhead思维实验
1.3.2 大模型的历史基础
1.3.3 基于Transformer模型
1.3.4 大模型的学习能力
1.3.5 大模型的世界模型问题
1.3.6 文化知识传递和语言支持
1.4 通用人工智能
1.4.1 什么是通用人工智能
1.4.2 大模型与通用人工智能
1.4.3 人工智能生成内容
[作业]
[实践与思考]了解典型的开源大语言模型
第2章 大模型基础
2.1 什么是语言模型
2.1.1 语言模型的定义
2.1.2 注意力机制
2.1.3 开源还是闭源
2.2 大模型发展三阶段
2.2.1 基础模型阶段
2.2.2 他力探索阶段
2.2.3 突破发展阶段
2.3 Transformer模型
2.3.1 Transformer过程
2.3.2 Transformer结构
2.3.3 Transformer模块
2.4 生成式预训练语言模型GPT
2.5 大模型的结构
2.5.1 LLaMA的模型结构
2.5.2 LLaMA的注意力机制
[作业]
[实践与思考]基于ChatGPT的免费工具:ChatAI小组件
第3章 大模型的架构
3.1 大模型生成原理
3.1.1 上下文学习
3.1.2 指令微调
3.1.3 零样本/少样本
3.1.4 深度学习架构
3.1.5 训练策略及优化技术
3.2 多模态语言模型
3.2.1 多模态指令微调
3.2.2 多模态上下文学习
3.2.3 多模态思维链
3.2.4 大模型辅助视觉推理
3.3 应用技术架构
3.3.1 指令工程
3.3.2 函数调用
3.3.3 检索增强生成
3.3.4 微调
……
第4章 数据标注
第5章 大模型预训练数据
第6章 大模型的开发组织
第7章 分布式训练
第8章 提示工程与微调
第9章 强化学习方法
第10章 基于大模型的智能体
第11章 大模型应用框架
第12章 技术伦理与限制
第13章 大模型的评估
第14章 大模型的健康未来
附录 作业参考答案
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...