-
内容大纲
本书是一本全面介绍开发与应用DeepSeek大模型的实战指南,旨在帮助读者全面掌握大模型的技术与应用。本书首先介绍DeepSeek的核心概念、功能及未来发展方向,随后深入探讨大模型部署的硬件要求、量化技术、推理速度优化等关键问题,并详细介绍Transforme架构和混合专家模型的理论基础。接着介绍了如何用Ollama和LMStudio等工具在本地部署DeepSeek-R1模型,并结合Cherry Studio构建本地知识库,实现智能问答和知识检索功能。此外,本书还介绍AnythingLLM和Chatbox等大模型应用构建平台,帮助读者扩展应用场景。针对API与程序库的使用,本书详细讲解Ollama的RESTful API、OpenAI兼容API以及相关程序库。最后,本书通过介绍多个实战项目(如代码注释翻译器、构建知识库、文章智能配图器、意图鉴别服务、多模态聊天机器人),使读者可以将理论知识应用于实际开发中,掌握大模型的核心技术。
本书通俗易懂,适合数据科学家、大模型开发者、应用开发者、相关专业学生以及技术爱好者阅读,无论是初学者还是有经验的开发者,都能从本书中获得有价值的知识和技能。 -
作者介绍
李宁 华为HDE(HUAWEI Developer Experts),UnityMarvel创始人,开放原子基金会银牌讲师,51CTO学堂金牌讲师,IT畅销书作者。从事软件研究和开发超过20年,长期从事编译器、人工智能、Python、JavaScript、Java及跨平台技术的研究和开发工作,曾出版超过40本IT图书。 -
目录
第1章 走进DeepSeek世界
1.1 什么是DeepSeek
1.1.1 DeepSeek的发展历程
1.1.2 DeepSeek的核心功能
1.1.3 DeepSeek的优势
1.1.4 DeepSeek与其他大模型的比较
1.2 DeepSeek能做什么
1.2.1 DeepSeek的应用场景
1.2.2 用DeepSeek做数学题
1.2.3 用DeepSeek编程
1.3 如何使用DeepSeek
1.3.1 DeepSeek的用户界面和基本操作
1.3.2 移动端DeepSeek App
1.3.3 DeepSeek API
1.4 DeepSeek的DeepSeek-R1模型和蒸馏模型
1.4.1 DeepSeek-R1模型的原理
1.4.2 蒸馏模型
1.5 DeepSeek的未来展望
1.5.1 DeepSeek的发展趋势和挑战
1.5.2 DeepSeek对AIGC领域和社会的影响
1.6 本章小结
第2章 DeepSeek大模型部署的硬件要求和技术
2.1 本地部署DeepSeek-R1的硬件条件
2.2 大模型到底需要多大的显存
2.2.1 模型量化与显存占用:不同“精度”的显存开销
2.2.2 激活参数与推理显存:生成token的“动态”消耗
2.2.3 多用户并发:显存需求的“乘法效应”
2.2.4 如何估算大模型推理的显存需求
2.3 精度与体积的权衡:揭示大模型量化的秘密
2.3.1 何谓模型量化:为大模型“精打细算”
2.3.2 精度标尺:FP32、FP16、Q8与Q4的“位之争”
2.3.3 参数、量化和蒸馏之间的关系
2.3.4 比特之内的秘密:量化参数的“庐山真面目”
2.4 存储带宽瓶颈:推理速度的限制
2.4.1 什么是存储带宽:数据传输的“高速公路”
2.4.2 存储带宽在大模型推理中的作用:将数据“喂”给计算单元
2.4.3 量化如何缓解存储带宽的压力:数据“瘦身”加速传输
2.4.4 优化技术与存储带宽:“多管齐下”提升效率
2.5 推理速度与延迟:除了显存,性能也很重要
2.5.1 推理速度与延迟:用户体验的“晴雨表”
2.5.2 影响推理性能的其他因素
2.5.3 CPU与GPU的协同:软硬结合,发挥最大效能
2.6 大模型背后的秘密武器:Transformer架构
2.6.1 从“注意力”机制开始:像人类一样思考
2.6.2 Transformer架构的基本结构:积木搭建的“变形金刚”
2.6.3 Transformer架构与硬件需求:“大力士”的胃口
2.7 DeepSeek中的MoE
2.7.1 MoE的基本原理
2.7.2 MoE的应用
2.7.3 DeepSeek的创新性MoE
2.8 本章小结
第3章 用Ollama本地部署DeepSeek-R1
3.1 Ollama简介
3.2 安装Ollama
3.3 Ollama支持的DeepSeek系列模型
3.4 用Ollama部署模型
……
第4章 用LM Studio本地部署DeepSeek-R1
第5章 用Cherry Studio建立本地知识库
第6章 更多的大模型应用构建平台
第7章 Ollama的RESTful API
第8章 Ollama程序库
第9章 Ollama OpenAl兼容API
第10章 llama.cpp实战
第11章 项目实战:代码注释翻译器
第12章 项目实战:构建知识库
第13章 项目实战:文章智能配图器
第14章 项目实战:意图鉴别服务
第15章 项目实战:多模态聊天机器人
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
