欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大模型工程师面试(算法原理开发实践与系统部署)
      • 作者:苏宏博//温智凯|责编:王金柱
      • 出版社:清华大学
      • ISBN:9787302703778
      • 出版日期:2025/10/01
      • 页数:364
    • 售价:47.6
  • 内容大纲

        本书系统梳理了大模型工程师岗位所需的理论基础与实战技能,围绕算法原理、开发实践与系统部署三大维度展开内容介绍,旨在帮助希望转型为大模型工程师的开发者成功通过面试。本书共12章,首先简要介绍大模型技术演进、岗位分类与典型面试策略,并深入讲解数据构建、预处理、Token管理、Prompt设计与语料增强等底层准备环节。随后,系统剖析大模型的预训练机制、核心算法、微调策略与架构演化路径,包括Transformer原理、LoRA/QLoRA技术栈、RLHF流程、多任务损失建模、MoE专家机制等前沿内容,辅以经典论文与面试热点解析。最后,面向工程实战与面试应战,涵盖Agent系统构建、RAG检索架构、MCP通信协议、多智能体A2A协作机制、私有部署与CI/CD流程、安全评估与性能监控等系统集成能力,并辅以面试专项题库,全面提升面试者在真实求职场景中的技术表达能力与答题策略。
        本书理论与实战并重,案例紧贴业界真实应用场景,特别强调面试导向与项目落地能力的结合。适合有一定AI基础、希望进入大模型领域的软件工程师、算法工程师、系统架构师,以及准备求职或转型到大模型领域的初中级从业者和高年级研究生。
  • 作者介绍

  • 目录

    第1章  大模型发展简史与岗位解析
      1.1  大模型简史
        1.1.1  何为大模型
        1.1.2  大模型技术底座:从N-Gram到Transformer
        1.1.3  商业大模型汇总
        1.1.4  大模型发展现状
      1.2  大模型岗位全解析
        1.2.1  大模型算法工程师
        1.2.2  大模型开发工程师
        1.2.3  大模型数据工程师
        1.2.4  大模型推理部署工程师
        1.2.5  大模型垂直领域微调工程师
        1.2.6  不同岗位的技术侧重点与面试策略
      1.3  国内外代表性公司及其技术栈
        1.3.1  OpenAI、Anthropic与Mistral
        1.3.2  通义千问、文心一言与豆包
        1.3.3  智谱AI、盘古大模型与讯飞星火
        1.3.4  DeepSeek、X Grok与Claude
        1.3.5  各大厂使用的主流框架对比
      1.4  常见面试备考策略分析
        1.4.1  技术广度与技术深度
        1.4.2  简历项目表征与亮点挖掘
        1.4.3  刷题?论文?还是项目经验
        1.4.4  大模型领域常见面试提问类型汇总
      1.5  本章小结
      1.6  经典面试题自测
    第2章  大模型数据集构建及预处理流程分析
      2.1  预训练数据集构建
        2.1.1  详解C4、Pile、BooksCorpus
        2.1.2  中文数据集与中英文对齐
        2.1.3  文本清洗与重复率控制
        2.1.4  多轮对话数据与RLHF语料生成
      2.2  数据预处理与分词机制
        2.2.1  Tokenization策略对比(BPE、Unigram)
        2.2.2  SentencePiece与Tokenizer
        2.2.3  Token长度分布与上下文截断
      2.3  模型输入格式与批处理机制
        2.3.1  Prompt模板与Instruction格式
        2.3.2  Padding、Masking与Attention机制
        2.3.3  Sliding Window与Chunking机制
        2.3.4  动态Batch构建与GPU负载优化
      2.4  数据增强与数据预微调
        2.4.1  经典数据增强:样本扩增与反事实生成
        2.4.2  Few-shot语料设计原则
        2.4.3  蒸馏数据与学生-教师模型
        2.4.4  二次构造:社交语料、问答语料
      2.5  本章小结
      2.6  经典面试题自测
    第3章  大模型预训练核心原理
      3.1  Transformer结构解析

        3.1.1  Self-Attention机制实现
        3.1.2  多头注意力与参数分布
        3.1.3  Position Embedding方式对比
        3.1.4  层归一化与残差连接设计
      3.2  损失函数与训练目标
        3.2.1  语言建模目标(MLM与CLM)
      ……
    第4章  大模型部署与推理优化
    第5章  大模型微调技术
    第6章  大模型核心架构简介
    第7章  有关大模型经典论文的面试热点解析
    第8章  基于大模型的智能体系统
    第9章  RAG系统构建与知识检索
    第10章  MCP协议与A2A通信机制
    第11章  项目工程化与系统集成实战
    第12章  高频面试题深度解析