领域大模型构建指南：通用大模型垂直化的方法与实践

编号:: wx1204364810

销售价:: ￥78.32; (市场价: ~~￥89.00~~)

赠送积分:: 78

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

（1）核心价值：系统讲解如何将通用大模型高效改造为行业大模型（领域专家）的完整方法论，强调实战性，从理论到实践全流程覆盖。
（2）专家背书：南京大学计算机系胡昊教授、百丽时尚集团副总裁季燕利、滴普科技董事长赵杰辉、南京大学软件学院匡宏宇副教授四位权威专家联袂推荐。
（3）实战验证：作者深度参与百丽时尚集团等大型企业AI项目建设，书中所有案例均来自真实商业项目，经过复杂业务场景的实战检验。
（4）独创方法：首创训练飞轮、左右脑架构、MCTS高级推理系统三大企业级解决方案，这是市面上其他书籍无法提供的差异化价值。
（5）完整体系：建立CPT+SFT+DPO三位一体的模型定制方法论，从持续预训练到监督微调再到偏好对齐，层层递进构建领域专属模型。
（6）快速落地：RAG架构是目前企业应用中性价比最高、落地最快的技术路径，本书深入讲解核心技术并提供完整实战项目。
（7）工程实践：涵盖数据集生成、分布式训练、模型部署与量化等关键工程实践，确保模型能从实验室真正走向生产环境。
（8）思维跃迁：不仅教授技术操作，更注重系统设计思维的培养，助你完成从技术工匠到AI解决方案建筑师的职业跃迁。

内容简介
这是一部系统讲解如何将通用大模型高效改造为领域专家的实战著作。全书以“基础—RAG—模型训练—企业实战”为主线，完整覆盖了RAG架构、持续预训练（CPT）、监督微调（SFT）、偏好对齐（DPO）、分布式训练、模型部署，以及训练飞轮、左右脑架构、MCTS高级推理系统等前沿企业级解决方案，得到了学术界和企业界多位专家的一致推荐。
本书作者在滴普科技任职期间，深度参与了百丽时尚集团等大型企业的AI智能解决方案建设，在真实、复杂的一线业务中积累了丰富经验。本书正是这些经过实战检验的方法与思考的系统化呈现，不仅教授技术操作，更致力于培养读者的系统设计思维，帮助其完成从“工匠”到“建筑师”的角色跃迁，将大模型的巨大潜能转化为各领域不可替代的核心竞争力。
全书共18章，分为四个部分：
第一部分（第1~3章）大模型技术基础及实践应用
系统介绍大模型与领域模型的基本概念、技术原理及使用场景，讲解开发环境的搭建方法，并通过聊天机器人实战案例演示大模型在文本翻译、信息提取、归纳总结等场景中的应用，为后续深入学习奠定坚实基础。
第二部分（第4~8章） RAG原理与实战
深入讲解RAG的架构原理与实践技巧，涵盖内容索引、嵌入模型、向量数据库、相关内容检索、结果精排、多查询检索、多向量检索等核心技术，并通过完整的RAG实战项目串联离线索引与在线服务的全流程，这个流程是当前企业应用中性价比最高、落地最快的技术路径。
第三部分（第9~13章）模型训练
全书的理论核心与精华所在，建立了一套完整的模型定制方法论。系统讲解CPT、SFT、DPO三种层层递进的训练技术，以及数据集生成、分布式训练、模型部署与量化等关键工程实践，包含多个实战项目，确保模型能从实验室真正走向应用。
第四部分（第14~18章）企业大模型实战
引导读者完成从“工匠”到“建筑师”的角色跃迁。系统介绍企业大模型的构建蓝图与训练飞轮方法论，深入讲解左右脑架构的设计与实现，并通过引入MCTS等前沿技术构建高级推理系统，最后以单店和多店运营分析等真实业务场景进行完整的实战演练。

陈峰，资深AI技术专家，就职于滴普科技，深度参与百丽时尚集团等大型企业的高级数据智能解决方案建设，在领域大模型的构建与落地方面积累了丰富的一线实战经验。致力于将通用大模型转化为企业核心竞争力，在RAG架构、模型训练、训练飞轮、左右脑架构、MCTS高级推理系统等方面有深入的研究与实践。著有《ClickHouse性能之巅：从架构设计解读性能之谜》等书，维护有微信公众号“峰少的技术空间”。

目录 序一 序二 前言 第一部分　大模型技术基础 及实践应用 第1章　大模型和领域模型基础2 1.1　大模型基础3 1.1.1　大模型的基本概念3 1.1.2　大模型的使用场景9 1.1.3　当前大模型面临的几个挑战10 1.2　领域模型基础11 1.2.1　领域模型概述11 1.2.2　领域模型和通用大模型的关系12 1.2.3　领域模型解决的问题12 1.2.4　领域模型的两大技术路线 　　　及其优劣势13 1.3　本章小结14 第2章　搭建开发环境15 2.1　开发环境概述15 2.2　所需软硬件介绍15 2.2.1　PyTorch15 2.2.2　英伟达显卡与CUDA16 2.2.3　Apple M系列芯片和MPS16 2.3　在Windows下搭建开发环境17 2.3.1　安装Anaconda17 2.3.2　创建虚拟环境18 2.3.3　安装PyTorch19 2.3.4　安装集成开发环境及依赖包19 2.4　在macOS下搭建开发环境21 2.4.1　安装Homebrew21 2.4.2　安装Anaconda22 2.4.3　配置开发环境22 2.5　在Linux下搭建开发环境22 2.5.1　Miniconda简介22 2.5.2　安装Miniconda23 2.5.3　配置开发环境23 2.6　本章小结23 第3章　快速上手：大模型在聊天 　　　　机器人中的实践25 3.1　聊天机器人的需求25 3.2　使用公网服务搭建聊天机器人26 3.2.1　申请OpenAI API密钥26 3.2.2　申请Helicone服务27 3.3　案例：聊天机器人的大模型实践27 3.3.1　聊天机器人27 3.3.2　通过提示词实现文本翻译机器人29 3.3.3　通过提示词实现信息提取30 3.3.4　通过提示词实现归纳总结31 3.4　本章小结32 第二部分　RAG原理与实战 第4章　RAG架构介绍34 4.1　RAG架构解决的三大问题34 4.1.1　大模型训练语料库中语料不足34 4.1.2　大模型知识更新难35 4.1.3　大模型的泛化能力不足35 4.2　RAG架构解决问题的4个手段35 4.2.1　文本向量化35 4.2.2　采用向量数据库36 4.2.3　相似度检索37 4.2.4　回答生成37 4.3　RAG架构的一般模型37 4.3.1　文档切割器38 4.3.2　嵌入模型39 4.3.3　向量数据库39 4.3.4　大模型40 4.4　本章小结40 第5章　内容索引41 5.1　内容切分41 5.1.1　内容切分的三大难点41 5.1.2　内容切分的三大技术手段42 5.2　嵌入模型43 5.2.1　嵌入模型的三大优势43 5.2.2　常用嵌入模型44 5.3　实战案例45 5.4　本章小结46 第6章　相关内容检索47 6.1　相关内容检索概述47 6.2　向量数据库48 6.2.1　本地向量数据库Chroma48 6.2.2　在线向量数据库Pinecone48 6.2.3　本地向量数据库ClickHouse48 6.3　结果精排49 6.3.1　结果精排概述49 6.3.2　结果精排的意义49 6.3.3　结果精排的技术手段50 6.4　本章小结51 第7章　大模型整合及优化手段52 7.1　大模型整合方案52 7.2　多查询检索54 7.2.1　问题背景：单一查询的局限性54 7.2.2　核心流程与实现55 7.3　多向量检索56 7.3.1　实现策略57 7.3.2　核心流程与实现58 7.4　本章小结59 第8章　RAG实战60 8.1　实战准备60 8.1.1　需求描述60 8.1.2　架构设计61 8.1.3　技术选型61 8.2　离线索引62 8.2.1　文档格式转换62 8.2.2　文档切片62 8.2.3　文档索引63 8.3　在线服务63 8.3.1　召回搜索64 8.3.2　大模型服务64 8.4　本章小结65 第三部分　模型训练 第9章　模型训练概述68 9.1　为什么需要进行模型训练69 9.1.1　RAG架构的3个限制69 9.1.2　模型训练的3个优势69 9.1.3　模型定制的3个阶段70 9.2　开源模型一览70 9.2.1　ChatGLM71 9.2.2　Llama71 9.2.3　Vicuna72 9.2.4　通义千问Qwen72 9.3　模型分类72 9.3.1　按模型规模划分72 9.3.2　按模型功能划分73 9.4　实战：开源模型私有化部署74 9.5　本章小结76 第10章　数据集生成77 10.1　数据集分类77 10.1.1　预训练数据集78 10.1.2　指令微调数据集78 10.1.3　对话数据集79 10.1.4　偏好数据集81 10.1.5　指令微调数据集和对话 　　　　　　　数据集的对比82 10.2　对话数据集生成的技巧82 10.2.1　搜索并基于现有数据集 　　　　　　　进行修改83 10.2.2　针对一段文本生成数据集83 10.3　应用聊天模板85 10.3.1　聊天模板的种类86 10.3.2　聊天模板的使用87 10.4　实战：基于文档生成对话数据集87 10.5　本章小结89 第11章　模型训练的方法和流程91 11.1　模型训练方法一览91 11.1.1　CPT91 11.1.2　SFT92 11.1.3　偏好对齐92 11.1.4　3种训练方法的区别93 11.2　模型训练的一般流程94 11.2.1　选择一个预训练模型95 11.2.2　准备数据集96 11.2.3　CPT99 11.2.4　SFT100 11.2.5　偏好对齐100 11.3　模型训练的硬件需求及 　　　　　环境搭建101 11.3.1　不同规模模型训练的 　　　　　　　硬件需求101 11.3.2　环境搭建103 11.3.3　训练过程中需要关注的指标103 11.4　实战1：训练一个开源对话模型111 11.5　实战2：使用自己的代码训练 　　　　　　一个GitHub Copilot113 11.5.1　单向模型的局限114 11.5.2　FIM简介115 11.5.3　FIM的原理115 11.5.4　相关代码115 11.6　实战3：使用PEFT进行 　　　　　　LoRA训练131 11.7　实战4：进行CPT训练132 11.8　实战5：DPO训练139 11.9　本章小结143 第12章　分布式模型训练144 12.1　相关硬件设备144 12.1.1　NVLink145 12.1.2　IB交换机145 12.1.3　IB网卡146 12.2　相关的软件环境146 12.2.1　NCCL146 12.2.2　nload146 12.2.3　DeepSpeed146 12.3　基本的多机多卡网络拓扑结构147 12.4　实战：多机多卡训练148 12.4.1　DeepSpeed配置文件149 12.4.2　主机文件152 12.4.3　启动脚本153 12.5　本章小结154 第13章　模型部署155 13.1　Transformers不能用于生产的 　　　　　 3个原因155 13.2　相关技术与框架156 13.2.1　分页注意力156 13.2.2　vLLM157 13.2.3　TGI157 13.3　实战代码157 13.4　模型量化158 13.4.1　量化的种类159 13.4.2　量化的格式159 13.5　本章小结160 第四部分　企业大模型实战 第14章　企业大模型概述162 14.1　从通用到专用：企业大模型 　　　的构建蓝图162 14.1.1　起点：通用基础大模型162 14.1.2　目标：企业大模型163 14.1.3　现实鸿沟：从理想到实践 　　　　　　　的挑战166 14.2　企业大模型的技术工具箱： 　　　　　应对挑战的原子能力166 14.2.1　工具一：模型训练166 14.2.2　工具二：RAG167 14.2.3　工具三：企业数据仓库集成168 14.2.4　工具四：CoT169 14.2.5　工具五：PoT170 14.3　前瞻：从工匠到建筑师174 14.4　本章小结175 第15章　训练飞轮法：打造可持续 　　　　　迭代的模型体系176 15.1　方法论概述176 15.1.1　企业大模型落地的训练 　　　　飞轮法177 15.1.2　训练飞轮法的核心理念177 15.1.3　方法论的价值和意义178 15.2　第一阶段：场景甄选与分析179 15.2.1　场景甄选的意义180 15.2.2　场景评估维度180 15.2.3　典型适配场景案例分析183 15.3　第二阶段：快速验证与数据积累184 15.3.1　阶段定位与目标184 15.3.2　核心技术手段184 15.3.3　数据积累187 15.4　第三阶段：能力内化189 15.4.1　训练基础与策略189 15.4.2　数据集来源191 15.4.3　三阶段渐进式训练法191 15.4.4　训练效果评估与优化194 15.4.5　迭代195 15.5　本章小结195 第16章　左右脑架构：实现语言 　　　　与工具的协同197 16.1　大模型技术的能力边界197 16.1.1　实时数据处理198 16.1.2　精确的计算能力199 16.1.3　业务规则的执行199 16.1.4　外部系统集成200 16.2　架构整体设计201 16.2.1　架构设计原则201 16.2.2　整体架构图202 16.2.3　组件间的协作机制203 16.3　左脑设计204 16.3.1　PoT实现204 16.3.2　企业数据接入能力207 16.4　右脑设计：文本生成与知识 　　　融合的艺术211 16.4.1　大模型的选择和应用211 16.4.2　企业知识库的设计要点213 16.5　脑干设计214 16.5.1　脑干的定位与重要性214 16.5.2　脑干的工作原理216 16.6　架构的演进与展望220 16.6.1　架构演进的驱动力及未来 　　　　优化方向220 16.6.2　左右脑架构的迭代路径222 16.7　本章小结224 第17章　高级推理系统：从任务执行 　　　　　到战略决策226 17.1　现有推理的瓶颈：从CoT的 　　　演进与局限谈起226 17.1.1　CoT的演进：反思式推理 　　　　的出现227 17.1.2　新的工程瓶颈：效率黑盒与 　　　　路径偶然性227 17.1.3　结论：企业级应用需要结构化 　　　　的规划框架228 17.2　提升单步推理质量：用广度 　　　推理增强鲁棒性228 17.2.1　广度推理与自洽性228 17.2.2　广度推理的工程实践228 17.2.3　广度推理的局限：从单点 　　　　优化到全局规划229 17.3　规划全局路径：用MCTS实现 　　　深度推理229 17.3.1　MCTS的核心原理229 17.3.2　MCTS：从单步思考到全局 　　　　规划的跃迁232 17.3.3　MCTS的适用场景232 17.4　MCTS的实现方式234 17.4.1　隐式MCTS的实现234 17.4.2　显式MCTS的实现235 17.5　深度推理实战：MCTS的 　　　威力展示250 17.5.1　基础报告251 17.5.2　MCTS报告253 17.5.3　两份报告的对比256 17.6　本章小结257 第18章　企业大模型实战项目258 18.1　单店运营分析258 18.1.1　需求分析259 18.1.2　技术实现259 18.1.3　训练飞轮的应用261 18.2　多店运营分析264 18.2.1　需求分析264 18.2.2　技术实现265 18.2.3　脑干模块实现265 18.3　本章小结267

商品参数

基本信息
出版社	机械工业出版社
ISBN	9787111805816
条码	9787111805816
编者	陈峰著
译者
出版年月	2026-04-01 00:00:00.0
开本	16开
装帧	平装
页数	268
字数	340
版次	1
印次	1
纸张

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]