深圳商报•读创客户端首席记者 魏沛娜
什么是语言人工智能?
如何理解DeepSeek的底层原理?
《图解大模型》一书以图文并茂的方式,全面介绍了语言模型(large language model,LLM)领域,涵盖了理论基础和实践应用两个方面。
全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分“理解语言模型”,解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分“使用预训练语言模型”,介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第三部分“训练和微调语言模型”,探讨大模型的训练与微调方法,包括嵌入模型的构建、分类任务的优化及生成式模型的微调,以适应特定需求。

《图解大模型》
[沙特] 杰伊·阿拉马尔 [荷] 马尔滕·格鲁滕多斯特 著
李博杰 译
中国工信出版集团 人民邮电出版社
2025年5月
本书由工程研究员杰伊·阿拉马尔和临床数据科学家马尔滕·格鲁滕多斯特合著。资料介绍,杰伊·阿拉马尔是DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。马尔滕·格鲁滕多斯特也是DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者,同时还是BERTopic等开源大模型软件包作者。
本书作者指出,语言模型已经对世界产生了深远的影响。通过使机器更好地理解和生成人类语言,LLM在人工智能(artificial intelligence,AI)领域开创了新的可能性,并影响了众多行业。“本书独特地结合了直观理解、实际应用和图解风格,我们希望那些想探索LLM这一激动人心的领域的读者能够通过本书打下坚实的基础。”
本书作者介绍,本书的主要目标是帮助读者直观地理解LLM。语言人工智能(Language AI)领域发展迅猛,试图紧跟最新技术让人很有“压力”。因此,他们将重点放在LLM的基础知识上,致力于提供一个轻松、有趣的学习过程。为了实现这种以直观理解为先的理念,本书大量运用视觉语言。插图将帮助读者对LLM学习过程中的主要概念和流程建立直观认识。
“在AI研究中持续涌现中国智慧的当下,本书的出版恰逢其时。中文版新增附录——探讨性能卓越的DeepSeek-R1模型——反映了大语言模型领域的快速演进。我们相信,对于深耕AI研究和应用前沿的中国从业者而言,新增内容具有重要的参考价值。新增内容既体现了全球技术趋势,也展现了来自中国AI社区的突出成果。”本书作者在中文版序中如此表示。
对于本书,微软亚洲研究院院长周礼栋如此评价道:“这是一本少见的将原理讲解、实践操作与直观图示融合得如此出色的入门书。中文版由技术功底深厚的李博杰老师精心翻译,并特别补充了DeepSeek原理介绍的内容,展现出对技术本质与时代脉搏的双重把握,是理解生成式AI这一核心技术变革的重要起点。”