读创今日荐书 | 如何理解大模型底层技术？

深圳商报•读创客户端首席记者魏沛娜

什么是语言人工智能？

如何理解DeepSeek的底层原理？

《图解大模型》一书以图文并茂的方式，全面介绍了语言模型(large language model，LLM)领域，涵盖了理论基础和实践应用两个方面。

全书分为三部分，依次介绍语言模型的原理、应用及优化。第一部分“理解语言模型”，解析语言模型的核心概念，包括词元、嵌入向量及Transformer架构，帮助读者建立基础认知。第二部分“使用预训练语言模型”，介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展，提升模型的应用能力。第三部分“训练和微调语言模型”，探讨大模型的训练与微调方法，包括嵌入模型的构建、分类任务的优化及生成式模型的微调，以适应特定需求。

**《图解大模型》**
**[沙特] 杰伊·阿拉马尔 [荷] 马尔滕·格鲁滕多斯特著**
**李博杰译**
**中国工信出版集团人民邮电出版社**
**2025年5月**

本书由工程研究员杰伊·阿拉马尔和临床数据科学家马尔滕·格鲁滕多斯特合著。资料介绍，杰伊·阿拉马尔是DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。马尔滕·格鲁滕多斯特也是DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者，同时还是BERTopic等开源大模型软件包作者。

本书作者指出，语言模型已经对世界产生了深远的影响。通过使机器更好地理解和生成人类语言，LLM在人工智能(artificial intelligence，AI)领域开创了新的可能性，并影响了众多行业。“本书独特地结合了直观理解、实际应用和图解风格，我们希望那些想探索LLM这一激动人心的领域的读者能够通过本书打下坚实的基础。”

本书作者介绍，本书的主要目标是帮助读者直观地理解LLM。语言人工智能(Language AI)领域发展迅猛，试图紧跟最新技术让人很有“压力”。因此，他们将重点放在LLM的基础知识上，致力于提供一个轻松、有趣的学习过程。为了实现这种以直观理解为先的理念，本书大量运用视觉语言。插图将帮助读者对LLM学习过程中的主要概念和流程建立直观认识。

“在AI研究中持续涌现中国智慧的当下，本书的出版恰逢其时。中文版新增附录——探讨性能卓越的DeepSeek-R1模型——反映了大语言模型领域的快速演进。我们相信，对于深耕AI研究和应用前沿的中国从业者而言，新增内容具有重要的参考价值。新增内容既体现了全球技术趋势，也展现了来自中国AI社区的突出成果。”本书作者在中文版序中如此表示。

对于本书，微软亚洲研究院院长周礼栋如此评价道：“这是一本少见的将原理讲解、实践操作与直观图示融合得如此出色的入门书。中文版由技术功底深厚的李博杰老师精心翻译，并特别补充了DeepSeek原理介绍的内容，展现出对技术本质与时代脉搏的双重把握，是理解生成式AI这一核心技术变革的重要起点。”

本文分类：实时讯息
浏览次数：0 次浏览
本文链接：https://www.rrbk.net/news/1lJkXWRg48.html

上一篇 > 廊坊经洽会观察：跨境电商如何赋能产业出海？
下一篇 > 太恶心！知名茶饮被曝喝出青蛙！

读创今日荐书 | 如何理解大模型底层技术？

热门文章

最新推荐