书籍详情
《 大语言模型:原理与工程实践》[69]百度网盘|亲测有效|pdf下载
  • 大语言模型:原理与工程实践

  • 出版社:电子工业出版社
  • 作者:杨青
  • 出版时间:2024-03-01
  • 热度:2528
  • 上架时间:2025-03-08 06:13:50
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

作者知名:轩辕大模型负责人:真正的大语言模型实践者,拥有十亿、百亿、千亿等不同参数规模大语言模型的训练经验

 

系统性强:从数据处理的基础工作(如数据清洗与去重)讲起,逐步深入,探讨预训练、微调技术和强化对齐技术等核心技术环节。同时,书中对大语言模型评估策略及其应用技术架构,包括推理引导技术和动态交互技术,进行了全面且深入的探讨,确保读者能够从理论和技术角度全面理解大语言模型。

 

实践性强:精心设计了从零开始的教学章节,提供大语言模型微调的详细指导,逐步引领读者掌握关键技能。

 

本书不仅有助于初学者迅速上手,也为有经验的开发者提供了深入学习的机会

全彩印刷

 
内容简介

本书用10章对大语言模型进行全面且深入的介绍。

首先对大语言模型的基本概念进行介绍。其次,从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论,帮助读者深入了解大语言模型的构建和训练过程。然后,详细介绍有监督微调和强化对齐等技术,以及如何评估大语言模型的性能。此外,介绍提示工程和工程实践等方面的内容,帮助读者了解大语言模型的应用和实际操作过程。最后,介绍如何从零开始微调大语言模型,辅以代码示例,帮助读者更好地应用这些技术。

通过阅读本书,读者可以获得全面且深入的大语言模型的知识框架。

作者简介
杨青
度小满金融技术委员会执行主席、数据智能应用部总经理,度小满AI Lab负责人,硕士毕业于清华大学计算机系,曾就职于百度、阿里巴巴,从事自然语言处理、搜索、推荐、大数据架构等相关方向的研发工作。

2018年年初加入度小满金融,组建数据智能部和AI Lab团队,从0到1构建度小满金融的智能引擎核心算法,深耕计算机视觉、自然语言处理、图模型、机器学习、因果推断等技术领域,多篇文章被EMNLP、ACL、CIKM等国际会议收录,“智能化征信解读中台”工程荣获吴文俊人工智能科技进步奖。相关技术广泛应用于度小满营销、经营、风控、反欺诈全流程业务场景,为上千万客户提供稳定、安全的金融服务。
目  录
目 录
1 解锁大语言模型1
1.1 什么是大语言模型·1
1.2 语言模型的发展·2
1.3 GPT 系列模型的发展·3
1.4 大语言模型的关键技术·4
1.5 大语言模型的涌现能力·5
1.6 大语言模型的推理能力·5
1.7 大语言模型的缩放定律·6
参考文献·7
2 大语言模型基础技术·8
2.1 语言表示介绍·8
2.1.1 词表示技术·8
2.1.2 分词技术·9
前  言
缘起:为什么要写这本书
OpenAI的ChatGPT自推出以来,迅速成为人工智能领域的焦点。ChatGPT在语言理解、生成、规划及记忆等多个维度展示了强大的能力。这不仅体现在对特定任务的高效处理上,更重要的是,它在处理多样化任务和复杂场景中的灵活性显著,甚至能在一定程度上模拟人类的思考方式。这种能力的展现,标志着人工智能从专注于单一任务的传统模型向通用人工智能转变,其强大的能力将对千行百业产生深远影响,尤其在优化业务流程和重塑组织结构方面。

然而,在研究和实践过程中,我们遇到了一个主要挑战:市场上缺乏大语言模型在实际应用方面的资料。现有的资料多聚焦于理论研究,而具体的实践方法多被保密,难以获得实际操作的指导。为了填补这一空白,我们历经一年的实践和探索,决定分享我们的经验和成果,旨在为大语言模型的初学者和实践者提供快速入门和应用的途径。

相关推荐