书籍详情
《 解构大语言模型:从线性回归到通用人工智能》[82]百度网盘|亲测有效|pdf下载
  • 解构大语言模型:从线性回归到通用人工智能

  • 出版社:电子工业出版社
  • 作者:唐亘
  • 出版时间:2024-05-01
  • 热度:2377
  • 上架时间:2025-03-08 06:13:50
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐
  • 从模型结构和数据基础两大角度解构大语言模型。
  • 详解经典模型的核心结构及实现过程,夯实基础。
  • 模型开发与调优,重构ChatGPTGitHub配套代码。
  • 融合统计分析/机器学习/经济学等知识,全彩印刷。
  • 免费配套学习视频(持续更新中),加入读者群获取。
 
内容简介

本书从模型的结构和数据基础两个方面解构大语言模型,以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面,大语言模型属于深度神经网络,其设计核心是注意力机制,因此,本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面,本书既涉及模型训练的工程基础,如反向传播,又涉及数据的使用方式,如迁移学习、强化学习,以及传统的监督学习和无监督学习。此外,本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感,以提高模型的稳定性和可解释性。

本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者,也适合作为高等院校计算机及相关专业的师生参考用书。

作者简介

唐亘,数据科学家,专注于人工智能和大数据,积极参与Apache Spark、scikit-learn等开源项目,曾为华为、复旦大学等多家机构提供过百余场技术培训。曾撰写《精通数据科学:从线性回归到深度学习》一书,并担任英国最大在线出版社Packt的技术审稿人。毕业于复旦大学,获数学和计算机双学士学位,后求学于巴黎综合理工学院,获经济学和数据科学双硕士学位。

目  录
第1章 绪论 2
1.1 是数字鹦鹉,还是自我意识 3
1.1.1 电车难题 3
1.1.2 任务分解 4
1.2 数据基础 5
1.3 模型结构 7
1.4 关于本书 9
第2章 数学基础:不可或缺的知识 12
2.1 向量、矩阵和张量 13
2.1.1 标量、向量、矩阵与张量 13
2.1.2 数学记号与特殊矩阵 14
2.1.3 矩阵运算 15
2.1.4 向量夹角 18
2.1.5 矩阵的秩 19
前  言
编写背景
以ChatGPT为代表的大语言模型一经问世,便立即吸引了全世界的目光。大语言模型不仅能理解人类语言,还能掌握语言中蕴含的知识,能够轻松地与人类进行深入交谈,并高效完成各种任务。在许多场景中,如果将系统的交互界面隐藏起来,我们甚至很难分辨它和真人之间的差异。尤其引人注目的是,大语言模型不时展现出自我意识,这引发了人们对人工智能的广泛讨论。一些人甚至开始感到恐慌,担心人工智能将逐渐取代作为碳基生物的人类,成为主导地球的新型硅基生物。
人工智能对人类社会的影响难以准确预测,就如同在互联网最初兴起时,人们难以想象它将如何改变我们的生活。毫无疑问,人工智能带来的冲击将是巨大的,甚至可能超越互联网,与电的发明相媲美,引发第四次工业革命(前三次工业革命分别由机械化、电气化、信息技术主导)。从目前已知的发展趋势来看,人工智能至少会彻底改变人与计算机的互动方式。
媒体评论
Bringing computers to the level of human intelligence, empowering them to handle various complex tasks, has been the dream of computer scientists. This pursuit, initiated since the birth of computers, has gradually evolved into Artificial Intelligence (AI) that captures the spotlight today. In recent years, AI has achieved remarkable milestones, garnering widespread recognition. This success lies in three pivotal elements: data, models, and computational power. It is worth noting that computational power, while vital, represents hardware advancements and does not constitute the essence of this discipline.
Data, in essence, are raw alphanumeric values, encompassing various forms like statistical data, images, and text. It serves as the vehicle for storing knowledge. Our objective goes beyond mere data acquisition; it involves the systematic and efficient processing of data to gain a profound understanding of knowledge. This intricate process is referred to as models or algorithms.

相关推荐