本书涵盖了从梯度下降的基础知识一直到使用HuggingFace库微调大型自然语言处理模型(BERT和GPT-2)。它分为四个部分——第一部分:基础知识(梯度下降,在PyTorch中训练线性和逻辑回归);第二部分:计算机视觉(更深层次的模型和激活函数、卷积、迁移学习、初始化方案);第三部分:序列(RNN、GRU、LSTM、序列到序列模型、注意力、自注意力、转换器);第四部分:自然语言处理(词元化、嵌入、上下文词嵌入、ELMo、BERT、GPT-2)。 该书以三卷的形式呈现给大家,第一部分为第一卷,第二部分为第二卷,第三部分和第四部分为第三卷。 在第三卷中,您将了解与序列相关的所有内容:循环神经网络及其变体、序列到序列模型、注意力、自注意力和转换器。本卷还包括有关自然语言处理的速成教程,从单词词元化的基础知识一直到使用HuggingFace库微调大型模型(BERT和GPT-2)。本卷比其他两卷要求更高,如果您已经对深度学习模型有扎实的理解,您会更喜欢它。这其中包括: ?循环神经网络(RNN、GRU和LSTM)和一维卷积。 ?序列到序列模型、注意力、掩码和位置编码。 ?转换器、层归一化和视觉转换器(ViT)。 ?BERT、GPT-2、词嵌入和HuggingFace库。