以下是Transformer模型学习路径所涉及到资料的链接。 1. What Are Transformer Models and How Do They Work?, txt.cohere.com/what-are-transformer-models/ 中文版 blog.csdn.net/shenyang2/article/details/131199513?spm=1001.2014.3001.5502 面向初学者的科普文章,不涉及到任何数学公式。本视频的内容也大部分来源于此。 2. The Illustrated Transformer, jalammar.github.io/illustrated-transformer/?ref=txt.cohere.com 中文版 blog.csdn.net/yujianmin1990/article/details/85221271 Transformer模型最出名的科普文章,介绍了模型的原理,架构还有数学公式。作者是Jay Alammar。 3。 Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT blog.csdn.net/v_JULY_v/article/details/127411638 周磊(July)的科普文章,更系统地介绍了模型和其所依赖的体系知识。 4。 从零实现Transformer、ChatGLM-6B、LangChain+LLM的本地知识库问答 blog.csdn.net/v_JULY_v/article/details/130090649 周磊(July)的科普文章,从代码实现的角度加深对模型的认识。而且更有ChatGLM和Langchain的代码分析。 5. Transformer论文逐段精读 kzitem.info/news/bejne/z7Cn0np_nHWEioY 李沐关于transformer论文的精彩视频解读。 6. Attention is All You Need arxiv.org/abs/1706.03762 Transformer模型的原始论文。 7. 世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能 zhuanlan.zhihu.com/p/632795115 张俊林对于LLM语言一些更深层次的思考和总结
Пікірлер