Негізгі бет Transformer论文逐段精读

Күн бұрын

Transformer论文逐段精读

Рет қаралды 374,535

1 1

00:00 标题和作者
03:21 摘要
08:11 结论
10:05 导言
14:35 相关工作
16:34 模型
1:12:49 实验
1:21:46 讨论

Пікірлер: 191

@jasperlin1996
Жыл бұрын
謝謝大佬深入淺出又補充了不少相關知識真的是造福後進
@rikkatakanashi9703
Жыл бұрын
讲的非常清楚，非常感谢老师的讲解！！❤
@g1y5x3
9 күн бұрын
57:00 感觉是整个精读的精髓，谢谢老师！
@cici4148
2 жыл бұрын
最近刚好在学transformers有点疑惑老师讲得非常清晰问题迎刃而解感谢！
@testyoutubetest5910
Жыл бұрын
理解透彻，讲解深入浅出，还肯花时间录制视频，收下我的膝盖
@hw5622
2 ай бұрын
讲得真好，我反复读了好多遍了听你讲还能温故知新太棒了！谢谢李老师！
@user-qi6qi7rj3i
10 ай бұрын
感谢大佬的分享，非常的浅显易懂，能够很好的将以往的技术和论文中的架构设计结合起来去讲解，让听众能够明白为什么这样设计，以前是怎么设计，以前和现在的设计各自的优点和缺点是什么，视频中还有许多很直观的比喻，之前看原文真实看的一头雾水、不体系，正式因为看到一小段就需要去深入挖掘一些额外的知识才能继续阅读，这可能也是信息密度高的文章比较晦涩难懂的原因，还好有您的视频才让更多对AI、对模型感兴趣的人能够更好的学习这个领域的知识，感谢~^_^
@haoranding3324
9 ай бұрын
感谢大佬，真的是深入浅出！支持老师出更多视频！
@user-jw8bf7sx6z
Жыл бұрын
讲的太好了！非常适合我这样的小白学习。
@jinhuizhang702
2 жыл бұрын
太棒了，很喜欢精读论文系列
@alexsuen3506
8 ай бұрын
Thank you very much for you work, Dr. Li!
@zhengqingpei7136
2 ай бұрын
讲的太好了。我 AI 完全不懂，都可以理解你讲的。感谢！
@rampagetam9042
Жыл бұрын
解释得非常好，Thanks
@tuoli7266
Жыл бұрын
万分感谢! 期待您更多的作品
@Shyan68
Жыл бұрын
你的解說讓我的眼界更進一步了…
@tokyoaflowertokyo8300
Жыл бұрын
真有耐心啊，谢谢主播分享
@jiahangsu7100
9 ай бұрын
谢谢大佬的讲解，详细易懂～感谢感谢！
@DakerTT
Жыл бұрын
谢谢老师，很有价值的分享。褒奖的褒，念Bao（同保）。
@m13253
Жыл бұрын
哇，竟然有一个半小时的全程字幕。辛苦了。
@sephiroth0733
6 ай бұрын
感谢分享层层深入
@ryanwang7160
Ай бұрын
lz讲得真好，视频做得也很上心！一部视频tshirt换了好几次
@UTE2
Жыл бұрын
非常感谢您的分享！
@jinhuizhang702
2 жыл бұрын
太棒了受益匪浅
@misspanda5717
5 ай бұрын
在encoder中的自注意力可以计算所有的score（Q*K),encode中的mask是为了防止对输入序列中padding的数据计算分数。在decoder中mask是为了屏蔽“未来“的数据。
@amymu2731
Жыл бұрын
Very impressive! Thank you!
@LinnaDu
Жыл бұрын
大神讲的真是浅显易懂，切中要害，听了那么多版本的attenion，就您这版最好理解。感觉自己听懂了，明白了。非常感谢您的分享。
@senx8758
Жыл бұрын
李宏毅的更细节一些。
@wenwenzhang635
10 ай бұрын
宝藏博主！谢谢您的分享。想跟着博主学习更多ML的知识。
@justintw888
5 ай бұрын
聽了好幾遍，講得實在太好了！
@cancui1192
Ай бұрын
感谢，多年之后回来看还是有所收获。
@yewenli
Жыл бұрын
老师讲的太好了！深入浅出！
@muxingg
2 ай бұрын
非常棒！没有完全听懂，因为不是搞AI计算的，但是几十年前搞过并行算法的科学计算，很多东西是类比的。还是很有收获。大概需要多看几遍
@lilllllllllllll
9 ай бұрын
受益良多，期待更多分享。
@bennyzhao6577
Жыл бұрын
讲的太好了老师，谢谢！
@zyw2134
11 ай бұрын
感谢大神无私分享，拜谢~！
@xiaoxucao470
11 ай бұрын
谢谢老师，感谢大佬带我入门Transformer
@changken
Жыл бұрын
老師太神了
@shl9336
Ай бұрын
视频真的非常好
@rchenandrews2850
Ай бұрын
非常赞，讲得很清楚
@show_timemagic7030
Жыл бұрын
感谢老师分享
@fanyang2061
2 жыл бұрын
谢谢，讲得清晰明了
@jonathanwan5519
Жыл бұрын
真的太好了宝藏频道
@brycegu2245
9 ай бұрын
讲的是真的好
@zz_home
7 ай бұрын
非常有用,感謝大老
@user-vd5pr6ss5t
Жыл бұрын
感谢分享！
@greenshadowooo
3 ай бұрын
Thanks for detail explanation
@zhaohaiding9220
2 ай бұрын
再来看李老师的讲解，终于看懂了（差不多）
@TJVideoChannelUTube
Жыл бұрын
In Transformer model, only these layer types are involved in the deep learning/containing trainable parameters, and (3) with activation functions: (1). Word Embedding Layer; (2). Weighted matrices for K, V, Q; (3). Feed Forward Layer or Fully Connected Layer. Correct?
@jx92haha
Жыл бұрын
讲的太棒了！！必须点赞
@kennys4100
Ай бұрын
在LLM大规模发展应用的今天再回头来看这个，感叹核心技术对行业发展的强大推动力，还有就是大道至简
@yian4589
Жыл бұрын
谢谢很有裨益
@jazlynlin9995
2 жыл бұрын
讲得好细啊！超棒！
@NierAutomata2B
2 жыл бұрын
膜拜大神，认真学习！
@csctbadi
Жыл бұрын
真的不错！大神就是大神！
@allandogreat
11 ай бұрын
非常好，大学没有这么好的课程。沐神，身体健康
@user-un3ci9jp7s
10 ай бұрын
你在黑你大学的教学质量哈哈
@noonehere238
Жыл бұрын
讲的真好
@ilpreterosso
11 ай бұрын
太感谢啦！
@Fat_Cat_Fly
Жыл бұрын
感谢！
@hasszhao
2 ай бұрын
目前全网最优论文“解毒”保姆，小白这里佩服你。
@unclejoe666
Жыл бұрын
感谢大佬！
@zy5522
Жыл бұрын
感謝
@CasinoBaccaratKingmaker
Ай бұрын
了不起的成就與貢獻❤❤❤😂😂😂
@dannyp5358
Жыл бұрын
感謝！
@xwyangjshb2
11 ай бұрын
感谢🙏
@user-bn1rh9xm5h
Жыл бұрын
講的太好了，痛哭流涕啊
@terryliu3635
2 күн бұрын
THE BEST!!!
@JiancongXie
Жыл бұрын
感谢~~
@starbuckseric4038
Жыл бұрын
大佬您為何那麼晚才讓我看到您的影片太感激了
@otrees
Жыл бұрын
谢谢，老师，太帅了
@meiriweixin
5 ай бұрын
局外人发言。不小心搜到这个视频。视频看了一大半，觉得博主讲得好，心想这人一定自己懂很多，纳闷他会是哪个大学的计算机老师。原来是传说中的人物:)
@tongli4110
Жыл бұрын
感谢！！之前有一个点一直理解错了😂🤣
@derek142
2 ай бұрын
未看先感谢沐神~
@jameshao2270
Жыл бұрын
多谢！
@yingguo4174
Жыл бұрын
大神❤
@kururuhuang3829
Ай бұрын
感谢大佬
@user-bp3zf1rt3t
Жыл бұрын
厉害！
@user-sk3dr8nl9u
Жыл бұрын
一輪簽! 謝謝大大，讓我知識完備很多
@williamlee4215
10 ай бұрын
Very good
@user-lh3yi9fi7v
Жыл бұрын
辛苦辛苦
@joyyang1215
Жыл бұрын
Fully connected可以說是transformer的一種特殊型嗎?
@zioncheng7798
Жыл бұрын
Repect！感恩大佬
@gc7017
Жыл бұрын
1:18:30 左右，label smoothing应该是讲反了？应该是正确的category减0.1，然后其他category+原来正确的category分这0.1吧？
@SunsetSeaSmile
Жыл бұрын
请问能否用信息论的方式讲下Transformer，比如，信息如何从word embedding开始，逐步提炼浓缩到最后一层layer的过程
@ginawhalevg
Жыл бұрын
thanks!
@TreeForest2023
2 жыл бұрын
沐神阔以讲解下对比学习，无监督自监督类的文章吗？
@li-pingho1441
Жыл бұрын
太牛逼了！！！
@rufus9322
Жыл бұрын
想了解它的Embedding層是如何將詞轉換成512維度的向量的，網路上查Embedding似乎有很多做法，不清楚Transformer論文中的是哪一種?
@victorzhao212
Жыл бұрын
沐神，读论文一般用什么设备什么软件啊？
@lionhuang9209
2 жыл бұрын
Thanks.
@b95109028
Жыл бұрын
大老恕我爆粗口但是給予敬意：他媽的這種視頻都有。謝謝了
@btc-btc-net
Жыл бұрын
论文讲解这类题材很新颖，果断订阅点赞。
@user-jm5zo7hu8h
Жыл бұрын
4:53 褒（bao）义词
@baijiu_yaya
4 ай бұрын
33:40处，绿色的权重应该只与自身高度相关，与中间的向量应该不一定相关。
@sunwrighttrainingschool8138
2 жыл бұрын
加油
@andrewmeowmeow
2 жыл бұрын
感谢沐神的讲解! 请问沐神接下来有计划讲解一下Chelsea Finn的MAML吗？也想听一下沐神对于meta-learning的看法
@alphaprofold5707
2 жыл бұрын
而且为什么好像MAML有点停滞不前了？
@andrewmeowmeow
2 жыл бұрын
@@alphaprofold5707 Hello, MAML个人觉得在原本few-shot learning的领域上表现的一般，反而可能会在federated learning上有所发挥。具体MAML和meta-learning的发展我也没follow up了之前感兴趣的时候看了看
@knightleung
11 ай бұрын
非常好! 唯一有一点没讲太清楚的时候就是训练和预测的时候outputs sequence是具体怎么用的
@samuelleung9930
10 ай бұрын
这个视频还有前两集，它们在visualize上做得挺好的。
@user-ev2ix2rs3c
2 жыл бұрын
大神
@user-iq9cp1ht5w
Жыл бұрын
这简直是种享受，大佬教学确实不一样
@cy2340
Жыл бұрын
太好了, 反复看!!!!
@dan9898
Жыл бұрын
再生父母啊！！！！！！！！呜呜呜呜谢谢老师！！！
@fk304shimizu7
Жыл бұрын
哈哈这么夸张😅😅😅
@stevinwang2488
Жыл бұрын
恰到好处的表达了感谢之情
@ostensibly531
10 ай бұрын
父就可以了父母也。。。
@yujinhuang8112
2 жыл бұрын
So strong