Күн бұрын

【人工智能】OpenAI o1模型背后的技术 | 后训练阶段的缩放法则 | 测试时计算 | 慢思考 | 隐式思维链CoT | STaR | Critic模型 | 大语言模型的天花板在哪里

Рет қаралды 6,888

北京时间9月13日的午夜，OpenAI发布了o1系列模型，在数学、代码、长程规划等问题上，取得了显著的提升。今天我们主要来聊聊o1背后的一些技术，尤其是后训练阶段的缩放法则，Post-Training Scaling Law，它的出现，可能会引发我们对于算力分配、后训练能力的重新思考。
参考资料：
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters
arxiv.org/abs/...
STaR: Bootstrapping Reasoning With Reasoning arxiv.org/abs/...
Self-critiquing models for assisting human evaluators
arxiv.org/pdf/...
Training Verifiers to Solve Math Word Problems arxiv.org/pdf/...
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking arxiv.org/abs/...
#人工智能 #scalinglaws #o1 #cot #llm #openai
成为此频道的会员，即可享受提前一天，观看频道最新发布视频的福利：
/ @bestpartners

Жүктеу

Пікірлер: 19

@corgirun7892
Күн бұрын
大飞这几篇论文实在太赞了，这种内容我是愿意付费的。 1. Training Verifiers to Solve Math Word Problems 2. STaR: Bootstrapping Reasoning With Reasoning 3. Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
@bestpartners
22 сағат бұрын
谢谢，我一会把参考文献和链接都更新上
@YanLiu-f1k
13 сағат бұрын
着几篇论文只能做个大概的了解，真正的技术资料是不会以论文的形式公开的。
@hiucollo2402
Күн бұрын
Thank you 大飞一口氣看到尾 ☘ 😄 🌺 😇 🀄 😃 ☕ 😁 🌸 😀 🏵 🌺 💐 🧧 🎉
@sophontec2822
18 сағат бұрын
模型是如何处理自身知识中的逻辑不一致性呢？
@jhuang1519
19 сағат бұрын
大飞这个动画做的很好是PPT么
@deter3
15 сағат бұрын
通用智能体就是个虚幻的悖论. 你见过有任何现存的智能体，全方位都行吗？这个世界是专业智能合作的规律. 朝着通用智能体就是一条不归路.
@user-djelwJsskI8964
13 сағат бұрын
那你怎么做知识的串联和创新？人类是能够轻而易举做到这件事情的。
@deter3
12 сағат бұрын
@@user-djelwJsskI8964 多个专业模型合作完成一个多个复杂工作. 有专门创新的模型.
@tomduan1988
10 сағат бұрын
AI 不就是为了超越现存智能体而存在的吗？要是现存智能体已经能做到了还要AI干什么？你这个逻辑根本不通啊。现在AI研究者拿着最高的工资，有着最好的学历和最高的智商，背靠几乎无尽的资本，是不是不归路他们不比你清楚？
@jhuang1519
9 сағат бұрын
@@user-djelwJsskI8964 人类是怎么做的呢
@pensularnaseeare9531
Күн бұрын
我怀疑现在的大模型记忆了太多没什么意义的知识了，说不定哪天模型就是纯粹靠合成数据来进行预训练，一个小但是会思考的模型在外来会更有用
@user-djelwJsskI8964
13 сағат бұрын
你这说的就是用大模型来蒸馏出小模型，已经在做了
@chrischrisloook
Күн бұрын
然後以後就跟人一樣分左腦和右腦。
@locookies5634
22 сағат бұрын
你有点想法
@skyacaniadev2229
18 сағат бұрын
不光分左脑右脑，还要分各种脑区
@singo1232001
Күн бұрын
ai皆數
@alexyoung3609
Күн бұрын
第一✌️
@scchen2011
Күн бұрын
第三

【1天吃10頓免費餐廳】搭郵輪可以玩多爽？行李公斤數無上限！日本長崎+韓國濟州島一次買到爆~ #挪威奮進號 #雄獅旅遊 #郵輪 #日本旅遊 #韓國旅遊

AI Pioneer Shows The Power of AI AGENTS - "The Future Is Agentic"

So Cute 🥰

Don't Toss The Apple Worm🍏, A Tasty Treat For Birds!🐦 #catvideos #catmemes #trending

Minecraft Creeper Family is back! #minecraft #funny #memes

Girl, dig gently, or it will leak out soon.#funny #cute #comedy

Deep Dive and Review of OpenAI's New Model o1 【Model Review 12】

【人工智能】AI会给人类带来一场认知革命么 | Reid Hoffman | Paypal创始人硅谷著名投资人 | 放大人类认知 | 元工具 | 认知GPS | 大模型多样性 | 拥抱AI

Why this top AI guru thinks we might be in extinction level trouble | The InnerView

【闲聊】失望！苹果IPhone16、华为Mate XT | IPhone 16尺寸变大 | A18处理器 | 毫无亮点 | Mate XT三折叠手机 | 天工铰链火箭钢 | 装逼神器

Google 创始人CEO Eric 斯坦福大学演讲爆料AI内幕

【人工智能】100亿个机器人的未来世界 | Brett Adcock|Figure AI CEO最新访谈 | Figure 02升级优化 | 机器人将解放人类劳动力 | 中国机器人崛起 | 集体型学习

Why Agent Frameworks Will Fail (and what to use instead)

iPhone 16/16 Pro Review: A18 is Actually Good!

Generative AI in a Nutshell - how to survive and thrive in the age of AI

【商业】IBM为何关闭中国研发中心 | CDL&CSL两部门三分钟遭清洗 | 上千人被解雇 | 竞争力下滑 | 数据监管 | 去IOE | 温水煮青蛙 | 外企纷纷撤出中国 | 蓝色大象还能跳舞么

So Cute 🥰

【人工智能】OpenAI o1模型背后的技术 | 后训练阶段的缩放法则 | 测试时计算 | 慢思考 | 隐式思维链CoT | STaR | Critic模型 | 大语言模型的天花板在哪里

Пікірлер: 19