节目

[人人能懂] 从思想直连、逻辑闭环到奖励校准

所属专辑: AI可可AI生活

主播:

爱可可爱生活

最近更新: 14小时前时长: 28:47

扫码下载蜻蜓app

听书/听小说/听故事

4.5亿用户的选择

你有没有想过，两个AI协作，能不能像科幻片里那样，直接“心灵感应”？我们又该如何判断，AI给出的正确答案，究竟是真懂了还是蒙对了？本期节目，我们将通过几篇最新论文，一起探索AI如何学会“读心术”进行合作，如何像侦探一样构建“逻辑闭环”，甚至如何从答案出发“倒着想”来优化学习。我们还会揭示AI为何会“越学越笨”，以及最聪明的AI或许拥有的终极能力——知道何时该“举手求助”。

00:00:36 当机器学会了“读心术”

00:05:58 你是怎么对的？比“你对不对”更重要

00:10:35 先有答案，再有过程：AI推理的逆向工程学

00:16:33 AI越学越笨？我们可能一开始就教错了

00:22:49 聪明人的超能力：知道何时该“求助”

本期介绍的几篇论文：

[CL] Thought Communication in Multiagent Collaboration

[CMU & Meta AI & MBZUAI]

https://arxiv.org/abs/2510.20733

---

[LG] DAG-Math: Graph-Guided Mathematical Reasoning in LLMs

[ University of Warwic & Google DeepMind & UC Berkeley]

https://arxiv.org/abs/2510.19842

---

[LG] No Compute Left Behind: Rethinking Reasoning and Sampling with Masked Diffusion Models

[Columbia University & New York University]

https://arxiv.org/abs/2510.19990

---

[LG] KL-Regularized Reinforcement Learning is Designed to Mode Collapse

[New York University & EPFL]

https://arxiv.org/abs/2510.20817

---

[CL] Ask a Strong LLM Judge when Your Reward Model is Uncertain

[Georgia Institute of Technology & Amazon]

https://arxiv.org/abs/2510.20369

还没有评论哦

蜻蜓FM倾听海量音频内容

蜻蜓FM网络收音机，囊括了国内外数千家网络广播，并与全国各大地方电台合作，将传统电台整合到网络电台中，为用户呈现前沿丰富的广播节目和电台内容，涵盖了有声小说、相声小品、新闻、音乐、脱口秀、历史、情感、财经、儿童、评书、健康、教育、文化、科技、电台等三十余个大分类。蜻蜓FM是多年来用户喜爱的音频应用，手机必装的应用！

关于蜻蜓联系我们公众平台开放平台加入我们隐私政策用户服务协议侵权投诉指引涉互联网算法推荐反馈算法备案信息公示

信息网络传播视听节目许可证：0922681网络出版服务许可证：（总）网出证（京）字第128号出版物经营许可证：新出发沪批字第N6911号

ICP经营许可证编号：沪B2-20040650企业工商信息公示

沪ICP备06026464号-4沪ICP备06026464号-6沪公网安备：31011502009349

跟帖评论自律管理承诺书举报受理和处置管理办法

上海互联网举报中心

手机端下载

微信公众号

新浪微博

回到顶部

[人人能懂] 从思想直连、逻辑闭环到奖励校准

该专辑其他节目