节目

[人人能懂AI前沿] 从目标牵引、经验进化到群体学习

所属专辑: AI可可AI生活

主播:

爱可可爱生活

最近更新: 17小时前时长: 28:50

扫码下载蜻蜓app

听书/听小说/听故事

4.5亿用户的选择

你有没有想过，AI也会陷入“高水平重复”的舒适区陷阱？学习新知识后，它为什么会像我们一样“健忘”？本期节目，我们将通过几篇最新的AI论文，揭示如何让AI从一个只会“死记硬背”的学霸，进化成一个懂得“举一反三”、甚至会“团队作战”的智慧伙伴，探索让AI真正变得更聪明、更高效的秘密。

00:00:27 你是在“精进”，还是在“高水平地重复”？

00:04:49 AI上课后，为什么反而把以前会的给忘了？

00:11:08 让AI左右互搏，速度翻倍的秘密

00:16:02 你的“人工智障”客服，终于有救了？

00:22:16 AI进化论，从“二选一”到“团战”的效率革命

本期介绍的几篇论文：

[LG] Beyond Distribution Sharpening: The Importance of Task Rewards

[Mila]

https://arxiv.org/abs/2604.16259

---

[CL] Why Fine-Tuning Encourages Hallucinations and How to Fix It

[Hebrew University of Jerusalem & Technion – Israel Institute of Technology & University of Illinois Urbana-Champaign]

https://arxiv.org/abs/2604.15574

---

[LG] Faster LLM Inference via Sequential Monte Carlo

[Cornell University & MIT]

https://arxiv.org/abs/2604.15672

---

[CL] PolicyBank: Evolving Policy Understanding for LLM Agents

[Google Cloud]

https://arxiv.org/abs/2604.15505

---

[CL] GroupDPO: Memory efficient Group-wise Direct Preference Optimization

[CMU & Google Deepmind & Google]

https://arxiv.org/abs/2604.15602

还没有评论哦

蜻蜓FM倾听海量音频内容

蜻蜓FM网络收音机，囊括了国内外数千家网络广播，并与全国各大地方电台合作，将传统电台整合到网络电台中，为用户呈现前沿丰富的广播节目和电台内容，涵盖了有声小说、相声小品、新闻、音乐、脱口秀、历史、情感、财经、儿童、评书、健康、教育、文化、科技、电台等三十余个大分类。蜻蜓FM是多年来用户喜爱的音频应用，手机必装的应用！

关于蜻蜓联系我们公众平台开放平台加入我们隐私政策用户服务协议侵权投诉指引涉互联网算法推荐反馈算法备案信息公示

信息网络传播视听节目许可证：0922681网络出版服务许可证：（总）网出证（京）字第128号出版物经营许可证：新出发沪批字第N6911号

ICP经营许可证编号：沪B2-20040650企业工商信息公示

沪ICP备06026464号-4沪ICP备06026464号-6沪公网安备：31011502009349

跟帖评论自律管理承诺书举报受理和处置管理办法

上海互联网举报中心

手机端下载

微信公众号

新浪微博

回到顶部

[人人能懂AI前沿] 从目标牵引、经验进化到群体学习

该专辑其他节目