你有没有想过,一个真正聪明的AI,应该具备哪些超能力?本期节目,我们将一口气看懂五篇最新的AI论文。我们将一起探索,如何不靠“堆肌肉”,而是通过精巧的“循环”让AI学会深度思考;如何只改变一个训练目标,就教会AI“从未来倒推现在”的逆向思维;以及为什么AI既是“短跑健将”,却又在“马拉松”任务中频频掉链子。更进一步,我们还会揭示AI“自我进化”的秘密——如何把自己犯过的错变成下一步的垫脚石,以及为何“成大事者,不靠记忆靠遗迹”。准备好了吗?让我们一起开启这场关于AI智慧的深度探索之旅!
00:00:45 人工智能的“内功”心法
00:05:41 教AI做事,为什么不能只看眼前?
00:10:24 为什么AI既聪明,又“靠不住”?
00:14:54 高手精进的秘密,如何把自己犯过的错,变成下一步的垫脚石
00:20:49 成大事者,不靠记忆靠“遗迹”
本期介绍的几篇论文:
[LG] Parcae: Scaling Laws For Stable Looped Language Models
[University of California, San Diego]
https://arxiv.org/abs/2604.12946
---
[LG] How Transformers Learn to Plan via Multi-Token Prediction
[University of California, Los Angeles & Shanghai Jiao Tong University]
https://arxiv.org/abs/2604.11912
---
[LG] LongCoT: Benchmarking Long-Horizon Chain-of-Thought Reasoning
[University of Oxford & Lawrence Livermore National Laboratory (LLNL)]
https://arxiv.org/abs/2604.14140
---
[CL] Self-Distillation Zero: Self-Revision Turns Binary Rewards into Dense Supervision
[Princeton University]
https://arxiv.org/abs/2604.12002
---
[CL] Toward Autonomous Long-Horizon Engineering for ML Research
[Renmin University of China]
https://arxiv.org/abs/2604.13018