本周AI领域热点包括随机Transformer的可解释性研究,大模型的思考方式反思,AI评测平台的漏洞,以及强化学习与自动化提示。随机初始化的Transformer展现出意外的可解释性,挑战了传统理解;大语言模型被指欠思考,效率与深度需平衡;Chatbot Arena的投票作弊揭示平台设计漏洞。这些研究强调了模型解释、评估方法和安全性的改进需求。