节目

[论文品读]意图条件流占用模型

所属专辑: AI可可AI生活
最近更新: 6小时前时长: 08:56
AI可可AI生活
扫码下载蜻蜓app
听书/听小说/听故事
4.5亿用户的选择
节目简介

[LG] Intention-Conditioned Flow Occupancy Models  
C Zheng, S Park, S Levine, B Eysenbach  
[Princeton University & UC Berkeley]  
本文提出的Intention-Conditioned Flow Occupancy Models (InFOM)通过创新性地结合潜在意图推断与基于流匹配的未来状态占有率建模,并在预训练中优化ELBO、在微调中使用隐式广义策略改进,成功地从未标记的异构离线数据中学习到了能够显著提升下游任务性能的RL基础模型,特别是在处理用户意图多样性和长期时间依赖性方面展现了巨大潜力。
https://arxiv.org/abs/2506.08902     

评论
还没有评论哦

该专辑其他节目

回到顶部
/
收听历史
清空列表