WebAgent是一个由LLMS驱动的真实世界网络导航代理,可以根据自然语言指令处理真实网站任务。团队通过采用局部全局注意力和在大规模HTML预料库上进行掌跨度驱造域训练,提出了新的HTML特定语言模型HTMLT5。HTMLT5显著提高了在真实网站中的成功率,并在mini-web++中比先前的LLM代理提高了14.9%。