代理方法现在很热门,因为单个 LLM 模型似乎仅限于点工具应用。每个这样的应用程序都令人印象深刻,但仍然是我们想要自动化的更复杂的推理任务链中的一个步骤,代理方法应该在其中大放异彩。我一直听说软件工程 (SWE) 团队在 AI 采用方面比硬件团队进步得更快,因此认为对状态进行快速现实检查会很有用。本着这个想法的精神,我使用 Gemini Deep Research 来寻找本文的来源,有选择地抽样它提供的一些调查,同时添加一些我自己的发现。我的快速总结是,首先,什么算作进步取决于应用:基于便利性的使用模型在