今天分享一篇阿里的利用Agent思想做工具调用的文章,标题为《Small LLMs Are Weak Tool Learners: A Multi-LLM Agent》。其提出的多LLM代理微调框架,将工具调用拆解为三个agent(Planner、Caller、Summarizer),并结合一个二阶段的微调策略。对比单个LLM表现更为出色,性能也更为稳定,并且能够超过像ChatGPT、GPT4等闭源模型,证明了多agent思路在工具调用上的有效性。
除了工具调用,或许本文的方法也可以拓展到问答的其他场景,大家可以参考。
Title: Small LLMs Are Weak Tool Learners: A Multi-LLM Agent URL: https://arxiv.org/abs/2401.07324
Code: https://github.com/X-PLUG/Multi-LLM-Agent
Authors: Weizhou Shen, Chenliang Li, Hongzhan Chen, Ming Yan, Xiaojun Quan, Hehong Chen, Ji Zhang, Fei Huang
1 Motivation
Figure 2: An illustration of how α-UMi works to complete a task.
规划器(Planner):α-UMi 框架中的规划器组件负责生成任务执行的逻辑和计划。它根据当前系统状态和用户指令来决定下一步的操作。规划器的输出包括一个理由(Rationale)和一个决策,决策可能是: