首个大规模使用工具的大模型来了：伯克利发布Gorilla

07:00

加州大学伯克利分校与微软研究院联合开发的Gorilla，是一款专为增强AI模型实用性的创新工具。这款模型能够依据用户的自然语言指令，智能选择合适的API执行相应任务，实现AI间的高效协作与整合，为AI领域开辟了新的应用可能。

大型语言模型（LLM）在对话模拟、数学推理与程序合成等领域展现卓越能力，但受限于存储信息量与静态计算图，面对快速变化的世界仍需定期更新。通过赋予LLM使用工具的能力，我们能扩展其知识范围与计算能力，使其适应更广阔且动态多变的知识空间。

为提升LLM性能，引入搜索技术与数据库，研究显示这能显著增强模型能力。此外，提供计算工具使LLM能够执行复杂计算任务。市场领先的LLM供应商已开始提供API接口，允许用户通过API调用外部工具，从而将计算基础设施和网络作为主要交互界面。

面对网络上数以百万计的API，Gorilla通过自指示微调与检索技术，精准选择合适的API。该模型基于LLaMA-7B构建，能够根据API文档和大量重叠工具作出决策。Gorilla构建了APIBench数据集，通过广泛集成API并使用自指示生成用户提问prompt，实现对LLM的全面训练。

数据集由HuggingFace、Torch Hub与TensorFlow Hub的API组成，经过精心筛选与转换，涵盖不同领域与功能，旨在泛化到各类RESTful API调用。通过自指示生成API调用示例，Gorilla实现了对API调用任务的微调，有效提升了功能正确性与减少了幻觉错误。

Gorilla的问世为AI领域带来了革命性变革，通过优化API调用流程，不仅提升了模型效率与实用性，也为未来AI系统的整合与协同合作铺平道路。随着技术的持续发展，Gorilla及其同类工具有望在推动AI应用的边界、促进跨领域知识共享与加速技术创新方面发挥关键作用。