加州大学伯克利分校与微软研究院联合开发的Gorilla,是一款专为增强AI模型实用性的创新工具。这款模型能够依据用户的自然语言指令,智能选择合适的API执行相应任务,实现AI间的高效协作与整合,为AI领域开辟了新的应用可能。
大型语言模型(LLM)在对话模拟、数学推理与程序合成等领域展现卓越能力,但受限于存储信息量与静态计算图,面对快速变化的世界仍需定期更新。通过赋予LLM使用工具的能力,我们能扩展其知识范围与计算能力,使其适应更广阔且动态多变的知识空间。
为提升LLM性能,引入搜索技术与数据库,研究显示这能显著增强模型能力。此外,提供计算工具使LLM能够执行复杂计算任务。市场领先的LLM供应商已开始提供API接口,允许用户通过API调用外部工具,从而将计算基础设施和网络作为主要交互界面。
面对网络上数以百万计的API,Gorilla通过自指示微调与检索技术,精准选择合适的API。该模型基于LLaMA-7B构建,能够根据API文档和大量重叠工具作出决策。Gorilla构建了APIBench数据集,通过广泛集成API并使用自指示生成用户提问prompt,实现对LLM的全面训练。
数据集由HuggingFace、Torch Hub与TensorFlow Hub的API组成,经过精心筛选与转换,涵盖不同领域与功能,旨在泛化到各类RESTful API调用。通过自指示生成API调用示例,Gorilla实现了对API调用任务的微调,有效提升了功能正确性与减少了幻觉错误。
Gorilla的问世为AI领域带来了革命性变革,通过优化API调用流程,不仅提升了模型效率与实用性,也为未来AI系统的整合与协同合作铺平道路。随着技术的持续发展,Gorilla及其同类工具有望在推动AI应用的边界、促进跨领域知识共享与加速技术创新方面发挥关键作用。