OpenAI Function Calling特性示例详解
作者:莫尔索随笔
Function Calling使用
OpenAI 在gpt-3.5-turbo-0613 和 gpt-4-0613两个模型的chat completion api中增加了一个叫 Function Calling 的新功能,本篇文章对其功能进行探究,并分析其作用。
我认为这是一种比Plugin更优雅的方式,给开发者提供了更多的自由度,一方面识别出何时需要调用函数来对输出格式化,一方面设定具体的格式化数据有助于接入后续业务逻辑。达到尽可能保证(注意这里,是根据你的函数描述最大可能保证,不能100%)LLM输出可控的基础上,来增强自己业务的目的。
show me code
下面以记账应用为例,告诉AI:“今天喝奶茶花了6元”,正常思路来说,交互流程应该是这样的:
- 用户输入prompt
- AI进行语义分析
- 返回结构化的数据(每个子项是什么,花费是多少)
- 拿到数据进行下一步操作
借助Function Calling,微调后的模型可以检测何时应该调用函数并使用符合函数签名的 JSON 进行响应,下面看代码例子👇
import openai import json from enum import Enum class BaseTool(Enum): Bookkeeping = "record_price" RecordingTask = "record_task" def record_price(category, price): print(category, price) # 记账应用 API print("记账成功!") def funtion_call_conversation(): response = openai.ChatCompletion.create( model="gpt-3.5-turbo-0613", messages=[ {"role": "user", "content": "今天喝奶茶花了6元"}, ], temperature=0, functions=[ { "name": BaseTool.Bookkeeping.value, "description": "bookkeeping assistant", "parameters": { "type": "object", "properties": { "category": { "type": "string", "description": "类目", }, "price": {"type": "string", "description": "金额"}, }, "required": ["category", "price"], }, } ], function_call="auto", ) message = response["choices"][0]["message"] if(message.get("function_call")): function_name = message["function_call"]["name"] if function_name == BaseTool.Bookkeeping.value: arguments = json.loads(message["function_call"]["arguments"]) record_price(arguments.get('category'), arguments.get('price'))
接口调用说明
- name字段表示要调用的函数名,description表示函数描述,paramters是一个符合JSON Schema格式的对象,用来描述这个函数的入参信息(让 LLM 读得懂的工具函数说明)
record_price是用来给Function Calling调用的函数,这个函数接收两个必填的参数,category类目(string类型),price金额(string类型)
functions=[ { "name": BaseTool.Bookkeeping.value, "description": "bookkeeping assistant", "parameters": { "type": "object", "properties": { "category": {"type": "string","description": "类目"}, "price": {"type": "string", "description": "金额"}, }, "required": ["category", "price"], }, } ],
LLM分析结果
LLM 分析后命中了函数签名描述,就会返回给我们 function_call 这个字段以及函数签名中我们预定义的相关信息:
{ "role": "assistant", "content": null, "function_call": { "name": "record_price", "arguments": "{\n \"category\": \"\u5976\u8336\",\n \"price\": \"6\u5143\"\n}" } }
- category返回给我们了类目是奶茶
- price识别出了金额是6元
接下来拿到参数,调用 record_price 进行记账的操作即可;如果没有命中函数签名描述,就不会返回function_call字段,也就不需要进行任何操作:
if(message.get("function_call")): function_name = message["function_call"]["name"] if function_name == BaseTool.Bookkeeping.value: arguments = json.loads(message["function_call"]["arguments"]) record_price(arguments.get('category'), arguments.get('price'))
按照这种思路,可以扩展自己的外部工具,比如发邮件,记录待办清单,让LLM变成私人管家。
AI记账应用设想
LLM 加持的记账应用设想,不需要打开记账软件写类目记金额👇:
- 直接对照Siri说“今天喝奶茶花了6元”
- 然后利用STT,转换为文本
- 利用上述程序提取类目和金额,调用记账API,记录成功
存在问题
- 函数描述是会被计入token的(果然魔法都是有成本的🤡
- 潜在的风险:分析不准确,出现无法命中函数签名描述的情况
参考
以上就是OpenAI Function Calling特性作用详解的详细内容,更多关于OpenAI Function Calling的资料请关注脚本之家其它相关文章!