位置: IT常识 - 正文

ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样)

编辑:rootadmin
ChatGPT API接口使用+fine tune微调+prompt介绍 目录1 接口调用1.1 生成key1.2 接口功能1.2.1 图片生成 (image generation)1.2.2 对话(chat)1.2.3 中文纠错 (Chinese Spelling Correct)1.2.4 关键词提取 (keyword extract)1.2.5 抽取文本向量 (Embedding)1.2.6 微调 (fine tune)2 如何写好prompt2.1分类任务2.2 归纳总结3.3 翻译2.4 API接口多样性控制3 实用资料1 接口调用

推荐整理分享ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:api接口接入教程,api接口接入教程,chat type,t.cn api接口,ap passthrough接口,api通信接口,api接口说明,api接口说明,内容如对您有帮助,希望把文章链接给更多的朋友!

我们可以用OpenAI 提供的API接口实现很多NLP的任务,还可以支持生成图像,提取embedding以及finetune的功能。接下来我们来看下具体怎么调用接口。

1.1 生成key

首先需要从网址:https://platform.openai.com/account/api-keys,生成我们的API key: 获得key后我们就可以调用API接口了。目前OpenAI 的 API 服务提供了一个免费的 API 计算单元 (ACU) 的额度,该额度可以用于测试和试用 OpenAI 提供的服务。免费的额度用完后,需要购买额外的 ACU 才能继续使用 OpenAI 的 API 服务。我们可以从Usage和Billing:https://platform.openai.com/account/usage 里去查看我们的免费额度以及进行额度充值:

1.2 接口功能

首先我们需要安装openai

pip install openai

安装好openai以及获得API key后,我们就可以调用接口了,首先我们来看下openai能够提供的模型有什么:

import openaiopenai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"models = openai.Model.list()for model in models['data']: print(model['id'])

我们可以看出,目前提供的模型有如下: 接下来大概介绍一下我们应该怎样去调用接口,获取我们想要的结果。

1.2.1 图片生成 (image generation)import openaiimport json# 设置API密钥openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"def image_genaration(prompt): response = openai.Image.create( prompt=prompt, n=1, size="1024x1024" ) image_url = response['data'][0]['url'] return image_urlif __name__=='__main__': prompt='a delicious dessert' result = image_genaration(prompt) print(result)

prompt=‘a delicious dessert’, 其中返回url地址,我们将地址复制到浏览器中,打开看到如下图: 当prompt=‘母亲在厨房忙碌着’,OpenAI返回的效果图如下: 人物画像细节生成还不够逼真。来试一试中国的古诗词效果, prompt=‘踏花归去马蹄香’ 马蹄上应该画出一些蝴蝶🦋来表达马蹄的花香味啊,不太满意~😞

1.2.2 对话(chat)

api接口调用代码如下所示:

import openaiimport json# 设置API密钥openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"def chat(prompt): response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': prompt='人口最多的国家' result = chat(prompt) print(result)

结果如下:

1.2.3 中文纠错 (Chinese Spelling Correct)

我们可以通过合理的写prompt,基于问答形式,让gpt-3.5做NLP任务。比如对中文纠错,我们可以这样写prompt,让chagpt能够做纠错NLP任务。如下所示:

def correct(): prompt="改正错词输出正确句子:\n\n我在京东电商平台买了苹果耳几和华为体脂称" #建议prompt: 改正错词输出正确句子:\n\n input_sentence response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': result = correct() print(result)

结果如下:

1.2.4 关键词提取 (keyword extract)def keyword(): prompt="对下面内容识别2个关键词,每个词字数不超过3个字:\n\n齐选汽车挂件车内挂饰车载后视镜吊坠高档实心黄铜玉石出入平安保男女 红流苏-玉髓平安扣" #建议prompt: 对下面内容识别n个关键词,每个词字数不超过m个字:\n\n input data response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': result = keyword() print(result)

对于不同的prompt,输出的结果差异也较大。所以对于具体的任务场景,我们需要尝试不同的prompt, 根据结果的反馈,不断的调整和优化prompt,从而得到更加准确的结果。

1.2.5 抽取文本向量 (Embedding)def embedding(): content = '苹果手机' response = openai.Embedding.create( model="text-embedding-ada-002", input=content) answer = response.data[0].embedding return answerif __name__=='__main__': result = embedding() print(len(result)) print(result)

得到结果如下: 是一个1536维度的向量,我们可以基于文本的向量去做很多任务,比如计算两个向量的余弦值,计算相似性分值等。

1.2.6 微调 (fine tune)ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样)

openAI提供了接口可以用我们自己的数据进行fine tune,得到适应我们自己业务场景的新模型。假如我们需要训练一个适应我们自己领域知识的聊天机器人,我们可以按照下面流程来做fine tune。

数据准备

我们可以先把数据转成csv格式,需提供prompt列和对应的completion列,其中prompt相当于问题,completion就是对应的答案,如下是我们要用来fine tune模型的result.csv训练样本内容显示: 然后我们可以用openAI提供的数据处理工具对数据转成json格式的文件

openai tools fine_tunes.prepare_data -f result.csv

执行完后,我们会得到一个对应的json文件:result_prepared.jsonl

模型微调训练 接下来我们就可以用已有的模型 (ada, babbage, curie, davinci) 进行fine tune,官方给出的具体可以用来做微调的模型主要如下: 首先需要指定我们自己的API key:export OPENAI_API_KEY="sk-Wljk3BVhN0VieGCwAzEX*********"

然后开始训练:

openai api fine_tunes.create -t result_prepared.jsonl -m ada

在这里用我们自己的数据result_prepared.jsonl,基于base model: ada模型提交fine tune任务。提交后会返回给我们一个JOB ID,通过这个job id我们可以跟进模型在远程服务器训练情况:

openai api fine_tunes.follow -i ft-sWKDNnTmUyOGEdpvbAOvEaZt

我们可以看到结果如下: 可以看到我们的模型训练好了模型名称叫做:ada:ft-personal-2023-03-27-03-24-09,然后我们就可以试用我们训练好的模型看效果了,测试如下:

openai api completions.create -m ada:ft-personal-2023-03-27-03-24-09 -p <YOUR_PROMPT>

其中<YOUR_PROMPT>写入我们要测试的问题就好。

现在我们可以去远程服务器上查看下我们fine tune好的模型是否已经有了:

models = openai.Model.list()

发现有了刚刚fine tune的模型: 对于分类,实体识别等任务,OPNAI官网也提供了如何做处理数据,让模型做fine tune,详情可以参考官网https://platform.openai.com/docs/introduction/overview

2 如何写好prompt

prompt如何表达,对于chatgpt返回的答案会差异很大,通过prompt正确的表达问题,chatgpt才会返回更合适的结果。通过自己这些天的尝试以及官网给的提示,感受就是在写prompt时候,可以通过说明,例子,限制条件,修饰词等具体表达问题,这样chatgpt会给出更加精准的答案。接下来,我们对几种常见的任务,prompt应用如何写。

2.1分类任务

我们可以对prompt这么构造: 判断content属于A,B,C,D哪一种分类 content: detail 分类:

对应的查询结果如下:

2.2 归纳总结

提供了非常强大能力,能够基于学到的广泛知识,给出问题解决方案,合理的建议,实施步骤,商业计划,人物描写等等。所以我们可以合理写prompt,更有意思的答案。

哈哈,看起来不够大胆,于是进一步发问: 给出的这些答案果然更加激动人心。

3.3 翻译

我们可以将一种语言翻译成我们大多数其他语言。对于翻译任务,我们只需要写prompt表达我们的意愿就是: 将下面内容翻译成英语,日语,德语 content

2.4 API接口多样性控制

在调用API接口的时候,我们可以通过设置两个参数=='temperature’和’top_p’来控制生成文本的多样性和可控度==。当temperature较高时,生成的文本会更加随机和多样化,而当temperature较低时,生成的文本会更加保守和可控。top_p参数用于控制生成文本的可控度,它会限制模型生成文本时可以选择的token的数量。具体来说,当top_p越低时,模型只考虑概率分布中累计概率最高的一部分token,而忽略其他低概率的token。这样一来,生成的文本就更加可控,因为只有那些最可能的token才会被考虑。而当top_p越高的时候,生成的文本可能会更加灵活和多样,因为模型会考虑更多的低概率token。每次调用的时候,我们可以设置这两个参数:

3 实用资料

大模型训练平台:https://github.com/hpcaitech/ColossalAI 相关资料:中文精选资源清单

本文链接地址:https://www.jiuchutong.com/zhishi/296157.html 转载请保留说明!

上一篇:Element-UI侧边导航栏切换展示不同的右侧主体内容(element ui 左侧导航)

下一篇:最全ROS 入门(ros入门21讲)

  • 支付宝农场多少级可以领水果(支付宝芭芭农场要多少肥料)

    支付宝农场多少级可以领水果(支付宝芭芭农场要多少肥料)

  • 禁止win10自动安装驱动(禁止win10自动安装打印机)

    禁止win10自动安装驱动(禁止win10自动安装打印机)

  • 如何关闭拼多多物流订阅(如何关闭拼多多快捷支付功能)

    如何关闭拼多多物流订阅(如何关闭拼多多快捷支付功能)

  • qq几天一个星星(qq一个星星多少天)

    qq几天一个星星(qq一个星星多少天)

  • 苹果7微信怎么设置夜间模式(苹果7微信怎么截长图聊天记录)

    苹果7微信怎么设置夜间模式(苹果7微信怎么截长图聊天记录)

  • 谷歌网盘国内能用吗(谷歌网盘限速吗)

    谷歌网盘国内能用吗(谷歌网盘限速吗)

  • 12306如何查询几个月前的订单(12306怎么看有几张票)

    12306如何查询几个月前的订单(12306怎么看有几张票)

  • 一个微信号只能申请一个健康码吗(一个微信号只能绑定一个企业微信吗)

    一个微信号只能申请一个健康码吗(一个微信号只能绑定一个企业微信吗)

  • 苹果x卡住了强制关机不了(iphone x卡住了)

    苹果x卡住了强制关机不了(iphone x卡住了)

  • 华为nova3怎么设置双系统(华为nova3怎么设置屏幕不休眠)

    华为nova3怎么设置双系统(华为nova3怎么设置屏幕不休眠)

  • 为什么电脑指纹突然不能用了(为什么电脑指纹设置不了)

    为什么电脑指纹突然不能用了(为什么电脑指纹设置不了)

  • so米直播为什么收不到验证码(为什么so米直播下载不了)

    so米直播为什么收不到验证码(为什么so米直播下载不了)

  • 滴滴账号出借他人被停止服务(滴滴账号出借他人账号能解封吗)

    滴滴账号出借他人被停止服务(滴滴账号出借他人账号能解封吗)

  • 荣耀手机有隐私空间吗(荣耀手机有隐私空间功能吗)

    荣耀手机有隐私空间吗(荣耀手机有隐私空间功能吗)

  • 两张卡为什么一张没信号(两张卡为什么一张关机)

    两张卡为什么一张没信号(两张卡为什么一张关机)

  • 华为耳机连接不上手机(华为耳机连接不上蓝牙怎么办)

    华为耳机连接不上手机(华为耳机连接不上蓝牙怎么办)

  • 作业帮有电脑版的吗?(手机下载作业帮app)

    作业帮有电脑版的吗?(手机下载作业帮app)

  • 数据管理三个阶段特点(数据管理三个阶段教学设计)

    数据管理三个阶段特点(数据管理三个阶段教学设计)

  • 快手小店差评能取消吗(快手小店的差评为什么评论完看不到)

    快手小店差评能取消吗(快手小店的差评为什么评论完看不到)

  • 手机电子档怎么做(手机电子档怎么弄作文)

    手机电子档怎么做(手机电子档怎么弄作文)

  • iphone11怎么截屏(iphone11怎么截屏图片)

    iphone11怎么截屏(iphone11怎么截屏图片)

  • mate20怎么设置视频铃声

    mate20怎么设置视频铃声

  • ftp打开始终是网页形式(ftp打开文件弹出网页)

    ftp打开始终是网页形式(ftp打开文件弹出网页)

  • 微信运动能看公里数吗(微信运动能看到去过哪里吗)

    微信运动能看公里数吗(微信运动能看到去过哪里吗)

  • 华为p30pro都有什么功能(华为p30pro强大功能有哪些)

    华为p30pro都有什么功能(华为p30pro强大功能有哪些)

  • ipadmini5有耳机孔吗(ipad mini5有没有耳机孔)

    ipadmini5有耳机孔吗(ipad mini5有没有耳机孔)

  • qq怎么设置自定义封面(qq怎么设置自定义名片)

    qq怎么设置自定义封面(qq怎么设置自定义名片)

  • 为什么qq文件视频下载失败(为什么qq文件视频播放慢)

    为什么qq文件视频下载失败(为什么qq文件视频播放慢)

  • 58同城如何发布招聘(58同城如何发布二手物品信息)

    58同城如何发布招聘(58同城如何发布二手物品信息)

  • WIN10电脑C盘满了如何清理空间(win10电脑c盘满了怎么转移到d盘)

    WIN10电脑C盘满了如何清理空间(win10电脑c盘满了怎么转移到d盘)

  • 小微企业税收优惠政策2023年
  • 注册会计师考试时间2023
  • 固定资产原值增加后折旧年限变吗
  • 员工拓展活动方案范文
  • 转回存货跌价准备为什么是可抵扣暂时性差异
  • 无法提供财产原值凭证
  • 资产负债率计算方式
  • 付汇代扣代缴增值税纳税期限
  • 公司没车但是有加油费发票怎么处理?
  • 船期延迟出口开票开在了上个月会计处理是怎样的?
  • 计提工会经费是按应付职工薪酬的借方还是贷方
  • 税控盘年费去哪里交
  • 个人付款可以开发票吗
  • 已抵扣的增值税怎么做账
  • 关于个人所得税下列说法正确的是
  • 股东垫资需要偿还吗
  • 公司账户流水要交税吗
  • 银行摘要冲账是什么意思
  • 发出商品如何做分录
  • 对方开具红字发票过来怎么做进项税转出
  • 金税盘怎么做账务处理
  • 土地抵扣进项税,,能调回来吗
  • 1697509110
  • 食堂买菜怎么算
  • 电脑屏幕突然黑屏怎么回事
  • 股息红利纳税义务发生地
  • 专票 普票
  • 中文字符和英文字符的转换
  • 360devm.sys是什么文件
  • 截图快捷键ctrl+alt+
  • Linux系统怎么配置IP
  • 进项税和销项税谁交
  • 哪些房地产项目是国企
  • 一次性取得的租金收入
  • 布莱顿小镇介绍
  • thinkphp自定义标签page
  • 深度学习中的FPN详解
  • 一文通透从输入URL到页面渲染的全过程----高频面试
  • vuea
  • ps渐变透明效果怎么弄
  • 资产减值损失账户核算内容包括
  • 挂靠设计公司费用标准怎么记账
  • 购买方享受的现金折扣
  • 原始凭证的基本内容有会计分录吗
  • 股权激励费用摊销意思是
  • 对公账户转到个体工商户
  • 汇算清缴补缴所得税的报税利润表怎么报
  • 去年城建税多计提了怎么办
  • 补充登记法的操作步骤
  • 小额贷款行业新规
  • 退货开增值税专票可以用负数吗
  • 补缴以前年度企业所得税以及滞纳金
  • 分期收款提供劳务 是什么
  • 企业之间的往来款要1900万要交多少税
  • 税金及附加没有设置二级科目,有啥影响吗
  • 费用先付款后收到发票的会计分录
  • 小规模公司房租发票税率是多少
  • 如何查企业是否有问题
  • mysql索引类型及原理
  • sql server 约束
  • warning bios upgrade
  • vic32.dll是什么
  • mac系统删除系统软件
  • win10系统进程
  • win10rs2是哪个版本
  • windows 10 mobile--移动版
  • windowxp音量图标没了
  • shwiconem.exe - shwiconem是什么进程 有什么用
  • html中title的作用
  • js调用url接口
  • javascript要打开吗
  • 有哪些比较好的android的框架
  • js检查邮箱格式
  • javascript函数大全
  • 国家税务局太原税务局官网
  • 河北发票查询真伪查询
  • 防伪税控维护费普通发票怎么申报
  • 河南省公安厅热线电话
  • 江苏税务登记证查询
  • 你认为作为一名护士应具备哪些素质
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设