位置: IT常识 - 正文

ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样)

编辑:rootadmin
ChatGPT API接口使用+fine tune微调+prompt介绍 目录1 接口调用1.1 生成key1.2 接口功能1.2.1 图片生成 (image generation)1.2.2 对话(chat)1.2.3 中文纠错 (Chinese Spelling Correct)1.2.4 关键词提取 (keyword extract)1.2.5 抽取文本向量 (Embedding)1.2.6 微调 (fine tune)2 如何写好prompt2.1分类任务2.2 归纳总结3.3 翻译2.4 API接口多样性控制3 实用资料1 接口调用

推荐整理分享ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:api接口接入教程,api接口接入教程,chat type,t.cn api接口,ap passthrough接口,api通信接口,api接口说明,api接口说明,内容如对您有帮助,希望把文章链接给更多的朋友!

我们可以用OpenAI 提供的API接口实现很多NLP的任务,还可以支持生成图像,提取embedding以及finetune的功能。接下来我们来看下具体怎么调用接口。

1.1 生成key

首先需要从网址:https://platform.openai.com/account/api-keys,生成我们的API key: 获得key后我们就可以调用API接口了。目前OpenAI 的 API 服务提供了一个免费的 API 计算单元 (ACU) 的额度,该额度可以用于测试和试用 OpenAI 提供的服务。免费的额度用完后,需要购买额外的 ACU 才能继续使用 OpenAI 的 API 服务。我们可以从Usage和Billing:https://platform.openai.com/account/usage 里去查看我们的免费额度以及进行额度充值:

1.2 接口功能

首先我们需要安装openai

pip install openai

安装好openai以及获得API key后,我们就可以调用接口了,首先我们来看下openai能够提供的模型有什么:

import openaiopenai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"models = openai.Model.list()for model in models['data']: print(model['id'])

我们可以看出,目前提供的模型有如下: 接下来大概介绍一下我们应该怎样去调用接口,获取我们想要的结果。

1.2.1 图片生成 (image generation)import openaiimport json# 设置API密钥openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"def image_genaration(prompt): response = openai.Image.create( prompt=prompt, n=1, size="1024x1024" ) image_url = response['data'][0]['url'] return image_urlif __name__=='__main__': prompt='a delicious dessert' result = image_genaration(prompt) print(result)

prompt=‘a delicious dessert’, 其中返回url地址,我们将地址复制到浏览器中,打开看到如下图: 当prompt=‘母亲在厨房忙碌着’,OpenAI返回的效果图如下: 人物画像细节生成还不够逼真。来试一试中国的古诗词效果, prompt=‘踏花归去马蹄香’ 马蹄上应该画出一些蝴蝶🦋来表达马蹄的花香味啊,不太满意~😞

1.2.2 对话(chat)

api接口调用代码如下所示:

import openaiimport json# 设置API密钥openai.api_key = "sk-Wljk3BVhN0VieGCwAzEXT3BlbkFJ*******"def chat(prompt): response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': prompt='人口最多的国家' result = chat(prompt) print(result)

结果如下:

1.2.3 中文纠错 (Chinese Spelling Correct)

我们可以通过合理的写prompt,基于问答形式,让gpt-3.5做NLP任务。比如对中文纠错,我们可以这样写prompt,让chagpt能够做纠错NLP任务。如下所示:

def correct(): prompt="改正错词输出正确句子:\n\n我在京东电商平台买了苹果耳几和华为体脂称" #建议prompt: 改正错词输出正确句子:\n\n input_sentence response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': result = correct() print(result)

结果如下:

1.2.4 关键词提取 (keyword extract)def keyword(): prompt="对下面内容识别2个关键词,每个词字数不超过3个字:\n\n齐选汽车挂件车内挂饰车载后视镜吊坠高档实心黄铜玉石出入平安保男女 红流苏-玉髓平安扣" #建议prompt: 对下面内容识别n个关键词,每个词字数不超过m个字:\n\n input data response = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content":prompt} ]) answer = response.choices[0].message.content return answerif __name__=='__main__': result = keyword() print(result)

对于不同的prompt,输出的结果差异也较大。所以对于具体的任务场景,我们需要尝试不同的prompt, 根据结果的反馈,不断的调整和优化prompt,从而得到更加准确的结果。

1.2.5 抽取文本向量 (Embedding)def embedding(): content = '苹果手机' response = openai.Embedding.create( model="text-embedding-ada-002", input=content) answer = response.data[0].embedding return answerif __name__=='__main__': result = embedding() print(len(result)) print(result)

得到结果如下: 是一个1536维度的向量,我们可以基于文本的向量去做很多任务,比如计算两个向量的余弦值,计算相似性分值等。

1.2.6 微调 (fine tune)ChatGPT API接口使用+fine tune微调+prompt介绍(api接口长什么样)

openAI提供了接口可以用我们自己的数据进行fine tune,得到适应我们自己业务场景的新模型。假如我们需要训练一个适应我们自己领域知识的聊天机器人,我们可以按照下面流程来做fine tune。

数据准备

我们可以先把数据转成csv格式,需提供prompt列和对应的completion列,其中prompt相当于问题,completion就是对应的答案,如下是我们要用来fine tune模型的result.csv训练样本内容显示: 然后我们可以用openAI提供的数据处理工具对数据转成json格式的文件

openai tools fine_tunes.prepare_data -f result.csv

执行完后,我们会得到一个对应的json文件:result_prepared.jsonl

模型微调训练 接下来我们就可以用已有的模型 (ada, babbage, curie, davinci) 进行fine tune,官方给出的具体可以用来做微调的模型主要如下: 首先需要指定我们自己的API key:export OPENAI_API_KEY="sk-Wljk3BVhN0VieGCwAzEX*********"

然后开始训练:

openai api fine_tunes.create -t result_prepared.jsonl -m ada

在这里用我们自己的数据result_prepared.jsonl,基于base model: ada模型提交fine tune任务。提交后会返回给我们一个JOB ID,通过这个job id我们可以跟进模型在远程服务器训练情况:

openai api fine_tunes.follow -i ft-sWKDNnTmUyOGEdpvbAOvEaZt

我们可以看到结果如下: 可以看到我们的模型训练好了模型名称叫做:ada:ft-personal-2023-03-27-03-24-09,然后我们就可以试用我们训练好的模型看效果了,测试如下:

openai api completions.create -m ada:ft-personal-2023-03-27-03-24-09 -p <YOUR_PROMPT>

其中<YOUR_PROMPT>写入我们要测试的问题就好。

现在我们可以去远程服务器上查看下我们fine tune好的模型是否已经有了:

models = openai.Model.list()

发现有了刚刚fine tune的模型: 对于分类,实体识别等任务,OPNAI官网也提供了如何做处理数据,让模型做fine tune,详情可以参考官网https://platform.openai.com/docs/introduction/overview

2 如何写好prompt

prompt如何表达,对于chatgpt返回的答案会差异很大,通过prompt正确的表达问题,chatgpt才会返回更合适的结果。通过自己这些天的尝试以及官网给的提示,感受就是在写prompt时候,可以通过说明,例子,限制条件,修饰词等具体表达问题,这样chatgpt会给出更加精准的答案。接下来,我们对几种常见的任务,prompt应用如何写。

2.1分类任务

我们可以对prompt这么构造: 判断content属于A,B,C,D哪一种分类 content: detail 分类:

对应的查询结果如下:

2.2 归纳总结

提供了非常强大能力,能够基于学到的广泛知识,给出问题解决方案,合理的建议,实施步骤,商业计划,人物描写等等。所以我们可以合理写prompt,更有意思的答案。

哈哈,看起来不够大胆,于是进一步发问: 给出的这些答案果然更加激动人心。

3.3 翻译

我们可以将一种语言翻译成我们大多数其他语言。对于翻译任务,我们只需要写prompt表达我们的意愿就是: 将下面内容翻译成英语,日语,德语 content

2.4 API接口多样性控制

在调用API接口的时候,我们可以通过设置两个参数=='temperature’和’top_p’来控制生成文本的多样性和可控度==。当temperature较高时,生成的文本会更加随机和多样化,而当temperature较低时,生成的文本会更加保守和可控。top_p参数用于控制生成文本的可控度,它会限制模型生成文本时可以选择的token的数量。具体来说,当top_p越低时,模型只考虑概率分布中累计概率最高的一部分token,而忽略其他低概率的token。这样一来,生成的文本就更加可控,因为只有那些最可能的token才会被考虑。而当top_p越高的时候,生成的文本可能会更加灵活和多样,因为模型会考虑更多的低概率token。每次调用的时候,我们可以设置这两个参数:

3 实用资料

大模型训练平台:https://github.com/hpcaitech/ColossalAI 相关资料:中文精选资源清单

本文链接地址:https://www.jiuchutong.com/zhishi/296157.html 转载请保留说明!

上一篇:Element-UI侧边导航栏切换展示不同的右侧主体内容(element ui 左侧导航)

下一篇:最全ROS 入门(ros入门21讲)

  • 上海企业知名大厂排名名称地址汇总

    上海企业知名大厂排名名称地址汇总

  • miui12.5增强版内存扩展在哪里(miui12.5增强版有什么新功能)

    miui12.5增强版内存扩展在哪里(miui12.5增强版有什么新功能)

  • 百度电影不能播放怎么回事(为什么百度影音播放不了)(为什么百度上的电影突然不能下载了)

    百度电影不能播放怎么回事(为什么百度影音播放不了)(为什么百度上的电影突然不能下载了)

  • 闲鱼的钱怎么提现呢(闲鱼的钱怎么提出来)

    闲鱼的钱怎么提现呢(闲鱼的钱怎么提出来)

  • 苹果手机有面容和无面容有什么区别(苹果手机有面容和无面容什么意思)

    苹果手机有面容和无面容有什么区别(苹果手机有面容和无面容什么意思)

  • 微博铁粉标识获得的方法是什么(微博铁粉标识是什么样)

    微博铁粉标识获得的方法是什么(微博铁粉标识是什么样)

  • 因特网是什么(因特网是什么网的简称)

    因特网是什么(因特网是什么网的简称)

  • 交换机属于osi的哪一层(交换机在osi模型中属于哪一层)

    交换机属于osi的哪一层(交换机在osi模型中属于哪一层)

  • oppo伸缩摄像头的手机(oppo伸缩摄像头手机)

    oppo伸缩摄像头的手机(oppo伸缩摄像头手机)

  • 天猫上车什么意思(天猫车会)

    天猫上车什么意思(天猫车会)

  • 天猫积分为什么不能兑换了(天猫积分为什么三天换一次)

    天猫积分为什么不能兑换了(天猫积分为什么三天换一次)

  • x50什么处理器(rk3288处理器)

    x50什么处理器(rk3288处理器)

  • 手机视频如何镜像(手机视频如何镜像处理)

    手机视频如何镜像(手机视频如何镜像处理)

  • 速印机和复印机的区别(复印机和打印机的区别在哪里)

    速印机和复印机的区别(复印机和打印机的区别在哪里)

  • iphone11经常死机(iphone11经常死机是什么原因)

    iphone11经常死机(iphone11经常死机是什么原因)

  • 如何录音手机里的声音(如何录音手机里的声音vivo)

    如何录音手机里的声音(如何录音手机里的声音vivo)

  • 口述影像是什么功能(口述影像历史)

    口述影像是什么功能(口述影像历史)

  • ip协议是可靠的吗(ip协议是可靠还是不可靠)

    ip协议是可靠的吗(ip协议是可靠还是不可靠)

  • 微信给对方转账后删除好友对方还能收到吗(微信给对方转账不显示名字是被删了吗?)

    微信给对方转账后删除好友对方还能收到吗(微信给对方转账不显示名字是被删了吗?)

  • 小米mix2s支持快充吗(mix2s支持快充吗?)

    小米mix2s支持快充吗(mix2s支持快充吗?)

  • 为什么excel高级筛选老是只出现第一栏(为什么excel高级筛选老是应用无效)

    为什么excel高级筛选老是只出现第一栏(为什么excel高级筛选老是应用无效)

  • 京东拒收要确认收货吗(京东拒收要确认物流吗)

    京东拒收要确认收货吗(京东拒收要确认物流吗)

  • cpu通常包括什么(cpu主要包括什么)

    cpu通常包括什么(cpu主要包括什么)

  • 多媒体的必备部件是什么(多媒体都包含什么)

    多媒体的必备部件是什么(多媒体都包含什么)

  • 小米怎么关闭内容中心(小米怎么关闭内容咨询)

    小米怎么关闭内容中心(小米怎么关闭内容咨询)

  • 苹果xr死机了怎么重启(苹果xr死机咋办)

    苹果xr死机了怎么重启(苹果xr死机咋办)

  • 拼多多现金签到怎么删除好友(拼多多现金签到的钱怎么没有了)

    拼多多现金签到怎么删除好友(拼多多现金签到的钱怎么没有了)

  • 鸿蒙负一屏怎么关闭?鸿蒙负一屏关闭教程(鸿蒙负一屏怎么设置)

    鸿蒙负一屏怎么关闭?鸿蒙负一屏关闭教程(鸿蒙负一屏怎么设置)

  • vue-router报错: uncaught error during route navigation(vue unknown custom element)

    vue-router报错: uncaught error during route navigation(vue unknown custom element)

  • TS 快速入门(ts基础)

    TS 快速入门(ts基础)

  • 施工单位缴税实例
  • 投标保证金利息计算起止时间
  • 淘宝网店女装
  • 进项大于销项怎么结转分录
  • 发票怎么看开票最大额
  • 个体户三万以内免个税
  • 报关单位的信用管理制度
  • 对供应商的罚款怎么入账
  • 收到其他银行划回的款项属于什么科目
  • 开办费一次性摊销企业所得税
  • 对方电子承兑发出多长时间可以到账
  • 软件开发公司的运营模式
  • 投资理财产品的优势和劣势
  • 建筑工程的适用范围
  • 一般贸易免抵退税计算
  • 待抵扣进项税贷方有余额什么意思
  • 高新技术企业怎么申报企业所得税
  • 物料买回来再发货可以吗
  • 出口退税申报时间限制
  • 核定征收的个税怎么算
  • bios如何恢复默认值
  • 怎么快速关闭电脑屏幕快捷键
  • 我国的社会保险费
  • 营业外收入怎么做会计凭证
  • 初级考试判断题怎么扣分
  • 微信公众号开发php源码
  • php 注册
  • PHP:session_decode()的用法_Session函数
  • 很有意思的一段话
  • 个人借款的合法利息是多少
  • 如何通过手机号码查对方在哪里
  • OSError: [WinError 1455] 页面文件太小,无法完成操作。 Error loading “C:\ProgramData\Anaconda3\lib\site-packages\to
  • 跨年可以预提费用吗
  • 长期股权投资凭证
  • 公司制作横幅计入什么科目?
  • 山东省项目
  • 刷题笔贴吧
  • 已经结账的账目怎么冲红
  • 公司期货套期保值会计处理方法
  • 职工教育经费年底要冲回吗
  • 防伪税控技术服务费订单号怎么查
  • 金蝶会计报表公式
  • 购进商品的运费怎么记账
  • 公司人员工资计算方法
  • sql server管理员权限
  • 主营业务收入和营业外收入均属于收入
  • 获取验证码平台
  • 软件服务费计入管理费用哪个明细
  • 收回上年度拨款怎么做账
  • 建账盘存库存商品的分录
  • 异地预缴的企业所得税
  • 增值税普通发票需要交税吗
  • 预算会计与企业会计的区别感悟
  • 单位食堂账目
  • 个税异地缴纳后果
  • 工程结算怎么结转收入
  • 购置一项设备,有两种可供选择
  • 发出存货的计价方法一经确定,不得随意改变
  • 现金股利征收个人所得税吗
  • 个人贷款打到公司账户存在什么风险
  • 百旺购货方红字信息表怎么开具
  • 工程施工借贷方向
  • mysql中分组
  • 重装机兵
  • 在sql查询中使用where子句指定的是
  • windows2003企业版sp2密钥
  • 记录一次博客迁移到Docker上的操作
  • Ubuntu安装搜狗输入法
  • win10无internet怎么办
  • 苹果电脑安装虚拟机会有什么影响
  • win7浏览器主页怎么设置
  • win10无法安装无线显示器
  • unity3d ngui-TweenRotation翻牌动画
  • android新手入门
  • 猫的所有视频
  • js函数嵌套函数的return
  • js数组entries
  • python中函数参数类型
  • 缴款单号怎么交学费
  • 重庆税务自助取票地点
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设