位置: IT常识 - 正文

AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

编辑:rootadmin
AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

推荐整理分享AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

解读:在2022年11月横空出世的ChatGPT,打遍天下无敌手的时候,就知道会有这么一天,知道它会来,也知道它一定来,但是,还是没想到,来的是这么的快。就在2023年3月15日凌晨(博主是在今天1点多收到的OpenAI的官方邮件信息),OpenAI的CEO Sam Altman以直播的形式发布了GPT-4。正如Sam Altman所说,这是GPT-4,迄今为止我们最强大的模型。它今天可以在我们的API(等待列表)和ChatGPT+中使用。它仍然有缺陷,仍然有局限性,第一次使用时,它似乎比你用了更多时间后更令人印象深刻。但是,敲重点,根据GPT-4的发布会可知,OpenAI对GPT-4的训练其实已经于2022年8月完成,近半年多的时间都在做微调提升,以及去除危险内容生成的工作,这是最令博主诧异的,这特么个东西竟然在去年8月份就存在了(细思极恐)。当然,最牛叉的模型往往用最朴素的方法,GPT-4科技报告中的7个表格和9张图片,进行了各种横向和纵向比较,能打的一个都没有,它仿佛时刻在低调地说我是目前整个业界最牛逼的AGI模型……嗯,这话的确不是吹的。 随着GPT-4的出世,接下来,会出现官方API的有偿开放,国内外一系列开源社区的争先模仿,大概率预示着2023年,正式步入了从AI无处不在→AI无处不用的时代,走出了实验室,正在走进寻常百姓家,走进你和我和Ta… 最后,GPT4今天凌晨空降,恰好百度文心一言第二天要发布国内首个类ChatGPT模型,嗯,估计发布者已经在连夜修改PPT了……

目录

GPT-4的简介

GPT-4模型可使用版本

GPT-4模型对比 GPT-3.5

GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令

GPT-4在为机器学习模型设计的传统基准上优于大多数 SOTA 模型

GPT-4 在学术和专业考试中的表现优秀

GPT-4 在基于MMLU基准的其他语言上能力也表现惊艳

GPT-4 在 TruthfulQA 等外部基准测试方面也取得了进展

GPT-4 System Card简介

GPT-4的使用方法

GPT-4的案例应用

1、可控性:允许修改“系统提示”

语气角色扮演

指定回答形式或者格式

2、计算能力

做一个法语的物理题

3、代码能力

给代码修Bug

4、看图能力(预览,能力暂时未公开)

看草图绘代码

解释表情包、解释漫画

解释梗图

找图中特点

理解图表中数据的含义

根据论文截图总结摘要


相关文章

AIGC:ChatGPT(一个里程碑式的对话聊天机器人)的简介(意义/功能/核心技术等)、使用方法(七类任务)、案例应用(提问基础性/事实性/逻辑性/创造性/开放性的问题以及编程相关)之详细攻略

https://yunyaniu.blog.csdn.net/article/details/128229941

Paper:《GPT-4 Technical Report》的翻译与解读

https://yunyaniu.blog.csdn.net/article/details/129572687

GPT-4的简介

官方总结

我们已经创建了GPT-4,这是OpenAI在扩大深度学习方面的最新里程碑。GPT-4是一个大型多模态模型(接受图像和文本输入,输出文本),虽然在许多现实场景中不如人类,但在各种专业和学术基准上表现出与人类相当的性能。

简介

GPT-4是一个超大的多模态模型,它的输入可以是文字(上限约2.4万单词),还可以是图像。由于其更广泛的常识和先进的推理能力,它可以比我们之前的任何模型更准确地解决难题。

核心原理

GPT-4依旧是一个基于Transformer风格的预训练模型,用于预测文档中的下一个token,使用公开可用数据(如互联网数据)和第三方提供商授权的数据,利用人类反馈的强化学习(RLHF)对模型进行微调。

意义

在各种专业和学术基准上,GPT-4性能水平和人类相当!

比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5却是倒数10%;

再比如做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。

亮点

(1)、多模态特性:强大的识图能力,可以接受图像输入并理解图像内容;

(2)、更长的上下文:可以接受的文字输入长度也增加到3.2万个token(约2.5万个单词文本);

(3)、针对问题基于提示可以利用不同的风格进行回答;

(4)、更加真实性、可控性:OpenAI 花了 6 个月的时间使用对抗性测试程序和 ChatGPT 的经验教训对 GPT-4 进行迭代调整;

技术点

GPT-4依旧设置技术壁垒,目前还没有公布具体模型架构、硬件、训练计算、数据集构造、训练方法的具体细节。

(1)、GPT-4依旧利用强化学习人类反馈 (RLHF) 来微调模型的行为:聘请了来自长期AI一致性/对齐风险、网络安全、生物风险和国际安全等领域的50多名专家对模型进行对抗性测试;

(2)、GPT-4的两个技术点提高安全性:一套额外的安全相关RLHF训练提示,以及基于规则的奖励模型(RBRMs)。通过训练模型拒绝对此类内容的请求来减少有害的输出。

(3)、OpenAI 基于Azure从头开始设计了一台超级计算机,并重建了整个深度学习堆栈;

(4)、OpenAI开源了 OpenAI Evals—自动评估 AI 模型性能的框架,主要是为了让所有人都可以指出其模型中的缺点,来帮助 OpenAI 进一步改进模型。它被用于创建和运行基准测试以评估 GPT-4 等模型,同时可以逐样本地检查模型性能;

(5)、模型训练到部署的庞大的团队工程能力:单看报告致谢的部分,就包括了几百人。预训练模块、长上下文模块、视觉模块、强化学习与对齐模块、评估与分析模块、部署模块等工程化的各个阶段,均装备了核心负责人小组、计算集群扩展小组、数据小组、分布式训练基础设施小组、硬件正确性小组、优化与架构小组、模型训练小组团队。

缺点

(1)、幻觉不可靠性:GPT-4与早期GPT模型有相似的局限性:它仍然不完全可靠,它会“产生幻觉”事实,但已经比ChatGPT减轻了这一缺点。

(2)、依旧存在错误推理的可能性:

(3)、依旧会产生有害的建议:但通过50位领域专家的反馈对模型进行了改进;

(4)、存在偏差性:GPT-4在输出中依旧存在各种偏差;

(5)、GPT-4上下文窗口有限;

(6)、GPT-4不能从经验中学习;

(7)、GPT-4会在生成的代码中引入安全漏洞;

使用方法

(1)、可以继续沿用ChatGPT,只不过这次是ChatGPT Plus版本,即ChatGPT已加持GPT-4;

(2)、目前可以调用官方发布GPT-4的API;

(3)、可以借助Microsoft 的Bing搜索使用GPT-4功能;

使用建议

要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt):就是需在提问的时候额外提醒AI给出步骤,就能大大提高推理和计算的准确率。

AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

官网地址:GPT-4

直播视频:https://www.youtube.com/watch?v=outcGtbnMuQ

GPT-4模型可使用版本

最新模型

描述

最大TOKENS

训练数据

gpt-4

比任何GPT-3.5模型更强大,能够完成更复杂的任务,并为聊天进行了优化。将与我们最新的模型迭代更新。

8,192 tokens

截至2021年9月

gpt-4-0314

2023年3月14日的gpt-4快照。与gpt-4不同的是,该模型将不会接受更新,并且只会在2023年6月14日结束的三个月内得到支持。

8,192 tokens

截至2021年9月

gpt-4-32k

与基础gpt-4模式相同的功能,但上下文长度是它的4倍。将与我们最新的模型迭代更新。

32,768 tokens

截至2021年9月

gpt-4-32k-0314

2023年3月14日gpt-4-32的快照。与gpt-4-32k不同的是,该型号将不接受更新,并且只支持三个月的时间,截止2023年6月14日。

32,768 tokens

截至2021年9月

表格地址链接:https://platform.openai.com/docs/models/gpt-4

GPT-4模型对比 GPT-3.5

对于许多基本任务,GPT-4和GPT-3.5模型之间的差异并不显著。然而,在更复杂的推理情况下,GPT-4比我们之前的任何模型都更有能力。

GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令

GPT-4在为机器学习模型设计的传统基准上优于大多数 SOTA 模型

 GPT-4 基本模型在此任务上仅比 GPT-3.5 略好;使用强化学习人类反馈 (RLHF) 来微调模型的行为,在经过 RLHF 后训练之后,GPT-4模型性能飞跃提升。

GPT-4 在学术和专业考试中的表现优秀

GPT-4 在基于MMLU基准的其他语言上能力也表现惊艳

GPT-4 在 TruthfulQA 等外部基准测试方面也取得了进展

与之前的 GPT 模型一样,GPT-4 基础模型经过训练可以预测文档中的下一个单词,

GPT-4 System Card简介

GPT-4 System Card:https://cdn.openai.com/papers/gpt-4-system-card.pdf

大型语言模型(LLMs)被部署在我们生活的许多领域,从浏览、语音助手到编码辅助工具,并有可能产生巨大的社会影响。此system card系统卡分析GPT-4, GPT系列模型中最新的LLM。首先,我们强调了模型的局限性(例如,产生令人信服的巧妙错误文本)和能力(例如,提供非法建议的熟练程度提高,双重用途功能的性能和危险的紧急行为)所带来的安全挑战。其次,我们对OpenAI用于准备GPT-4部署的安全流程进行了高层概述。这涵盖了我们的工作,包括测量、模型级别的更改、产品和系统级别的干预(如监测和政策)以及外部专家的参与。最后,我们证明,虽然我们的缓解措施和流程改变了GPT-4的行为,并防止某些类型的误用,但它们是有限的,在某些情况下仍然很脆弱。这表明需要有预见性的规划和治理。

GPT-4的使用方法

ChatGPT Plus地址:https://chat.openai.com/chat

GPT-4 API waitlist地址:GPT-4 API waitlist

      要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt):就是需在提问的时候额外提醒AI给出步骤,就能大大提高推理和计算的准确率。       GPT-4目前处于有限的测试阶段,只有被授予访问权限的人才能访问。当容量可用时,请加入等待列表以获得访问。在获得访问权限后,目前可以向 GPT-4 模型发出纯文本请求,图像能力暂未开放。       价格方面,定价为每 1k 个 prompt token 0.03 美元,每 1k 个 completion token 0.06 美元。默认速率限制为每分钟 40k 个 token 和每分钟 200 个请求。

GPT-4的案例应用1、可控性:允许修改“系统提示”

允许 API 用户在一定范围内定制化实现不同的用户体验,比如以莎士比亚风格或json格式回答

语气角色扮演

通过修改这句话,GPT-4就可以展现出更多样的性格,比如扮演角色

指定回答形式或者格式

也可以指定之后所有回答的形式,比如全用json格式

2、计算能力做一个法语的物理题

3、代码能力给代码修Bug

4、看图能力(预览,能力暂时未公开)看草图绘代码

画一个网站的草稿图,拍照片上传给GPT-4,可以立马生成网站的HTML代码

解释表情包、解释漫画

解释梗图

找图中特点

理解图表中数据的含义

根据论文截图总结摘要

本文链接地址:https://www.jiuchutong.com/zhishi/300263.html 转载请保留说明!

上一篇:理解DALL·E 2, Stable Diffusion和 Midjourney工作原理

下一篇:Java二次开发海康SDK-对接门禁机(java开源二次开发平台)

  • 营销四大内耗难题!(内部营销4p)

    营销四大内耗难题!(内部营销4p)

  • 苹果手机人脸识别怎么设置(苹果手机人脸识别突然不能用了)

    苹果手机人脸识别怎么设置(苹果手机人脸识别突然不能用了)

  • 笔记本电脑插网线应该怎样连接(笔记本电脑插网线怎么连接网络)

    笔记本电脑插网线应该怎样连接(笔记本电脑插网线怎么连接网络)

  • 文字怎么换行(cad文字怎么换行)

    文字怎么换行(cad文字怎么换行)

  • 抖音怎么取消在线状态(抖音怎么取消在线功能)

    抖音怎么取消在线状态(抖音怎么取消在线功能)

  • wps表格打开不停向右滚动怎么办?(wps表格打开不停向右滚动怎么回事)

    wps表格打开不停向右滚动怎么办?(wps表格打开不停向右滚动怎么回事)

  • 如何用siri声音做视频(怎么用siri音效)

    如何用siri声音做视频(怎么用siri音效)

  • qq显示远程办公是啥意思(qq远程桌面无法操作)

    qq显示远程办公是啥意思(qq远程桌面无法操作)

  • ed2k是什么文件(ed2k文件下载软件)

    ed2k是什么文件(ed2k文件下载软件)

  • 苹果显示闪电接口有水(苹果显示闪电接口在哪里)

    苹果显示闪电接口有水(苹果显示闪电接口在哪里)

  • 快手怎么查看在线状态(快手怎么查看在快手多少天了)

    快手怎么查看在线状态(快手怎么查看在快手多少天了)

  • ja是什么版本(苹果手机型号ja是什么版本)

    ja是什么版本(苹果手机型号ja是什么版本)

  • vivos5有语音助手吗(vivos5语音助手不让别人叫醒)

    vivos5有语音助手吗(vivos5语音助手不让别人叫醒)

  • 抖音头像只能改一次吗(抖音头像不可以换了怎么办)

    抖音头像只能改一次吗(抖音头像不可以换了怎么办)

  • 网络安全防范措施(网络安全防范措施五种)

    网络安全防范措施(网络安全防范措施五种)

  • 打印机一直闪红灯怎么回事(打印机一直闪红灯无法打印)

    打印机一直闪红灯怎么回事(打印机一直闪红灯无法打印)

  • 手机无线投屏要流量吗(手机无线投屏需要什么设备)

    手机无线投屏要流量吗(手机无线投屏需要什么设备)

  • 淘宝号怎么查看几心啊(淘宝号怎么查看等级)

    淘宝号怎么查看几心啊(淘宝号怎么查看等级)

  • 一加7怎么设置定时开关机(一加7怎么设置来电铃声)

    一加7怎么设置定时开关机(一加7怎么设置来电铃声)

  • ipad护眼模式怎么开(ipad 护眼模式)

    ipad护眼模式怎么开(ipad 护眼模式)

  • 怎么删除wps空白页面(删除wps空白页最后一页怎么删)

    怎么删除wps空白页面(删除wps空白页最后一页怎么删)

  • 阿里的拖动滑块验证是怎么实现的?(拖动滑块什么意思)

    阿里的拖动滑块验证是怎么实现的?(拖动滑块什么意思)

  • vivox27pro微信带美颜功能吗(vivo手机x27微信没有提示音怎么回事)

    vivox27pro微信带美颜功能吗(vivo手机x27微信没有提示音怎么回事)

  • iphone照片反色(iphone照片反色app)

    iphone照片反色(iphone照片反色app)

  • 基于OpenVINO在C++中部署YOLOv5-Seg实例分割模型(openvino使用)

    基于OpenVINO在C++中部署YOLOv5-Seg实例分割模型(openvino使用)

  • 不确认递延所得税的特殊情况
  • 关于个人取得的成果
  • 知识产权入股需要过户给对方么
  • 一般纳税企业所得税税率是多少2019
  • 一般纳税人结转销售成本怎么算
  • 购买的固定资产什么时候折旧
  • 出售股票公允价值变动在借方
  • 应付账款保理是什么意思
  • 公司支付员工工伤赔偿怎么做账
  • 进项税留底是什么意思
  • 传媒公司发传单
  • 原材料做成库存会计分录
  • 资产减值损失列示在利润表哪里
  • 职工教育法
  • 资产负债率70%说明长期偿债能力
  • 增值税的计税公式为
  • 营业执照副本编号是指什么
  • 先开票还是先预约
  • 计划分配率怎么算
  • 生产企业出口需要什么手续
  • win11专业版和家庭中文版区别
  • 进项票月初收到能抵上月
  • 出口货物做内销处理
  • 费用发票开的是跨年的账务处理
  • 对公账户转私人账户手续费多少
  • php array数组
  • 第三方代收的款项怎么做账
  • win7旗舰版系统激活工具
  • Vite + Vue3 +Vant4构建项目时,按需引入使用Toast组件,引用 showToast 时出现编译报错的解决方案
  • php类型转换的两种方法
  • Yii2中简单的场景使用介绍
  • 赫尔辛基哈加赫利亚大学
  • 股东分红算不算股利
  • 增值税申报流程大全(附图文详解)
  • 贴现手续费计入哪个明细科目
  • 公司购买烟酒怎么入账
  • 没有实收资本的股权原值
  • MySQL常用命令关键字
  • 加工企业的税怎么算
  • 新开公司怎么办理税务登记
  • 进项税多记了怎么调账
  • 处理废旧材料会计分录
  • 从内地到香港坐飞机到国内
  • 公司奖励员工制度
  • 结转成本按照销售收入来结转,税要怎么算
  • 验资账户需要对账吗
  • 企业购买土地如何缴税
  • 固定成本总额包含折旧吗
  • 不含税价格怎么算公式(1+3%)
  • sql server触发器实验
  • sql中的视图提高了数据库的
  • mysql免安装版本
  • 微软安全公告
  • windowsserver2008r2激活密钥
  • ubuntu中运行c程序
  • 怎么用ubuntu
  • nkvmon.exe - nkvmon是什么进程 有什么用
  • win7系统浏览器打不开网页怎么办
  • Win7如何卸载dualmonitor
  • 电脑windows8怎么样
  • bootstrap 下拉框绑定数据
  • javascript语言入门教程
  • javascript 数组操作
  • android su
  • pygal python
  • React Native react-navigation 导航使用详解
  • bootstrap表单模板
  • python 任务 调度 管理
  • node 创建文件夹
  • Android - DrawerLayout的使用
  • unity的shader在哪儿
  • python读取一个文件并写入另一个文件
  • 陷阱类过关游戏
  • python编程简单案例
  • 成都所见所得科技有限公司是什么平台
  • 甘肃国家税务局官网
  • 日本消费税是什么
  • 湖南低保查询网上查询
  • 支持国税普通发展的原因
  • 电力企业所得税按期
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设