位置: IT常识 - 正文

ChatGPT研究分析:GPT-4做了什么(patriotic研究)

编辑:rootadmin
ChatGPT研究分析:GPT-4做了什么

推荐整理分享ChatGPT研究分析:GPT-4做了什么(patriotic研究),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:ptst分析法,ptst分析法,srtp研究报告,ptst分析法,ptst分析法,srtp研究报告,chartted研究,chartted研究,内容如对您有帮助,希望把文章链接给更多的朋友!

前脚刚研究了一轮GPT3.5,OpenAI很快就升级了GPT-4,整体表现有进一步提升。追赶一下潮流,研究研究GPT-4干了啥。

本文内容全部源于对OpenAI公开的技术报告的解读,通篇以PR效果为主,实际内容不多。主要强调的工作,是“Predictable Scaling”这个概念。

ChatGPT研究分析:GPT-4做了什么(patriotic研究)

上一版ChatGPT的主要挑战是,因为模型的训练量极大,很难去进行优化(ChatGPT是fine-tuning的模式)。因此,OpenAI希望能够在模型训练初期,就进行优化,从而大幅提升人工调优迭代的效率。而想要进行调优,就得知道当前模型的效果如何。因此,这个问题就被转化为了:如何在模型训练初期,就能够预测最终训练完成后的实际效果。

从结果来看,ChatGPT实现了,仅仅执行千分之一到万分之一的训练量,就可以大致预测模型的结果。

实现原理相对简单,就是在某一个模型的不同训练阶段进行实际效果测量,然后做函数拟合,发现符合幂等曲线。然后再基于采样值,测算一下幂等函数的相关参数,下一轮就可以只进行少量训练,就去预测最终效果了。

至于其他效果上的优化,OpenAI没有进一步解读原理,但整体应该还是基于“训练-奖励”的优化模型,去生成更针对性的奖励模型(比如增加法律、安全之类的奖励判断),以实现更优的效果。

原版内容如下:

3 Predictable ScalingA large focus of the GPT-4 project was building a deep learning stack that scales predictably. The primary reason is that for very large training runs like GPT-4, it is not feasible to do extensive model-specific tuning. To address this, we developed infrastructure and optimization methods that have very predictable behavior across multiple scales. These improvements allowed us to reliably predict some aspects of the performance of GPT-4 from smaller models trained using 1, 000× – 10, 000× less compute.3.1 Loss PredictionThe final loss of properly-trained large language models is thought to be well approximated by power laws in the amount of compute used to train the model [35, 36, 2, 14, 15].To verify the scalability of our optimization infrastructure, we predicted GPT-4’s final loss on our internal codebase (not part of the training set) by fitting a scaling law with an irreducible loss term (as in Henighan et al. [15]): L(C) = aCb + c, from models trained using the same methodology but using at most 10,000x less compute than GPT-4. This prediction was made shortly after the run started, without use of any partial results. The fitted scaling law predicted GPT-4’s final loss with high accuracy (Figure 1).3.2 Scaling of Capabilities on HumanEvalHaving a sense of the capabilities of a model before training can improve decisions around alignment, safety, and deployment. In addition to predicting final loss, we developed methodology to predict more interpretable metrics of capability. One such metric is pass rate on the HumanEval dataset [37], which measures the ability to synthesize Python functions of varying complexity. We successfully predicted the pass rate on a subset of the HumanEval dataset by extrapolating from models trained with at most 1, 000× less compute (Figure 2).For an individual problem in HumanEval, performance may occasionally worsen with scale. Despite these challenges, we find an approximate power law relationship −EP [log(pass_rate(C))] = α∗C−kwhere k and α are positive constants, and P is a subset of problems in the dataset. We hypothesize that this relationship holds for all problems in this dataset. In practice, very low pass rates are difficult or impossible to estimate, so we restrict to problems P and models M such that given some large sample budget, every problem is solved at least once by every model.We registered predictions for GPT-4’s performance on HumanEval before training completed, using only information available prior to training. All but the 15 hardest HumanEval problems were split into 6 difficulty buckets based on the performance of smaller models. The results on the 3rd easiest bucket are shown in Figure 2, showing that the resulting predictions were very accurate for this subset of HumanEval problems where we can accurately estimate log(pass_rate) for several smaller models. Predictions on the other five buckets performed almost as well, the main exception being GPT-4 underperforming our predictions on the easiest bucket.Certain capabilities remain hard to predict. For example, the Inverse Scaling Prize [38] proposed several tasks for which model performance decreases as a function of scale. Similarly to a recent result by Wei et al. [39], we find that GPT-4 reverses this trend, as shown on one of the tasks called Hindsight Neglect [40] in Figure 3.We believe that accurately predicting future capabilities is important for safety. Going forward we plan to refine these methods and register performance predictions across various capabilities before large model training begins, and we hope this becomes a common goal in the field.

本文链接地址:https://www.jiuchutong.com/zhishi/298684.html 转载请保留说明!

上一篇:博客管理系统(前端页面设计)(博客管理系统开题报告)

下一篇:跟我学Python图像处理丨带你入门OpenGL(用python处理图像)

  • word怎么设置四周型文字环绕(word怎么设置四线三格)

    word怎么设置四周型文字环绕(word怎么设置四线三格)

  • 什么语言是用助记符代替操作码(什么语言是用助记)

    什么语言是用助记符代替操作码(什么语言是用助记)

  • 网速与路由器有关系吗(网速与路由器有关么)

    网速与路由器有关系吗(网速与路由器有关么)

  • 小米9微信怎么总是白屏(小米微信怎么加密码锁屏)

    小米9微信怎么总是白屏(小米微信怎么加密码锁屏)

  • 微信收款声音怎么关(微信收款声音怎么关闭)

    微信收款声音怎么关(微信收款声音怎么关闭)

  • vivox9悬浮窗开了但是不显示(vivos9悬浮窗)

    vivox9悬浮窗开了但是不显示(vivos9悬浮窗)

  • 微信运动会出错吗(微信运动会出错吗?早上起来显示走过4000多步)

    微信运动会出错吗(微信运动会出错吗?早上起来显示走过4000多步)

  • qcom-btd是什么设备

    qcom-btd是什么设备

  • 华为p30怎么关闭悬浮球(华为p30怎么关闭纯净模式)

    华为p30怎么关闭悬浮球(华为p30怎么关闭纯净模式)

  • 苹果手机id和密码都忘了怎么办(苹果手机id和密码)

    苹果手机id和密码都忘了怎么办(苹果手机id和密码)

  • 微信群发限制什么文字(微信群发功能限制了怎么办)

    微信群发限制什么文字(微信群发功能限制了怎么办)

  • 怎么把手机上的东西传到另一个手机上(怎么把手机上的app安装到电视上)

    怎么把手机上的东西传到另一个手机上(怎么把手机上的app安装到电视上)

  • 小电充电宝买了可以退吗(小电充电宝买了怎么不可以充电)

    小电充电宝买了可以退吗(小电充电宝买了怎么不可以充电)

  • 4g卡用5g手机上网快吗?(4g卡放在5g手机)

    4g卡用5g手机上网快吗?(4g卡放在5g手机)

  • 为什么excel输入公式不显示结果(为什么excel输入公式计算为0)

    为什么excel输入公式不显示结果(为什么excel输入公式计算为0)

  • nova6可以无线充电吗(nova6能否无线充电)

    nova6可以无线充电吗(nova6能否无线充电)

  • 华为p30呼叫转移怎么设置(华为p30呼叫转移在哪里)

    华为p30呼叫转移怎么设置(华为p30呼叫转移在哪里)

  • 演示机和真机有什么区别(演示机和真机有什么区别价钱差多少)

    演示机和真机有什么区别(演示机和真机有什么区别价钱差多少)

  • 淘宝补发后怎么付钱(淘宝补发怎么看)

    淘宝补发后怎么付钱(淘宝补发怎么看)

  • 退群了聊天信息还在吗(退群了之后是不是所有聊天记录都没有了)

    退群了聊天信息还在吗(退群了之后是不是所有聊天记录都没有了)

  • 微信百万保障怎么取消(微信百万保障怎么解除绑定)

    微信百万保障怎么取消(微信百万保障怎么解除绑定)

  • wifi智能扫一扫在哪(wifi的智能扫一扫)

    wifi智能扫一扫在哪(wifi的智能扫一扫)

  • 华为手机云盘在哪里找(华为手机云盘在哪里找视频)

    华为手机云盘在哪里找(华为手机云盘在哪里找视频)

  • wps怎么发文档(wps怎么发文档给别人)

    wps怎么发文档(wps怎么发文档给别人)

  • 年报纳税总额能查到吗
  • 增值税纳税申报表在哪里查询
  • 一般纳税人销项税和进项税如何抵扣
  • 税盘收费吗
  • 酒店购买的空调折旧计入管理费用吗
  • 普通电子发票如何冲红
  • 个人劳务报酬所得税率表
  • 取得运输业专用发票可以抵扣进项吗
  • 会计学中递延收益怎么算
  • 自制农产品采摘机器设备
  • 商业地产正常税率是多少
  • 限制性股票科目
  • 餐饮公司如何挣钱
  • 小规模纳税人需要汇算清缴吗
  • 招行理财产品哪些可靠
  • 红字发票怎么做帐
  • 地方教育费附加减免政策
  • 房地产的出租行为属于土地增值税征收范围吗
  • 支票入账怎么填写
  • 异地工程需要预交税吗
  • 房地产企业闲置土地怎么处理
  • 固定资产的折旧从什么时候开始
  • 基建工程施工单位罚款如何做账?
  • win7安装sqlserver2008
  • 王者荣耀中扁鹊的克星是谁
  • 应收账款平均余额怎么理解
  • 施工企业会计制度有哪些
  • 电脑bios怎么设置网络启动
  • php 签名算法
  • 如何用腾讯电脑管家回复格式化U盘
  • php
  • 合作社实际没有法人代表
  • php数组函数题目
  • 工地需要安装什么标识牌
  • 笔记本cpu温度高如何处理
  • 处置二手固定资产
  • 小企业会计科目表
  • php 字符串处理函数
  • yolo v5详解
  • 进口固定资产支付的关税
  • 所得税预缴申报表怎么填
  • 建筑保温材料出台了哪些限制政策
  • 建筑公司预收账款财税怎么处理
  • 预扣预缴申报未缴税款
  • mongodb4.4安装
  • dedecms配置
  • 办税人员可绑定银行卡吗
  • 预收账款期末余额在借方还是贷方
  • 固定资产与固定资产净值的区别
  • 差旅费退回怎么做账
  • 交强险还用开车去吗
  • 加油票和过桥过路费怎么做账
  • 原材料转固定资产账务处理
  • 职工福利费税前扣除标准是应发工资还是实发工资
  • 差旅费报销单填写模板电子版
  • 低值易耗的管理制度
  • 权益类会计科目有哪些科目
  • 会计凭证中转是什么
  • 1.金融资产有哪些基本类型?
  • 作废发票丢了罚款多少
  • 内账咋做
  • mysql分页效率
  • sql返回数据条数
  • 收缩后对数据库有影响吗
  • Win7x64下Mysql5.7.18解压版的安装方法
  • mysql5.5.62安装配置教程
  • windows 远程
  • windows10右键菜单打开太慢
  • win7电脑频繁自动重启是什么原因造成的
  • linux的发展
  • apt软件
  • u盘比特率
  • win8系统找不到无线网络
  • win10更新2021年6月
  • win7如何变快
  • windows7默认网关不可用
  • jquery实现图片显示
  • nodejs如何配置环境变量
  • 地方税务局网上申报
  • 小微企业企业所得税率
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设