位置: IT常识 - 正文

ChatGPT研究分析:GPT-4做了什么(patriotic研究)

编辑:rootadmin
ChatGPT研究分析:GPT-4做了什么

推荐整理分享ChatGPT研究分析:GPT-4做了什么(patriotic研究),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:ptst分析法,ptst分析法,srtp研究报告,ptst分析法,ptst分析法,srtp研究报告,chartted研究,chartted研究,内容如对您有帮助,希望把文章链接给更多的朋友!

前脚刚研究了一轮GPT3.5,OpenAI很快就升级了GPT-4,整体表现有进一步提升。追赶一下潮流,研究研究GPT-4干了啥。

本文内容全部源于对OpenAI公开的技术报告的解读,通篇以PR效果为主,实际内容不多。主要强调的工作,是“Predictable Scaling”这个概念。

ChatGPT研究分析:GPT-4做了什么(patriotic研究)

上一版ChatGPT的主要挑战是,因为模型的训练量极大,很难去进行优化(ChatGPT是fine-tuning的模式)。因此,OpenAI希望能够在模型训练初期,就进行优化,从而大幅提升人工调优迭代的效率。而想要进行调优,就得知道当前模型的效果如何。因此,这个问题就被转化为了:如何在模型训练初期,就能够预测最终训练完成后的实际效果。

从结果来看,ChatGPT实现了,仅仅执行千分之一到万分之一的训练量,就可以大致预测模型的结果。

实现原理相对简单,就是在某一个模型的不同训练阶段进行实际效果测量,然后做函数拟合,发现符合幂等曲线。然后再基于采样值,测算一下幂等函数的相关参数,下一轮就可以只进行少量训练,就去预测最终效果了。

至于其他效果上的优化,OpenAI没有进一步解读原理,但整体应该还是基于“训练-奖励”的优化模型,去生成更针对性的奖励模型(比如增加法律、安全之类的奖励判断),以实现更优的效果。

原版内容如下:

3 Predictable ScalingA large focus of the GPT-4 project was building a deep learning stack that scales predictably. The primary reason is that for very large training runs like GPT-4, it is not feasible to do extensive model-specific tuning. To address this, we developed infrastructure and optimization methods that have very predictable behavior across multiple scales. These improvements allowed us to reliably predict some aspects of the performance of GPT-4 from smaller models trained using 1, 000× – 10, 000× less compute.3.1 Loss PredictionThe final loss of properly-trained large language models is thought to be well approximated by power laws in the amount of compute used to train the model [35, 36, 2, 14, 15].To verify the scalability of our optimization infrastructure, we predicted GPT-4’s final loss on our internal codebase (not part of the training set) by fitting a scaling law with an irreducible loss term (as in Henighan et al. [15]): L(C) = aCb + c, from models trained using the same methodology but using at most 10,000x less compute than GPT-4. This prediction was made shortly after the run started, without use of any partial results. The fitted scaling law predicted GPT-4’s final loss with high accuracy (Figure 1).3.2 Scaling of Capabilities on HumanEvalHaving a sense of the capabilities of a model before training can improve decisions around alignment, safety, and deployment. In addition to predicting final loss, we developed methodology to predict more interpretable metrics of capability. One such metric is pass rate on the HumanEval dataset [37], which measures the ability to synthesize Python functions of varying complexity. We successfully predicted the pass rate on a subset of the HumanEval dataset by extrapolating from models trained with at most 1, 000× less compute (Figure 2).For an individual problem in HumanEval, performance may occasionally worsen with scale. Despite these challenges, we find an approximate power law relationship −EP [log(pass_rate(C))] = α∗C−kwhere k and α are positive constants, and P is a subset of problems in the dataset. We hypothesize that this relationship holds for all problems in this dataset. In practice, very low pass rates are difficult or impossible to estimate, so we restrict to problems P and models M such that given some large sample budget, every problem is solved at least once by every model.We registered predictions for GPT-4’s performance on HumanEval before training completed, using only information available prior to training. All but the 15 hardest HumanEval problems were split into 6 difficulty buckets based on the performance of smaller models. The results on the 3rd easiest bucket are shown in Figure 2, showing that the resulting predictions were very accurate for this subset of HumanEval problems where we can accurately estimate log(pass_rate) for several smaller models. Predictions on the other five buckets performed almost as well, the main exception being GPT-4 underperforming our predictions on the easiest bucket.Certain capabilities remain hard to predict. For example, the Inverse Scaling Prize [38] proposed several tasks for which model performance decreases as a function of scale. Similarly to a recent result by Wei et al. [39], we find that GPT-4 reverses this trend, as shown on one of the tasks called Hindsight Neglect [40] in Figure 3.We believe that accurately predicting future capabilities is important for safety. Going forward we plan to refine these methods and register performance predictions across various capabilities before large model training begins, and we hope this becomes a common goal in the field.

本文链接地址:https://www.jiuchutong.com/zhishi/298684.html 转载请保留说明!

上一篇:博客管理系统(前端页面设计)(博客管理系统开题报告)

下一篇:跟我学Python图像处理丨带你入门OpenGL(用python处理图像)

  • integer转string(integer转string怎么转)

    integer转string(integer转string怎么转)

  • 电脑怎么锁屏(电脑怎么锁屏幕)

    电脑怎么锁屏(电脑怎么锁屏幕)

  • 苹果系统什么时候更新13

    苹果系统什么时候更新13

  • soul收到挂件怎么去掉(soul挂件能送给自己吗)

    soul收到挂件怎么去掉(soul挂件能送给自己吗)

  • iphone11与华为p40对比(iphone11与华为p40pro对比)

    iphone11与华为p40对比(iphone11与华为p40pro对比)

  • pr导出什么格式手机能看(pr导出什么格式可以再次编辑)

    pr导出什么格式手机能看(pr导出什么格式可以再次编辑)

  • 蓝牙耳机连接手机经常中断怎么回事(蓝牙耳机连接手机成功但是没声音)

    蓝牙耳机连接手机经常中断怎么回事(蓝牙耳机连接手机成功但是没声音)

  • 微信删人会被发现吗(微信删人会通知吗)

    微信删人会被发现吗(微信删人会通知吗)

  • 小米蓝牙耳机air2和2s的区别(小米蓝牙耳机air2 se使用方法)

    小米蓝牙耳机air2和2s的区别(小米蓝牙耳机air2 se使用方法)

  • 抖音好友可见对方知道吗(抖音好友可见对方会看到我的设置?)

    抖音好友可见对方知道吗(抖音好友可见对方会看到我的设置?)

  • 第一次登录qq怎么登(第一次登录QQ怎么登2022)

    第一次登录qq怎么登(第一次登录QQ怎么登2022)

  • word文档生成条码(word里怎么生成条形码)

    word文档生成条码(word里怎么生成条形码)

  • 趣分类可以注销账号吗(趣分类封号了怎么办)

    趣分类可以注销账号吗(趣分类封号了怎么办)

  • 华为mate30好久上市(华为mate30多久会降价)

    华为mate30好久上市(华为mate30多久会降价)

  • 学生计算机怎么关机(学生计算机怎么设置小数点)

    学生计算机怎么关机(学生计算机怎么设置小数点)

  • 淘宝已完结的违规怎么清除(淘宝商品违规了删掉之后为什么违规记录还在)

    淘宝已完结的违规怎么清除(淘宝商品违规了删掉之后为什么违规记录还在)

  • 苹果8怎么关闭自拍镜像(苹果8怎么关闭自动亮度)

    苹果8怎么关闭自拍镜像(苹果8怎么关闭自动亮度)

  • bkltl10什么型号(bkkal10是什么型号多少钱)

    bkltl10什么型号(bkkal10是什么型号多少钱)

  • 怎样把照片改成500k(怎样把照片改成jpg格式)

    怎样把照片改成500k(怎样把照片改成jpg格式)

  • 360安全浏览器如何查看电视直播(360安全浏览器如何退出登录)

    360安全浏览器如何查看电视直播(360安全浏览器如何退出登录)

  • 拼多多参团就是拼单吗(拼多多参团就是拼团吗)

    拼多多参团就是拼单吗(拼多多参团就是拼团吗)

  • 苹果xr死机正常吗(苹果xr死机咋办)

    苹果xr死机正常吗(苹果xr死机咋办)

  • 苹果系统和安卓系统的区别(苹果系统和安卓系统王者荣耀互通)

    苹果系统和安卓系统的区别(苹果系统和安卓系统王者荣耀互通)

  • 调整低电量通知时间(调整低电量通知怎么设置)

    调整低电量通知时间(调整低电量通知怎么设置)

  • 代扣个人借款分录
  • 简易征收怎样计提增值税
  • 哪些准备金支出可实现税前扣除?
  • 经销商返点方案范文
  • 财报中计提
  • 公司现金支票取钱需要带什么资料
  • 为职工支付的补充养老保险计入哪
  • 发生哪些情形的应判定为重大电力安全隐患
  • 应收账款售让会计分录怎么写?
  • 差额发票和全额发票的税率
  • 小规模公司零申报怎么操作流程
  • 投资收益在什么科目
  • 销售固定资产可以开专票吗
  • 小规模纳税人开专票税率是1%还是3%
  • 同一个行政区
  • 一般纳税人购进原材料支付的增值税
  • 完税凭证丢失如何补办
  • 产品研发的规则
  • 电梯管理费属什么类别
  • 固废处理计入什么会计科
  • 个体户开劳务费税率
  • 未开票的货款记什么科目
  • 中央空调销售与安装开票税率
  • 总资产净利率与权益乘数的关系
  • .exe文件怎么打不开
  • 计提工资和发放工资区别
  • 土地价款扣除会计分录
  • 职工福利费的会计科目是什么
  • 华为鸿蒙系统看PDF文件会不多次存
  • linux开启远程ssh
  • 默认网关不可用win7
  • 蜻蜓翅膀特写怎么画
  • vue项目上线教程
  • 超经营范围开具发票
  • 新成立公司实收资本没到位该怎么做账
  • html导航栏边框
  • 2023英伟达显卡天梯图完整版
  • 微信小程序实训内容
  • VUE-CLI/VUE-ROUTER
  • 每季度报税什么意思
  • 资产负债表里长期股权投资是什么意思
  • phpcms v9用户手册
  • 织梦相关文章调用
  • MySQL发生系统错误2和5
  • 未实际支付的成本能否列支
  • 工程项目工资表
  • 发放工资的转账支票收款人
  • 小企业如何核算成本费用
  • 不良资产处置公司违法吗
  • 嵌入式软件产品应纳税额
  • 税收滞纳金可以扣除吗
  • 出口没做免税申请怎么办
  • 长期股权投资成本法会计处理
  • 收到收到
  • 财付通入帐中
  • 价税分离怎么算
  • 递延所得税与递延所得税费用
  • mysql关联查询原理
  • mysql中文乱码解决的命令
  • win8.1怎么重新装系统
  • win10启动项怎么设置
  • Windows Server 2008制作密码重设盘
  • 海尔笔记本最新款
  • win10不能显示桌面
  • ubuntu 系统卡住
  • windows xp的电脑
  • rhel-server
  • win10系统样子
  • 在对linux系统中dir
  • 史上最全的领域学说
  • Extjs gridpanel 出现横向滚动条问题的解决方法
  • jQuery+Ajax实现无刷新分页
  • Node.js中的事件循环是什么
  • python twinter
  • 怎么查询河南省考职位报名人数
  • 不配合税务检查的法律责任
  • 国税局征管科
  • 个人涉税信息采集 工行
  • 坚持问题导向的前提是
  • 求资金占用利息的公式
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设