位置: IT常识 - 正文

生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用)

编辑:rootadmin
原力计划生成式 AI 分析:大模型 + 大量数据的神奇效果 前言

推荐整理分享生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:生成.a,ai形成生成器工具怎么用,生成式方法,ai生成模型,基于ai的生成器,生成式方法,基于ai的生成器,ai生成技术,内容如对您有帮助,希望把文章链接给更多的朋友!

如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。

大模型的涌现能力 (Emergent Ability)

下图是模型性能(Loss for next token prediction)与「参数量」和「数据集大小」之间的关系,可以看出随着「参数量」和「数据集大小」不断变大,模型性能不断增强,仿佛不会遇到瓶颈。

下图展现了大模型的涌现能力,即语言模型的性能随着参数量增加并不是线性关系,而是突然跃升,即涌现。在未达到门槛之前,性能一直在随机的水平徘徊。

Calibration

在上面的实验图中,Calibration 指「模型置信度」与「真实概率」之间的关系,即满足「置信度高 -> 正确」、「置信度低 -> 可能错误」的模型,其 Calibration 指标越好。

因此 Calibration 实际上对应着「模型是否知道自己错了」这件事,如下图所示,不同参数量的模型对应不同的颜色,可以看到模型越大,其对自己是否出错的把握越大,即「模型置信度」与「真实概率」更为贴合。

Inverse Scaling Prize

一个比赛,奖金悬赏,寻找能让「模型越大,性能越差」的任务。

在这个比赛的任务中,许多之前的 “大模型” 随着参数量变大,其性能确实变差了,但当拿出更大的模型之后,其性能又好了起来,并产生了一段 U 型曲线。

这个比赛中的任务,一般都是「具体误导性的」,例如下述这个例子:

因此对于上述这种 U 型曲线,一种猜测是:这些任务里通常包含着一些误导任务,例如上述的 5 元,当模型还没有很大的时候,由于一知半解,就会接受被误导的方法,进而使其比随机效果还要差,但当其变得足够大时,就会得到真正的结果,类似于上述的计算期望值。

Switch Transformer生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用)

Switch Transformer 模型参数量为 1.6T(GPT-3 为 1750 亿,GPT-3.5 为 2000 亿),其使用了 Mixture-of-expert 的结构,即在模型推断(Inference)的时候,选取不同的 Module,进而加快推断速度。

大数据的重要性

足够大量的数据才能让模型学会「常识,即世界知识」,如下图所示,横坐标为数据量。 数据集准备过程:

过滤有害内容(google 安全搜索)去除 HTML 标签用规则去除低品质数据去除重复数据过滤出测试集(例如 GPT-3 就未过滤出测试集)

「大模型」还是「大数据」

在固定的运算资源时,应该优先「大模型」还是「大数据」?看目前的趋势,模型大小越来越大,但训练数据量并没有明显变化。

根据下图(颜色代表固定的运算资源,横坐标为参数量,参数量越大,数据量越小),可以发现「大模型」和「大数据」需要取得平衡,只增加模型大小,不增加算力,只会让训练结果变得更差。

每个 U 型曲线取一个最低点,得到下图所示的算力与参数量(Parameters)和数据量(Tokens)之间的关系。

根据上述估计图,Google 重新估计了 Gopher(参数量为 280 Billion,数据量为 300 Billion) 对应的算力下,应该采取的参数量和数据量方案,于是训练得到了 Chinchilla(参数量为 63 Billon,数据量为 1.4 Trillion)。对比之后,发现 Chinchilla 大胜 Gopher。

根据上述结果,进一步给出了具体的「参数量」与「数据量」之间的关系:

最新的 LLaMA 也采用了这种「减少参数量,扩大数据量」的方案:

KNN LM

通常来说,语言模型在做一个分类问题,即输入为「清华大」,输出为各个候选词的概率,随后选出概率最高的词即可。

如下所示,Transformer 得到 Text 的 Embedding,随后通过线性层 + softmax 转换为分类问题。 与之对比,KNN LM 在得到 Repesentation 后,不仅训练了一个分类器,还将测试 Text 的 Repesentation 与训练数据得到的 Repesentation 进行距离计算,并根据距离得到下一个词的预测概率,再与原始分类器结合起来,得到最终结果。

另外,KNN LM 可以拿任意资料与测试 Text 的 Representation 计算距离,并不局限于训练数据。因此 KNN LM 这种机制可以使模型训练时更专注于一些难度更高的问题,对于一些仅需记忆的问题则可以通过这种方式解决。

参考资料Hung-yi Lee:生成式 AI(一)Scaling Laws for Neural Language ModelsEmergent Abilities of Large Language ModelsInverse scaling can become U-shapedSwitch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient SparsityWhen Do You Need Billions of Words of Pretraining Data?Scaling Language Models: Methods, Analysis & Insights from Training GopherDeduplicating Training Data Makes Language Models BetterTraining Compute-Optimal Large Language ModelsScaling Instruction-Finetuned Language ModelsIntroduction of ChatGPTTraining language models to follow instructions with human feedbackLearning to summarize from human feedbackGgeneralization Through Memorization: Nearest Neighbor Language ModelsLanguage Is Not All You Need: Aligning Perception with Language Models
本文链接地址:https://www.jiuchutong.com/zhishi/299778.html 转载请保留说明!

上一篇:ChatGPT频频发疯!马斯克警告:AI将毁灭人类

下一篇:Jquery 选择兄弟节点(jquery 兄弟选择器)

  • 天翼网关宽带识别码在哪里(天翼网关宽带识别码是设备标识吗)

    天翼网关宽带识别码在哪里(天翼网关宽带识别码是设备标识吗)

  • 荣耀30pro如何拍慢动作(荣耀30pro如何拍夜景)

    荣耀30pro如何拍慢动作(荣耀30pro如何拍夜景)

  • 抖音被别人屏蔽什么状态(抖音被别人屏蔽还可以搜到吗)

    抖音被别人屏蔽什么状态(抖音被别人屏蔽还可以搜到吗)

  • 发现电脑感染病毒断开网络的目的是(发现电脑感染病毒第一时间拔掉网线的目的是)

    发现电脑感染病毒断开网络的目的是(发现电脑感染病毒第一时间拔掉网线的目的是)

  • html中空格代码是什么(html空格代码/n)

    html中空格代码是什么(html空格代码/n)

  • qq一共有多少个字符(qq一共有多少个普通字符)

    qq一共有多少个字符(qq一共有多少个普通字符)

  • 苹果5还能更新系统吗(苹果还能更新15系统吗)

    苹果5还能更新系统吗(苹果还能更新15系统吗)

  • REV缩写是什么意思(rev这个缩写是什么意思)

    REV缩写是什么意思(rev这个缩写是什么意思)

  • 苹果x屏幕边缘松动了(苹果手机左侧屏幕边缘失灵)

    苹果x屏幕边缘松动了(苹果手机左侧屏幕边缘失灵)

  • 2.1a充电器是什么意思(2.1a的充电器)

    2.1a充电器是什么意思(2.1a的充电器)

  • 淘宝怎么选择快递公司(淘宝怎么选择快递柜退货)

    淘宝怎么选择快递公司(淘宝怎么选择快递柜退货)

  • 华为p30pro有OTG功能吗

    华为p30pro有OTG功能吗

  • 小米黑鲨充不进去电怎么办(黑鲨充电充不进去)

    小米黑鲨充不进去电怎么办(黑鲨充电充不进去)

  • 拉黑了还能收到短信吗(拉黑了还能收到添加好友请求吗)

    拉黑了还能收到短信吗(拉黑了还能收到添加好友请求吗)

  • qq空间被挡访客啥意思(qq空间被挡访客能全部查看到吗)

    qq空间被挡访客啥意思(qq空间被挡访客能全部查看到吗)

  • word怎么增加下划线长度(WORD怎么增加下一页)

    word怎么增加下划线长度(WORD怎么增加下一页)

  • oppo手机在哪里下载软件(oppo手机在哪里恢复出厂设置)

    oppo手机在哪里下载软件(oppo手机在哪里恢复出厂设置)

  • 苹果11可不可以无线充电(苹果11可不可以开空调)

    苹果11可不可以无线充电(苹果11可不可以开空调)

  • word页面变成左右两张(word页面变成左右两页,100%显示也是两页)

    word页面变成左右两张(word页面变成左右两页,100%显示也是两页)

  • 华为手机抖音连不上网怎么办(华为手机抖音连续播放视频怎么设置)

    华为手机抖音连不上网怎么办(华为手机抖音连续播放视频怎么设置)

  • 苹果热点怎么踢人(苹果热点怎么踢掉别人)

    苹果热点怎么踢人(苹果热点怎么踢掉别人)

  • oppok3支持无线充电吗(oppo3可以无线充电吗)

    oppok3支持无线充电吗(oppo3可以无线充电吗)

  • 手机屏幕自动亮(手机屏幕自动亮屏)

    手机屏幕自动亮(手机屏幕自动亮屏)

  • 电话欠费不注销会怎样(电话号欠费不注销)

    电话欠费不注销会怎样(电话号欠费不注销)

  • win1020H2更新KB2538242补丁失败怎么办 五种方法快速修复(win1020h2更新0x800f081f)

    win1020H2更新KB2538242补丁失败怎么办 五种方法快速修复(win1020h2更新0x800f081f)

  • 如何将web前端连接数据库(web前后端连接)

    如何将web前端连接数据库(web前后端连接)

  • 301重定向到https 并且不带www跳转到带www

    301重定向到https 并且不带www跳转到带www

  • 增值税申报表出口退税
  • 借款入账会计分录
  • 品种法,分批法,分步法是什么
  • 个人补缴的医保要做账吗
  • 住房补贴需要交什么材料
  • 小规模纳税人企业购进货物和接受应税劳务时
  • 企业所有者权益科目有哪些
  • 海关进口发票可以退税吗
  • 进项税未抵扣进账了怎么处理
  • 个人打钱对公账户,可以算公司营业收入吗
  • 补交的增值税可以从留抵里面扣嘛
  • 零申报企业所得税季度申报表怎么填写
  • 抵债物品销售
  • 延迟交款收息做什么科目?
  • 建筑工程公司涉及的会计科目
  • 收到发票错误主管有责任吗
  • 挂靠被查出来后挂靠费怎么处理?
  • 固定资产加速折旧方法
  • 母公司如何将子公司转让
  • 关联公司代付款协议
  • 库存股股本属于什么科目,借贷方向
  • ie浏览器打开后显示已停止工作
  • ScanMailOutLook.exe - ScanMailOutLook是什么进程 有什么用
  • 鸿蒙实用工具在哪里
  • php怎么创建数据表
  • 国地税合并有什么角度写论文
  • 房企因商品质量问题退租
  • vue使用jquery
  • php图像
  • 天猫提现到对公账户怎么做账
  • 累计应缴预缴所得税怎么算
  • 跨地区经营建筑企业预缴增值税
  • 怎样取消红字
  • 因质量问题对方直接扣款怎么处理
  • 垃圾费放在哪个会计科目
  • 确认递延所得税资产时,应估计相关可抵扣
  • 企业年度报告包括哪些内容
  • 发票没拿回来可以报销吗
  • 总结帝国cms内容是什么
  • Python中的关键字
  • 支付长期借款利息时,应借记什么账户
  • 固定资产盘盈为何要交所得税
  • 金税四期介绍 王军
  • 计提的生产车间职工工资
  • 新收入准则确认收入的条件
  • 哪些拍卖行为不属于诈骗
  • 如何开具污水处理证明
  • 应收分保未到期责任准备金是什么科目
  • 长期应付账款是什么
  • 企业的营业税金怎么计算
  • 工资挂账怎样做账
  • 开发间接费用怎么计算
  • 公司给员工租的宿舍如何做分录
  • 电信线路租用费用
  • 待抵扣进项税额是什么情况下用的
  • 固定资产清理时累计折旧提完了怎么账务处理
  • 会计记账基础有哪两种
  • 制造费用怎么结算
  • 修改远程桌面端口后,远程桌面连不上
  • win2008 无线网卡
  • 如何将windows安装到u盘
  • linux系统配置命令
  • vcpkgsrv.exe是什么进程
  • ubuntu20开机自启动
  • win7系统摄像头图标不见了
  • win7怎么免费升级win11
  • 黑客怎样入侵别人手机
  • win10如何打开ie8
  • 安卓影音播放软件
  • lessons there是什么意思
  • docker save -o
  • bat文件指令
  • unity jsonutility 数组
  • js的运算符
  • 安卓手机wifi界面
  • unity preferences
  • 关于Colloder事件
  • javascript绘制图形
  • 境外投资收益如何交税
  • 娱乐会所一般有什么
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设