位置: IT常识 - 正文

生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用)

编辑:rootadmin
原力计划生成式 AI 分析:大模型 + 大量数据的神奇效果 前言

推荐整理分享生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:生成.a,ai形成生成器工具怎么用,生成式方法,ai生成模型,基于ai的生成器,生成式方法,基于ai的生成器,ai生成技术,内容如对您有帮助,希望把文章链接给更多的朋友!

如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。

大模型的涌现能力 (Emergent Ability)

下图是模型性能(Loss for next token prediction)与「参数量」和「数据集大小」之间的关系,可以看出随着「参数量」和「数据集大小」不断变大,模型性能不断增强,仿佛不会遇到瓶颈。

下图展现了大模型的涌现能力,即语言模型的性能随着参数量增加并不是线性关系,而是突然跃升,即涌现。在未达到门槛之前,性能一直在随机的水平徘徊。

Calibration

在上面的实验图中,Calibration 指「模型置信度」与「真实概率」之间的关系,即满足「置信度高 -> 正确」、「置信度低 -> 可能错误」的模型,其 Calibration 指标越好。

因此 Calibration 实际上对应着「模型是否知道自己错了」这件事,如下图所示,不同参数量的模型对应不同的颜色,可以看到模型越大,其对自己是否出错的把握越大,即「模型置信度」与「真实概率」更为贴合。

Inverse Scaling Prize

一个比赛,奖金悬赏,寻找能让「模型越大,性能越差」的任务。

在这个比赛的任务中,许多之前的 “大模型” 随着参数量变大,其性能确实变差了,但当拿出更大的模型之后,其性能又好了起来,并产生了一段 U 型曲线。

这个比赛中的任务,一般都是「具体误导性的」,例如下述这个例子:

因此对于上述这种 U 型曲线,一种猜测是:这些任务里通常包含着一些误导任务,例如上述的 5 元,当模型还没有很大的时候,由于一知半解,就会接受被误导的方法,进而使其比随机效果还要差,但当其变得足够大时,就会得到真正的结果,类似于上述的计算期望值。

Switch Transformer生成式 AI 分析:大模型 + 大量数据的神奇效果(ai形成生成器工具怎么用)

Switch Transformer 模型参数量为 1.6T(GPT-3 为 1750 亿,GPT-3.5 为 2000 亿),其使用了 Mixture-of-expert 的结构,即在模型推断(Inference)的时候,选取不同的 Module,进而加快推断速度。

大数据的重要性

足够大量的数据才能让模型学会「常识,即世界知识」,如下图所示,横坐标为数据量。 数据集准备过程:

过滤有害内容(google 安全搜索)去除 HTML 标签用规则去除低品质数据去除重复数据过滤出测试集(例如 GPT-3 就未过滤出测试集)

「大模型」还是「大数据」

在固定的运算资源时,应该优先「大模型」还是「大数据」?看目前的趋势,模型大小越来越大,但训练数据量并没有明显变化。

根据下图(颜色代表固定的运算资源,横坐标为参数量,参数量越大,数据量越小),可以发现「大模型」和「大数据」需要取得平衡,只增加模型大小,不增加算力,只会让训练结果变得更差。

每个 U 型曲线取一个最低点,得到下图所示的算力与参数量(Parameters)和数据量(Tokens)之间的关系。

根据上述估计图,Google 重新估计了 Gopher(参数量为 280 Billion,数据量为 300 Billion) 对应的算力下,应该采取的参数量和数据量方案,于是训练得到了 Chinchilla(参数量为 63 Billon,数据量为 1.4 Trillion)。对比之后,发现 Chinchilla 大胜 Gopher。

根据上述结果,进一步给出了具体的「参数量」与「数据量」之间的关系:

最新的 LLaMA 也采用了这种「减少参数量,扩大数据量」的方案:

KNN LM

通常来说,语言模型在做一个分类问题,即输入为「清华大」,输出为各个候选词的概率,随后选出概率最高的词即可。

如下所示,Transformer 得到 Text 的 Embedding,随后通过线性层 + softmax 转换为分类问题。 与之对比,KNN LM 在得到 Repesentation 后,不仅训练了一个分类器,还将测试 Text 的 Repesentation 与训练数据得到的 Repesentation 进行距离计算,并根据距离得到下一个词的预测概率,再与原始分类器结合起来,得到最终结果。

另外,KNN LM 可以拿任意资料与测试 Text 的 Representation 计算距离,并不局限于训练数据。因此 KNN LM 这种机制可以使模型训练时更专注于一些难度更高的问题,对于一些仅需记忆的问题则可以通过这种方式解决。

参考资料Hung-yi Lee:生成式 AI(一)Scaling Laws for Neural Language ModelsEmergent Abilities of Large Language ModelsInverse scaling can become U-shapedSwitch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient SparsityWhen Do You Need Billions of Words of Pretraining Data?Scaling Language Models: Methods, Analysis & Insights from Training GopherDeduplicating Training Data Makes Language Models BetterTraining Compute-Optimal Large Language ModelsScaling Instruction-Finetuned Language ModelsIntroduction of ChatGPTTraining language models to follow instructions with human feedbackLearning to summarize from human feedbackGgeneralization Through Memorization: Nearest Neighbor Language ModelsLanguage Is Not All You Need: Aligning Perception with Language Models
本文链接地址:https://www.jiuchutong.com/zhishi/299778.html 转载请保留说明!

上一篇:ChatGPT频频发疯!马斯克警告:AI将毁灭人类

下一篇:Jquery 选择兄弟节点(jquery 兄弟选择器)

  • b站如何下载音频(b站怎么直接下载音频)

    b站如何下载音频(b站怎么直接下载音频)

  • 快手减少类似直播解除(快手减少类似直播怎么恢复步骤)

    快手减少类似直播解除(快手减少类似直播怎么恢复步骤)

  • p30pro如何升级emui10(p30pro如何升级emui11)

    p30pro如何升级emui10(p30pro如何升级emui11)

  • 微信人脸验证授权在哪设置(微信人脸验证一直失败怎么办)

    微信人脸验证授权在哪设置(微信人脸验证一直失败怎么办)

  • 华为eva-aloo什么型号(华为eva aloo)

    华为eva-aloo什么型号(华为eva aloo)

  • 录音m4a是什么意思呀(录音m4a是mp4吗)

    录音m4a是什么意思呀(录音m4a是mp4吗)

  • 音量键回弹无力怎么办(音量键回弹无力 湿纸巾解决)

    音量键回弹无力怎么办(音量键回弹无力 湿纸巾解决)

  • 表格怎么插入一列(表格怎么增加一行一模一样的表格)

    表格怎么插入一列(表格怎么增加一行一模一样的表格)

  • 针式打印机打印不完整(针式打印机打印出来一半有一半没有)

    针式打印机打印不完整(针式打印机打印出来一半有一半没有)

  • 抖音直播间抽卡怎么用(抖音抽卡怎么才能抽到2021)

    抖音直播间抽卡怎么用(抖音抽卡怎么才能抽到2021)

  • word里面除号怎么打(word里除号怎么输入)

    word里面除号怎么打(word里除号怎么输入)

  • 荣耀20青春版怎么关闭悬浮球(荣耀20青春版怎么录屏)

    荣耀20青春版怎么关闭悬浮球(荣耀20青春版怎么录屏)

  • iphone11有耳机插孔吗(iphone 11插耳机)

    iphone11有耳机插孔吗(iphone 11插耳机)

  • vivo手机怎么传歌到mp3(vivo手机怎么传数据到苹果手机)

    vivo手机怎么传歌到mp3(vivo手机怎么传数据到苹果手机)

  • 抖音抢镜怎么调大图框(抖音里的抢镜怎么弄的)

    抖音抢镜怎么调大图框(抖音里的抢镜怎么弄的)

  • 软件危机的主要表现(软件危机的主要原因)

    软件危机的主要表现(软件危机的主要原因)

  • 手机怎么把视频变清晰(手机怎么把视频转成文件)

    手机怎么把视频变清晰(手机怎么把视频转成文件)

  • rgb转cmyk后偏色严重(rgb转cmyk颜色变了)

    rgb转cmyk后偏色严重(rgb转cmyk颜色变了)

  • 快影如何打封面标题上去(快影如何打封面图片)

    快影如何打封面标题上去(快影如何打封面图片)

  • 爱奇艺用券是什么意思(爱奇艺用劵)

    爱奇艺用券是什么意思(爱奇艺用劵)

  • 华为nova3可以开空调吗(华为nova3可以开多少帧)

    华为nova3可以开空调吗(华为nova3可以开多少帧)

  • 机皇是什么意思(机皇htc)

    机皇是什么意思(机皇htc)

  • msspnp - msspnp是什么进程 有什么用(msp 什么意思)

    msspnp - msspnp是什么进程 有什么用(msp 什么意思)

  • Linux系统xlsatom命令如何使用?(linux xmrig)

    Linux系统xlsatom命令如何使用?(linux xmrig)

  • 谈谈linux网络编程中的应用层协议定制、Json序列化与反序列化那些事(linux的网络编程)

    谈谈linux网络编程中的应用层协议定制、Json序列化与反序列化那些事(linux的网络编程)

  • 前端已死?我看未必,但「低代码」已剑指前端程序员(前端cgi)

    前端已死?我看未必,但「低代码」已剑指前端程序员(前端cgi)

  • 不确认递延所得税的特殊情况
  • 医药行业发票税率
  • 个体户查账征收怎么交税?
  • 其他应付款计入资本公积
  • 长期股权投资超过50%
  • 购买车位需要交哪些税
  • 你觉得微信提现收费合理吗?
  • 学校付学生的现金奖励入什么科目
  • 地产佣金收入属什么收入
  • 企业债务的利息允许从税前利润扣除是什么意思
  • 银行汇票的概念
  • 不动产拍卖税费怎么计算
  • 税收编码名称是什么
  • 开票资料没有电话号码可以写法人名字吗
  • 销售废旧物资账务处理
  • 企业电子印章申请流程海口
  • 人力资源服务差额
  • win8系统怎么关闭防火墙
  • windows11怎么显示桌面图标
  • 信息化投入费用包括哪些
  • 什么是冻结账户的情形
  • linux sed 行尾
  • 什么票据行为是合法的
  • 融资租赁的租金是什么意思
  • php的工作流程
  • 穿墙路由器怎么选择
  • mac安装wine教程
  • 处置设备影响的净损益
  • 货物运输业增值税发票样本
  • failed to execute goal org.apache
  • 梅尔加足球俱乐部
  • 什么是大语言模型(LLM)?
  • 公司汽车折旧计算方法用那种
  • 小程序官方组件展示
  • 盈余公积金的账务处理
  • 固定资产折完了怎么办
  • 购买金税盘是全额抵扣吗
  • 支票的法人章盖倒了了可以吗
  • mysql存储过程传入参数
  • 员工自己全额承担社保费用要计提吗
  • 社保缴费基数怎么算
  • 职工意外伤害险赔偿标准
  • 扣缴境外公司增值税
  • 公司租赁职工车辆账务处理
  • 行政单位应缴预算款原则上按月缴清
  • 文化事业建设费计入什么科目
  • 积分兑换礼品需要什么
  • 权益法下股权投资转让
  • 分期收款发出商品一批,售价50000
  • 存货报废如何做账
  • 工会经费是应付职工福利还是管理费用
  • 物流公司账务处理流程及方法
  • 非营利机构如何申请
  • 跨年度退货可以不退款吗
  • 企业项目贷款所需资料
  • 1.金融资产有哪些基本类型?
  • 用户登陆login什么意思
  • mysql登陆error2002
  • sql查询从入门到实践
  • xp软件自动启动
  • linux ln命令 -s
  • vim删除^m
  • /proc目录造成linux根目录爆满
  • vsftpd怎么配置
  • linux树形结构
  • nodejs 代码加密
  • pygal python
  • perl中@_
  • jquery form表单
  • 中间件 .net
  • 弹簧设计软件手机版
  • javascript教程完整版
  • 抽奖小程序模板
  • javascript的dom
  • dom操作中获取节点的方法有哪几种
  • jquery 异步提交表单
  • jqueryw3c
  • 电子税务局如何签订三方协议扣款
  • 朝阳区地方税务局电话
  • 监理费合同按什么计算
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设