位置: IT常识 - 正文

什么是ChatGPT(什么是CHATGPT)

编辑:rootadmin
什么是ChatGPT

推荐整理分享什么是ChatGPT(什么是CHATGPT),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:什么是茶台,chat人工智能免费,什么是茶头,chat人工智能免费,什么是CHATGDP,什么是查体,chatbot免费版下载,chat人工智能免费,内容如对您有帮助,希望把文章链接给更多的朋友!

ChatGPT(Chat Generative Pre-trained Transformer)是人工智能研究实验室OpenAI(OpenAI:马斯克等人创建的人工智能公司)新推出的人工智能技术驱动的自然语言处理工具。主要使用了TransFormer神经网络架构,使得ChatGPT具有聊天互动的能力,可以根据特定聊天场景进行交流,还具备撰写邮件、脚本、文案、翻译、代码等不同类型文字的功能。

据了解,微软也将全线接入ChatGPT,计划将包括ChatGPT、DALL-E等人工智能工具整合进微软旗下的所有产品中,并将其作为平台供其他企业使用。这些产品包括且不限于Bing搜索引擎、包含Word、PPT、Excel的Office全家桶、Azure云服务、Teams聊天程序等等。根据媒体Semafor的一份新报告,微软计划在未来几周内将ChatGPT的下一代版本GPT-4整合到旗下搜索引擎必应(Bing)中。谷歌正着手测试新聊天机器人,该聊天机器人名为“学徒巴德(Apprentice Bard)”,员工可以提出问题并收到类似ChatGPT的详细答案。另一个产品部门一直在测试新的搜索桌面设计,以便用问答的形式来使用。百度也已投入开发类ChatGPT的相关技术,项目名字:文心一言(ERNIE Bot),预计三月完成内测,面向公众开放,目前,文心一言在进行上线前的调试。  

ChatGPT的功能可以带来科技便利,并具有在许多领域产生有益影响的潜力,但也伴随着很多风险。

上线像ChatGPT这样的工具,使得一些技术工作人员面临失去工作的风险。例如,聊天机器人可以被开发来培训组织中的员工,从而导致人类培训师冗员。会计师、法律文员、软件开发人员,甚至X射线分析师,这些工作将被全世界的ChatGPT抢走。ChatGPT的迅速普及有可能颠覆包括教育、金融、新闻媒体、法律等许多行业。

Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。

什么是ChatGPT(什么是CHATGPT)

2018年,GPT-1诞生,这一年也是NLP(自然语言处理)的预训练模型元年。性能方面,GPT-1有着一定的泛化能力,能够用于和监督任务无关的NLP任务中。其常用任务包括:

自然语言推理:判断两个句子的关系(包含、矛盾、中立)问答与常识推理:输入文章及若干答案,输出答案的准确率语义相似度识别:判断两个句子语义是否相关分类:判断输入文本是指定的哪个类别

虽然GPT-1在未经调试的任务上有一些效果,但其泛化能力远低于经过微调的有监督任务,因此GPT-1只能算得上一个还算不错的语言理解工具而非对话式AI。

GPT-2也于2019年如期而至,不过,GPT-2并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集:最大模型共计48层,参数量达15亿,学习目标则使用无监督预训练模型做有监督任务。在性能方面,除了理解能力外,GPT-2在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。在“变得更大”之后,GPT-2的确展现出了普适而强大的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。

之后,GPT-3出现了,作为一个无监督模型(现在经常被称为自监督模型),几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。而且,该模型在诸多任务上表现卓越,例如在法语-英语和德语-英语机器翻译任务上达到当前最佳水平,自动产生的文章几乎让人无法辨别出自人还是机器(仅52%的正确率,与随机猜测相当),更令人惊讶的是在两位数的加减运算任务上达到几乎100%的正确率,甚至还可以依据任务描述自动生成代码。一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是GPT-3影响如此之大的主要原因

GPT-3模型到底是什么?

实际上,GPT-3就是一个简单的统计语言模型。从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。例如,对于一个片段“中午12点了,我们一起去餐厅”,语言模型可以预测“餐厅”后面可能出现的词语。一般的语言模型会预测下一个词语是“吃饭”,强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语“吃午饭”。

通常,一个语言模型是否强大主要取决于两点:首先看该模型是否能够利用所有的历史上下文信息,上述例子中如果无法捕捉“中午12点”这个远距离的语义信息,语言模型几乎无法预测下一个词语“吃午饭”。其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。

由于GPT-3更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的GPT-2。作为目前最大的密集型神经网络,GPT-3能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说GPT-3似乎已经满足了我们对于语言专家的一切想象。

ChatGPT存在哪些局限性?

如下:a) 在训练的强化学习 (RL) 阶段,没有真相和问题标准答案的具体来源,来答复你的问题。b) 训练模型更加谨慎,可能会拒绝回答(以避免提示的误报)。c) 监督训练可能会误导/偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应

注意:ChatGPT 对措辞敏感。,有时模型最终对一个短语没有反应,但对问题/短语稍作调整,它最终会正确回答。训练者更倾向于喜欢更长的答案,因为这些答案可能看起来更全面,导致倾向于更为冗长的回答,以及模型中会过度使用某些短语,如果初始提示或问题含糊不清,则模型不会适当地要求澄清。

本文链接地址:https://www.jiuchutong.com/zhishi/300137.html 转载请保留说明!

上一篇:【前端进阶】-TypeScript类型声明文件详解及使用说明(前端进阶教程)

下一篇:Vue3:状态管理-Store(Vuex,Pinia)(vue 状态管理)

  • 淘宝怎么投诉卖家和申请退款(淘宝怎么投诉卖家卖货不对版的东西)

    淘宝怎么投诉卖家和申请退款(淘宝怎么投诉卖家卖货不对版的东西)

  • 抖音怎样和别人合拍(抖音怎样和别人视频聊天)

    抖音怎样和别人合拍(抖音怎样和别人视频聊天)

  • qq怎么注册账号(qq怎么注册账号不用手机号)

    qq怎么注册账号(qq怎么注册账号不用手机号)

  • 手机能定位他人位置吗(手机定位他人位置无需同意)

    手机能定位他人位置吗(手机定位他人位置无需同意)

  • 为什么gif发到微信就变成图片了(为什么gif发到微信上不会动)

    为什么gif发到微信就变成图片了(为什么gif发到微信上不会动)

  • 数据线必须弯着才充电(数据线必须弯着才充电是啥坏了)

    数据线必须弯着才充电(数据线必须弯着才充电是啥坏了)

  • 芒果tv小屏会员是什么意思(芒果会员升级成全屏影视会员)

    芒果tv小屏会员是什么意思(芒果会员升级成全屏影视会员)

  • 闲鱼黑箱是什么意思(闲鱼黑号什么意思)

    闲鱼黑箱是什么意思(闲鱼黑号什么意思)

  • 电脑上打不出字来是怎么回事(电脑为什么打不了字)

    电脑上打不出字来是怎么回事(电脑为什么打不了字)

  • 工作表标签显示的内容是什么(工作表标签显示的内容是)

    工作表标签显示的内容是什么(工作表标签显示的内容是)

  • 红米8处理器多少(红米8处理器多少钱一个)

    红米8处理器多少(红米8处理器多少钱一个)

  • 手机话筒和扬声器进水了怎么办(手机话筒和扬声器一起有声音怎么办)

    手机话筒和扬声器进水了怎么办(手机话筒和扬声器一起有声音怎么办)

  • i7 870相当于i5几代(i7 870现在是什么水平)

    i7 870相当于i5几代(i7 870现在是什么水平)

  • ipadair3是什么系统(ipadair3是a几)

    ipadair3是什么系统(ipadair3是a几)

  • 手机淘宝怎么找淘小二(手机淘宝怎么找回被删除的订单)

    手机淘宝怎么找淘小二(手机淘宝怎么找回被删除的订单)

  • 乐视1怎么录屏(乐视1怎么录屏幕视频)

    乐视1怎么录屏(乐视1怎么录屏幕视频)

  • 快手怎么举报正在直播(快手上如何举报人)

    快手怎么举报正在直播(快手上如何举报人)

  • 苹果日历不显示节日(苹果日历不显示节气)

    苹果日历不显示节日(苹果日历不显示节气)

  • 下拉框怎么做叁金苹果(怎样做下拉选项框)

    下拉框怎么做叁金苹果(怎样做下拉选项框)

  • 微信已读功能怎么设置(微信已读功能怎么设置安卓)

    微信已读功能怎么设置(微信已读功能怎么设置安卓)

  • 手机录屏在哪里找(荣耀手机录屏在哪里)

    手机录屏在哪里找(荣耀手机录屏在哪里)

  • 有盖章的原件怎么修改(有盖章的原件怎么修改数字)

    有盖章的原件怎么修改(有盖章的原件怎么修改数字)

  • 数据传输速率单位(数据传输速率单位英文)

    数据传输速率单位(数据传输速率单位英文)

  • 京东好店标志是什么(京东店铺标有京东好店是什么意思)

    京东好店标志是什么(京东店铺标有京东好店是什么意思)

  • 怎么在win10显示我的电脑(win10显示在哪)

    怎么在win10显示我的电脑(win10显示在哪)

  • 固定资产更新改造资本化条件
  • 小规模增值税免征额
  • 进项都抵扣完了怎么办
  • 在建工程明细账采用什么账簿
  • 账户认证操作
  • 技术推广服务包含什么 奇瑞汽车
  • 销售软件怎么做账
  • 支付招聘费收到专票怎么记账
  • 存货清查的结果
  • 行政单位收入支出结转
  • 已认证未抵扣什么意思
  • 固定资产已入账怎么冲销
  • 核定征收印花税的计税依据是否含税
  • 营改增公告
  • 重庆房产税政策历史
  • 公司房产税如何计算器
  • 我们公司春节发工资英文
  • 房地产企业开发资质等级
  • 建筑业跨区预缴增值税未预缴
  • 现金分红和红利再投是什么意思
  • 盘亏的转销金额
  • 华为matex3爆料
  • 非货币性资产交换的会计处理
  • 桌面图标删不掉怎么回事
  • php string
  • php字符串函数大全
  • 往来款的意义
  • 苹果手机热点打不开是灰色的
  • 购买专利权的会议纪要
  • 错账是什么
  • 调整固定资产折旧年限,折旧额的变化
  • 在草地上吃零食叫什么
  • php连接
  • zen框架
  • 广告代理费收取比例
  • web前端性能响应时间
  • vue清空input file的值
  • 机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)
  • 成本会计科目的三级科目有哪些
  • 本月没有销项只有进项 还认证发票吗
  • 新购固定资产怎么填写申报表
  • java io读写
  • phpstudy配置php环境变量
  • mysql union or
  • wind安装
  • cgroup限制内存
  • 公司车辆固定资产管理办法
  • 让渡资产使用权属于收入吗
  • 金蝶软件发票录入什么科目
  • 只有劳务报酬 能否扣5000
  • 年资产总额增长怎么算
  • 交车险代收的车可以退吗
  • 车辆保险费如何缴纳印花税的
  • a公司持有b公司
  • 土地租赁费如何摊销
  • 跨月发票作废怎么做会计分录
  • 资产处置损益如何在利润表中体现
  • 滴滴发票抬头是什么意思
  • mysql日志有哪些
  • centos如何挂载镜像
  • win10鼠标指针在文本区很小
  • centos8 php7.4
  • winxp系统和win7系统有什么区别
  • linux中的find的用法
  • windows8使用技巧
  • linuxdhcp服务器管理与配置
  • opengl 2
  • 简易bmp图片读取软件
  • 鼠标滑动页面缩放取消
  • jquery选择器的基本语法
  • html收藏夹导入
  • webpack配置文件在哪
  • jquery鼠标点击
  • javascript基础入门视频教程
  • python 设计
  • python 观察者
  • 北京市地方税务局发票查验
  • 开专票必须要有规格型号吗
  • 科技公司小规模纳税人与一般纳税人区别
  • 郑州土地出让金2023年多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设