位置: IT常识 - 正文

被称为下一代风口的AIGC到底是什么?(被称为下一代风华的是)

编辑:rootadmin
被称为下一代风口的AIGC到底是什么?

推荐整理分享被称为下一代风口的AIGC到底是什么?(被称为下一代风华的是),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:被称为下一代风神的是,下一代是垮掉的一代,被称为下一代风华的是,被称为下一代风神的是,下一代的,被称为下一代风华的是,被称为下一代风神的是,被称为下一代风神的是,内容如对您有帮助,希望把文章链接给更多的朋友!

近期,短视频平台上“AI绘画”的概念爆火,ChatGPT这一词条也刷爆了科技圈,而这些概念同属于一个领域——AIGC。2022年12月,Science杂志发布的2022年度科学十大突破中,AIGC入选。

那么,被称之为是AI下一代风口的AIGC到底是什么?

AIGC的概念

AIGC全称为AI-Generated Content,即利用人工智能技术来自动生产内容。具体可基于生成对抗网络GAN、生成扩散模型和大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。

AIGC已经成为继PGC(Professional Generated Content,专业生产内容)和UGC(User Generated Content,用户生产内容)之后新型的内容创作方式。

AIGC是继PGC和UGC后又一内容创作方式 图片来源:A16Z,中金公司标题

其实AIGC的概念并非今年才出现,在此前,类似于微软小冰等人工智能作诗、写作、创作歌曲的产品就属于AIGC的领域。但2022年以来,AIGC又集中爆发,国内外的科技巨头公司和投资公司纷纷入局,其原因可能在于以下几点:

文本-图像生成模型Stable Diffusion的正式开源,包括程序和训练好的模型。这给了后继创业者一些高起点的机会,有利于更广泛的C端用户普及。

深度学习算力、互联网数据规模扩张以及生成扩散模型和多模态预训练模型等技术的快速发展,使人工智能技术也随之迅速发展。从最初的文字生成逐渐发展为多模态和跨模态的内容生成。

如今各类社交和流媒体平台的普及,也驱动着内容生产方式的演变。

外部环境因素影响。在经济低迷时期,科技行业会选择相应收敛开支,并将重点放在像是人工智能商业化这类更务实的地方。

AIGC的发展历程

事实上,使用计算机生成内容的想法自上个世纪五十年代就已经出现,早期的尝试侧重于通过让计算机生成照片和音乐来模仿人类的创造力,生成的内容也无法达到高水平的真实感。结合人工智能的演进改革,AIGC的发展可以大致分为以下三个阶段:

早期萌芽阶段(1950s-1990s),受限于科技水平,AIGC仅限于小范围实验。1957年,莱杰伦·希勒(Lejaren Hiller)和伦纳德·艾萨克森(Leonard Isaacson)通过将计算机程序中的控制变量改为音符,完成了历史上第一部由计算机创作的音乐作品——弦乐四重奏《依利亚克组曲(Illiac Suite)》。1966年,约瑟夫·韦岑鲍姆(Joseph Weizenbaum)和肯尼斯·科尔比(Kenneth Colbv)共同开发了世界上第一个机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组来完成交互式任务。80年代中期,IBM基于隐马尔可夫链模型创造了语音控制打字机“坦戈拉(Tangora)”,能够处理两万个单词。

世界上第一个机器人“伊莉莎(Eliza)”标题

沉积积累阶段(1990s-2010s),AIGC从实验性向实用性逐渐转变。深度学习算法、图形处理单元(GPU)、张量处理器(TPU)和训练数据规模等都取得了重大突破,受到算法瓶颈的限制,效果有待提升。2007 年,纽约大学人工智能研究员罗斯·古德温(Ross Goodwin)装配的人工智能系统通过对公路旅行中的所见所闻进行记录和感知,撰写出世界上第一部完全由人工智能创作的小说《1 The Road》。2012年,微软公开展示了一个全自动同声传译系统,通过深度神经网络(DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。

世界上第一部完全由人工智能创作的小说《1 The Road》标题

快速发展阶段(2010s-至今),深度学习模型不断迭代,AIGC取得突破性进展。尤其在2022年,算法获得井喷式发展,底层技术的突破也使得AIGC商业落地成为可能。下面列举了一些迄今为止具有代表性的算法模型,其中主要集中在AI绘画领域:

2014年6月,生成式对抗网络(Generative Adversarial Network,GAN)被提出。

2021年2月,openAI推出了CLIP(Contrastive Language-Image Pre-Training)多模态预训练模型。

2022年,扩散模型Diffusion Model逐渐替代GAN。

上述三个算法是当前AIGC的技术核心,下述算法模型大部分都是以此为基础。

2018年12月,NVIDIA推出StyIeGAN ,可以自动生成高分辨率图片。目前已升级到第四代模型。

2019年7月,DeepMind推出DVD-GAN ,可以生成连续视频。

2021年1月,OpenAI 推出DALL-E,是首个引起公众广泛关注的文本生成图像的模型之一。

2022年2月,开源AI绘画工具Disco Diffusion发布。

2022年3月,Meta推出Make-A-Scene这一AI图像生成工具。

2022年4月,OpenAI 推出了DALL-E-2,在图像分辨率、真实感和新功能上进行了升级。

2022年4月,AI绘画工具MidJourney发布。

2022年5月,Google推出Imagen,同样是文本生成图像的模型。

2022年6月,Google推出parti,与Imagen功能相同,但在模型算法、模型参数和图像效果等方面做了升级。

2022年7月,开源AI绘画工具Stable Diffusion发布。

2022年9月,Meta推出Make-A-Video,可以从文字生成视频。

被称为下一代风口的AIGC到底是什么?(被称为下一代风华的是)

2022年10月,Google提出Imagen video,同样是文字生成视频的模型。

2022年11月,Stable Diffusion 2.0发布,在模型算法、图像质量和内容过滤等方面做了升级。

2022年11月,openAI推出 AI 聊天机器人chatGPT。

关于上述算法模型的具体原理和分析,可以期待我们的下一篇文章哦~

AIGC的应用场景

AIGC在面向不同对象和不同场景时,具有强大的自适应创作能力,因此被应用在了多种场景。具体包括:

【图像生成】

该领域目前发展势头最猛,且落地产品较多。根据使用场景,可分为图像编辑工具和端到端图像生成。图像编辑包括图像属性编辑(如去水印、风格迁移、图像修复等)和图像内容编辑(如修改面部特征、换脸等)。端到端图像生成包括基于图像生成(如基于草图生成完整图像,根据特定属性生成图像等)和多模态转换(如根据文字生成图像等)。

典型的产品或算法模型包括EditGAN、Deepfake、DALL-E、MidJourney、Stable Diffusion、文心·一格等。

【视频生成】

视频生成与图像生成在原理上有一定相似性,可分为视频编辑(如画质修复、视频特效、视频换脸等)、视频自动剪辑和端到端视频生成(如文字生成视频等)。

典型的产品或算法模型包括Deepfake、videoGPT、Gliacloud、Make-A-Video、Imagen video等。

【文本生成】

基于NLP技术的文本生成可以算是AIGC中发展最早的一部分技术,功能也较为多样。根据使用场景,可分为非交互式文本生成和交互式文本生成。非交互式文本生成包括内容续写、摘要/标题生成、文本风格迁移、整段文本生成、图像生成文字描述等功能。交互式文本生成包括聊天机器人、文本交互游戏等功能。

典型的产品或算法模型包括JasperAI、Copy.ai、彩云小梦、AI dungeon、ChatGPT等。

【音频生成】

音频生成中的部分技术已经较为成熟,被应用于多种C端产品中。音频生成可分为TTS(Text-to-speech)场景和乐曲生成两类。其中TTS包括语音客服、有声读物制作、智能配音等功能。乐曲生成包括基于开头旋律、图片、文字描述、音乐类型、情绪类型等生成特定乐曲。

典型的产品或算法模型包括DeepMusic、WaveNet、Deep Voice、MusicAutoBot等。

【游戏生成】

游戏生成主要包括游戏元素生成和游戏策略生成,其中游戏元素生成包括游戏场景、游戏剧情、NPC角色等元素的生成。游戏策略生成主要指对战策略,一般基于深度强化学习的技术。

典型的产品或算法模型包括rct AI、超参数、腾讯AI Lab等。

【代码生成】

代码生成主要包括代码辅助的功能,包括代码补全、自动注释、根据上下文生成代码、根据注释生成代码等功能。

典型的产品或算法模型包括Github Copilot、Replit、CodeGeeX、Mintlify等。

【3D生成】

与图像生成和视频生成相比,目前3D内容生成还处于较为初级阶段。现有的3D生成基本为基于图像或文本生成3D模型。

典型的产品或算法模型包括Magic3D、DreamFusion、AVAR等。

当前AIGC market map 图片来源:Leonis Capital标题AIGC图像生成实例

AIGC图像生成能带来许多有趣甚至实用的图像,比如以自动驾驶为例,corner case一直是令感知工程师头疼的问题,缺乏corner case场景的数据集训练出来的算法,往往无法很好地应对corner case场景。

但是重建或挖掘corner case场景数据又是一件很困难的事情,不过现在通过AIGC的方式,我们能够通过算法生成corner case场景的图像,如下图所示,展示的就是算法生成的一系列白色大卡车侧翻的图像,虽然生成的图像真实度还有进步空间,但是也给我们打开了新的一扇大门,大规模的生成用于AI算法训练的数据集。

整数智能也将在后续的AIGC系列分享中,给大家分享如何在数据标注、模型训练等领域充分使用这些能力。

输入文本:一辆白色大卡车侧翻在高速路中央题输入文本:三辆白色大卡车侧翻在高速路中央题输入文本:十辆白色大卡车侧翻在高速路中央   参考文献

Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial networks[J]. Communications of the ACM, 2020, 63(11): 139-144.

Radford A, Kim J W, Hallacy C, et al. Learning transferable visual modelsfromnatural language supervision [C]//International Conference on Machine Learning. PMLR, 2021: 8748-8763.

Yang L, Zhang Z, Song Y, et al. Diffusion models: A comprehensive survey of methods and applications[J]. arXiv preprint arXiv:2209.00796, 2022.

Ramesh A, Pavlov M, Goh G, et al. Zero-shot text-to-image generation[C]//International Conference on Machine Learning. PMLR, 2021: 8821-8831.

Saharia C, Chan W, Saxena S, et al. Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding[J]. arXiv preprint arXiv: 2205. 11487, 2022.

Rombach R, Blattmann A, Lorenz D, et al. High-resolution image synthesis with latent diffusion models[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022: 10684-10695.

中国信通院《AIGC白皮书》

量子位《AIGC:AI生成内容产业展望报告》

甲子光年《AIGC爆火的背后,钱都被谁赚走了》

Leonis Capital《Generative AI: State of the Market, Trends and Startup Opportunities》

本文链接地址:https://www.jiuchutong.com/zhishi/297609.html 转载请保留说明!

上一篇:vue实现购物车功能(vue写的购物车详细步骤)

下一篇:什么是神经网络?(什么是神经网络算法)

  • 微博如何注销(微博如何注销微博账号)

    微博如何注销(微博如何注销微博账号)

  • 金立手机无法开启个人热点(金立手机无法开机怎么修)

    金立手机无法开启个人热点(金立手机无法开机怎么修)

  • qq群怎么一起听歌(qq群如何一起听音乐)

    qq群怎么一起听歌(qq群如何一起听音乐)

  • 比心新人首单免费吗(比心首单免费从哪里领取)

    比心新人首单免费吗(比心首单免费从哪里领取)

  • 苹果11怎么充电那么慢(苹果11怎么充电才能更好的保护电池)

    苹果11怎么充电那么慢(苹果11怎么充电才能更好的保护电池)

  • 微信健康码可以出行吗(微信健康码可以换手机号码吗)

    微信健康码可以出行吗(微信健康码可以换手机号码吗)

  • 苹果se2和苹果8手机壳通用吗(苹果se2和苹果8手机壳一样吗)

    苹果se2和苹果8手机壳通用吗(苹果se2和苹果8手机壳一样吗)

  • 图片格式的扫描件是什么(图片扫描文件格式)

    图片格式的扫描件是什么(图片扫描文件格式)

  • 在对幻灯片进行自定义动画设置时可以改变(在幻灯片制作过程中如果对幻灯片内容)

    在对幻灯片进行自定义动画设置时可以改变(在幻灯片制作过程中如果对幻灯片内容)

  • pdf文件是什么意思(pdf文件是指什么)

    pdf文件是什么意思(pdf文件是指什么)

  • 企业id是什么(企业id是什么意思啊)

    企业id是什么(企业id是什么意思啊)

  • 微信电脑和手机能同时视频么(微信电脑和手机信息不同步怎么办)

    微信电脑和手机能同时视频么(微信电脑和手机信息不同步怎么办)

  • 收藏店铺就是关注吗(收藏店铺什么意思)

    收藏店铺就是关注吗(收藏店铺什么意思)

  • 云存储需要花钱吗(云存储服务收费吗)

    云存储需要花钱吗(云存储服务收费吗)

  • 华为nova6多少hz(华为nova6多少Hz)

    华为nova6多少hz(华为nova6多少Hz)

  • 酷游为什么下线(酷游还会重新开吗?)

    酷游为什么下线(酷游还会重新开吗?)

  • 红米k20pro为什么耗电这么快(红米k20pro为什么拍照不清楚)

    红米k20pro为什么耗电这么快(红米k20pro为什么拍照不清楚)

  • win10 oem分区能删除吗(oem分区和efi分区能删除吗)

    win10 oem分区能删除吗(oem分区和efi分区能删除吗)

  • 怎么召唤小v(怎么召唤小V真人)

    怎么召唤小v(怎么召唤小V真人)

  • 拼多多复活卡找不到了(拼多多复活卡可以复活砍价免费拿吗)

    拼多多复活卡找不到了(拼多多复活卡可以复活砍价免费拿吗)

  • dcs系统用plc吗(dcs能实现plc的全部功能吗)

    dcs系统用plc吗(dcs能实现plc的全部功能吗)

  • 小米9有反向充电功能吗(小米9有反向充电吗)

    小米9有反向充电功能吗(小米9有反向充电吗)

  • 滴滴预付车费什么意思(滴滴预付车费多久到账)

    滴滴预付车费什么意思(滴滴预付车费多久到账)

  • ps怎么一键变黑白(ps怎么一键变色)

    ps怎么一键变黑白(ps怎么一键变色)

  • 苹果手机的云相册在哪(苹果手机的云相册怎么能看到照片)

    苹果手机的云相册在哪(苹果手机的云相册怎么能看到照片)

  • 三星note9屏幕多少hz(三星note9屏幕参数)

    三星note9屏幕多少hz(三星note9屏幕参数)

  • 苹果x和8plus哪个实用(苹果x和8plus哪个贵)

    苹果x和8plus哪个实用(苹果x和8plus哪个贵)

  • win12发布时间(windows 发布时间)

    win12发布时间(windows 发布时间)

  • 企业微信接口错误代码大全(企业微信api错误码)

    企业微信接口错误代码大全(企业微信api错误码)

  • 没有签订劳动合同可以直接离职吗
  • 建筑企业差额征税如何开票
  • 消费税征税范围是什么口诀
  • 其他应收款是负数怎么报税
  • 商贸公司成本大吗
  • 银行借记和贷记的区别是什么
  • 企业合并吸收税务处理
  • 理财收益交增值税
  • 电子普通发票重新开
  • 小规模纳税人是个体户吗
  • 期末库存农产品进项转出如何算
  • 天猫费率是什么
  • 工程预付款增值税缴纳办法
  • 事业单位未取得工资
  • 租赁行业的增值税税率
  • 税控系统服务
  • 领用外购材料用于动产
  • 定额发票去年的能用吗
  • 增普票付款要不要从公户走?
  • 业务招待费在企业所得税税前扣除的标准是什么?
  • 购买金税盘需要法人去税务局进行信息采集吗
  • 有限责任公司企业名称有哪些
  • 企业收到损坏赔偿金
  • 建筑公司工地买空调
  • 期末进项税额和销项税额都有余额
  • QuickBooks - QuickBooks是什么进程 有什么用
  • 利润表营业成本是负数是什么原因
  • 企业退款如何走账
  • 收到别人押金的会计分录
  • php面向对象是什么意思
  • 苹果mac双系统按住哪个键
  • 企业补缴个人所得税罚款
  • msworks.exe - msworks是什么进程 有什么用
  • 交易性金融资产的账务处理
  • ccs是什么软件
  • from origin ‘null‘ has been blocked by CORS policy: Cross origin requests are only supported for ...
  • 企业付给个人工资怎么做
  • 工资应发数就是企业的成本
  • yolov5实例分割原理详解
  • 企业取得土地使用权可能作为什么核算
  • 新必应申请使用资格
  • js怎么制作
  • pwd命令的用法
  • 公司的融资租赁怎么做账
  • 以房租入股公司怎么交税
  • 小规模纳税人运输费计入什么科目
  • 个体工商户怎么变更法人
  • 只有收据没有发票怎么入账
  • 一个人可以做多个担保人吗
  • 什么情况没有排卵期
  • 材料采购发票未到
  • 发票具有哪些情况可以开
  • 预付款已经开了发票未到货要怎么做账
  • 进口关税,增值税,消费税
  • 金税盘技术维护费可以抵扣吗
  • 工会经费交纳
  • 银行卡转账怎么撤回转账的钱
  • mysql缩进快捷键
  • win7开始菜单在哪个文件夹
  • linux允许ping
  • win10更新后电脑黑屏
  • win8搜索不到文件
  • win8启动设置选哪个
  • linux分区顺序详解
  • Android开源ui框架
  • django 验证码
  • android新手入门
  • shell 生成随机数每次运行都不一样
  • shell脚本字符串操作
  • 用python学算法
  • 不想让浏览器运行
  • 今天百度汉语
  • 产品税务编号查询系统官网
  • 丹麦个人所得税税率表
  • 中心组学习的意义?
  • 江苏 税务局
  • 税票开户银行怎么填写?
  • 珠宝消费税怎么申报
  • 豫麦336
  • 下载国税网上申报
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设