位置: IT常识 - 正文

开源模型:小羊驼(Vicuna-13B),可达chatGPT九成效果。

编辑:rootadmin
开源模型:小羊驼(Vicuna-13B),可达chatGPT九成效果。

推荐整理分享开源模型:小羊驼(Vicuna-13B),可达chatGPT九成效果。,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

参考链接:https://mp.weixin.qq.com/s/OK5NLLVSBLb-4QsnqGp45g

文章目录简要介绍模型介绍数据来源模型评估方法模型局限性模型总体评价简要介绍

以 Meta 开源 LLaMA(直译为「大羊驼」)系列模型为起点,研究人员逐渐研发出基于LLaMA的Alpaca(羊驼)、Alpaca-Lora、Luotuo(骆驼)等轻量级类 ChatGPT 模型并开源。

近日,研究者们又提出了一个新的模型:Vicuna(小羊驼)。该模型基于LLaMA,参数量13B。Vicuna-13B 就是通过微调 LLaMA 实现了高性能的对话生成

有趣的是,在该模型的评测环节中,作者没有通过某种“标准化考试”来测定模型性能,而是让GPT-4当考官,看看 GPT-4 更倾向于 Vicuna-13B 还是其他基线模型的答案。结果显示,相比于现有的 SOTA 开源模型(LLaMA、Alpaca),GPT-4 在超过 90% 的问题中更倾向于 Vicuna,并且 Vicuna 在总分上达到了 ChatGPT 的 92%。

开源模型:小羊驼(Vicuna-13B),可达chatGPT九成效果。

Vicuna(小羊驼)已开源,项目地址:https://github.com/lm-sys/FastChat demo 地址:https://chat.lmsys.org/

PS:浅浅玩了一下。总结:虽然没有chatGPT厉害,但是也不能算差了吧!而且开源是真香:)

模型介绍数据来源

Vicuna 使用从 ShareGPT 收集的用户共享数据对 LLaMA 模型进行微调。从 ShareGPT 收集了大约 7 万个对话。ShareGPT 是一个 ChatGPT 数据共享网站,用户会上传自己觉得有趣的 ChatGPT 回答。

模型评估方法

该研究创建了 80 个不同的问题,并利用 GPT-4 来初步评估模型的输出质量,其中将每个模型的输出组合成每个问题的单个 prompt。然后将 prompt 发送到 GPT-4,由 GPT-4 来根据有用性、相关性、准确性和细节来评估上述模型生成的答案质量。

下面是小羊驼-13B和其他模型的一些比较:

模型局限性

不擅长推理或数学任务,还有在输出信息的准确性和偏见等方面存在缺陷。

模型总体评价

作为一个开源模型,性能总体上可以达到 ChatGPT 的 90%,已经非常难得,并且成本较低,只需 300 美元。

本文链接地址:https://www.jiuchutong.com/zhishi/298591.html 转载请保留说明!

上一篇:yolov7配置与训练记录(二)(yolov4配置)

下一篇:前端必备:五大css自动化生成网站(稀有级别!)(前端种类)

  • 税务局代个人开票
  • 企业之间借款利息进项税可以抵扣吗
  • 一般劳务报酬和税收区别
  • 无形资产建造期间的摊销记在哪里
  • 企业归还借款给个人
  • 他人购买股权个人所得缴纳个人所得税率是多少?
  • 设备款支付比例
  • 折扣零售商是什么意思
  • 公司对公租车保险的规定
  • 服务业工资计入成本还是营业费用
  • 增值税普通发票税率
  • 境内所得境外发放工资
  • 社会组织接受捐赠的资金的使用原则
  • 请问什么是全员安全生产责任制
  • 加计扣除需要注意的几大风险点
  • 预收账款可以开票吗
  • 销售折扣计入增值税销售额的
  • 出口的增值税到底怎么算的
  • 企业微信收款的钱怎么提取出来
  • 汽车展厅布置需要什么
  • 外商投资企业盈余公积转增资本是否交预提所得税
  • 前端解决页面加载白屏
  • 免征增值税的会计处理方法有哪些
  • 即征即退和先征后退适用范围
  • Win10 Build 19043(21H1最新版)即将推送 更新内容汇总
  • 研发支出怎么做账
  • 事业单位福利发放时间
  • 增值税专用发票和普通发票的区别
  • php命令行执行文件
  • window10进程
  • windows2004没有推送
  • reader_sl.exe - reader_sl进程有什么用.
  • PHP:Memcached::quit()的用法_Memcached类
  • win10显示我的电脑
  • php设计思路
  • 中国各省市区域划分
  • php生成代码
  • apache配置多个项目
  • .sfx.exe是什么文件
  • 购买车辆的会计分录该怎样做
  • 无偿划转长期股权投资
  • 转让子公司产生的投资收益在合并层面是不是全部抵消
  • centos从命令行进入图形
  • php tr td
  • 咨询类公司可以坐零售吗
  • ie浏览器网页滚动条怎么隐藏
  • vuex五个核心概念
  • 专用发票抵扣联是什么意思
  • linux定时任务详解
  • 企业转让应收账款分录
  • 预收账款的账务处理摘要
  • 金融企业往来支出属于费用吗
  • 线程池中的一个线程执行完一个任务后
  • dedecms分页标签
  • 股东的报销款可以抵投资款吗
  • 作废的发票也要交印花税吗
  • 帐户结余
  • 坏账准备如何计算
  • 进项税和销项税怎么理解
  • 往来款是什么意思
  • 仓库货架应该计入什么科目
  • 编制合并财务报表的依据是纳入合并
  • 以管理员的身份运行是什么意思win10
  • openeuler操作系统安装方法
  • 怎么安装win7系统不占硬盘空间呢
  • ubuntu安装后怎么启动
  • win10预览版好吗
  • Linux中systemd target命令使用详解
  • 事件委托实现
  • 刚接触 python 如何快速上手?
  • python框架教程
  • js中date
  • js生成随机数函数
  • 创建简单的Web网页实验总结ASP
  • css伸缩弹动特效
  • 示例代码
  • s='python is beautiful!'
  • 手表不贵比较好的品牌
  • 非房地产企业土地增值税清算
  • 税务年报截止日期2022
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设