位置: IT常识 - 正文

阿尔法狗vs柯洁(阿尔法狗)(阿尔法狗vs柯洁回放)

发布时间:2023-06-15

大家好,关于阿尔法狗vs柯洁,阿尔法狗很多人还不知道,现在让我们一起来看看吧!
613/auto1686644273阿尔法狗vs柯洁(阿尔法狗)(阿尔法狗vs柯洁回放)

阿尔法狗是什么意思?AlphaGo实际上是一个围棋人工智能程序,由谷歌DeepMind公司的大卫西尔弗、艾黄佳和戴密斯哈萨比斯及其团队开发。这个程序使用“价值网络”来计算形势,使用“策略网络”来选择下一步行动。

“深度学习”是指多层人工神经网络和训练它的方法。一层神经网络以大量矩阵数为输入,用非线性激活方法加权,再生成另一个数据集作为输出。就像生物神经大脑的工作机制一样。通过适当数量的矩阵,多层组织链接在一起,形成一个神经网络“大脑”,进行精确而复杂的处理,就像人们识别物体和标记图片一样。

虽然神经网络在几十年前就存在了,但直到最近情况才变得清楚。这是因为他们需要大量的“训练”来发现矩阵中的数值。对于早期的研究人员来说,获得良好结果的最小训练量远远超过了计算能力和可以提供的数据量。但近年来,一些能够接触到海量资源的团队重新出现挖掘神经网络,即通过“大数据”技术进行高效训练。

两个大脑

AlphaGo是通过两个不同的神经网络“大脑”的合作来提高下棋水平。这些大脑是多层神经网络,结构类似于谷歌图像搜索引擎识别的那些图像。他们从多层启发式二维过滤器入手,处理围棋棋盘的定位,就像图片分类器网络处理图片一样。过滤后,13个完全连接的神经网络层对他们看到的东西产生判断。这些层可以进行分类和逻辑推理。

这些网络通过反复训练来检查结果,然后校对调整参数,让接下来的执行更好。这个处理器有很多随机元素,我们不可能确切知道网络是如何“思考”的,但更多的训练可以让它进化到更好。

第一大脑3360移动拾取器

AlphaGo的第一个神经网络大脑是“用于监督学习的策略网络”,观察棋盘的布局,试图找到最佳的下一步。事实上,它预测了每一个合法的下一步的最佳概率,所以第一个猜测是概率最高的一个。你可以理解为“晚选人”。

(移动选择器如何看到棋盘?数字表明最强壮的人类玩家可能会在哪里着陆。)

团队通过玩上百万的游戏来训练大脑,KGS(战斗平台)中最强的人类对手。这是AlphaGo最像人类的部分。目标是学习那些顶级玩家的精彩牌技。这不是为了赢,而是为了找到和人类高手一样的下一步棋。AlphaGo棋步选择器可以正确匹配57%的人类大师。(不符合不代表错误,而是人类自己犯的错误。)

一个更强的前进选择器

AlphaGo系统实际上需要两个额外的位选择器的大脑。一个是“强化学习的政策网络”,由百万附加模拟局完成。你可以称之为更强。与基础训练相比,它只教会网络模仿单个人类的动作。高级训练会把每一局模拟棋都玩到底,教网络下一手最有可能赢的棋。Sliver的团队通过更强的走法选择器总结出了百万级训练棋类游戏,比他们之前的版本迭代了很多。

光是用这个走位选择器就已经是强大的对手了,可以达到业余棋手的水平,或者可以媲美之前最强的围棋AI。这里的重点是,这种下拉选择器不会“读”。它简单地检查单个棋盘的位置,然后提出从该位置分析的移动。它不会模拟任何未来的动作。这证明了简单的深度神经网络学习的力量。

快速移动选择器

AlphaGo当然,团队并没有就此止步。下面我会解释如何赋予AI阅读能力。为了做到这一点,他们需要一个更快版本的后期选择器大脑。版本越强,耗时越长——走一步好棋已经够快了,但“阅读结构”需要检查成千上万种可能性后再做决定。

Silver团队设置了一个简单的选择器来制作“快速阅读rdqu”

第二大脑:棋局评估器 (Position Evaluator)

AlphaGo的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是论文中提到的“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。

(局面评估器是怎么看这个棋盘的。深蓝色表示下一步有利于赢棋的位置。)

局面评估器也通过百万级别的棋局做训练。Silver团队通过 复制两个AlphaGo的最强落子选择器,精心挑选随机样本创造了这些局面。这里AI 落子选择器在高效创建大规模数据集去训练局面评估器是非常有价值的。这种落子选择器让大家去模拟继续往下走的很多可能,从任意给定棋盘局面去猜测大致的双方赢棋概率。而人类的棋局还不够多恐怕难以完成这种训练。

增加阅读

这里做了三个版本的落子选择大脑,加上局面评估大脑,AlphaGo可以有效去阅读未来走法和步骤了。阅读跟大多数围棋AI一样,通过蒙特卡洛树搜索(MCTS)算法来完成。但AlphaGo 比其他AI都要聪明,能够更加智能的猜测哪个变种去探测,需要多深去探测。

(蒙特卡洛树搜索算法)

如果拥有无限的计算能力,MCTS可以理论上去计算最佳落子通过探索每一局的可能步骤。但未来走法的搜索空间对于围棋来说太大了(大到比我们认知宇宙里的粒子还多),实际上AI没有办法探索每一个可能的变种。MCTS做法比其他AI有多好的原因是在识别有利的变种,这样可以跳过一些不利的。

Silver团队让AlphaGo装上MCTS系统的模块,这种框架让设计者去嵌入不同的功能去评估变种。最后马力全开的AlphaGo系统按如下方式使用了所有这些大脑。

1. 从当前的棋盘布局,选择哪些下一步的可能性。他们用基础的落子选择器大脑(他们尝试使用更强的版本,但事实上让AlphaGo更弱,因为这没有让MCTS提供更广阔的选择空间)。它集中在“明显最好”的落子而不是阅读很多,而不是再去选择也许对后来有利的下法。

2. 对于每一个可能的落子,评估质量有两种方式:要么用棋盘上局面评估器在落子后,要么运行更深入蒙特卡罗模拟器(滚动)去思考未来的落子,使用快速阅读的落子选择器去提高搜索速度。AlphaGo使用简单参数,“混合相关系数”,将每一个猜测取权重。最大马力的AlphaGo使用 50/50的混合比,使用局面评估器和模拟化滚动去做平衡判断。

随着他们使用插件的不同,AlphaGo的能力变化和上述步骤的模拟。仅使用独立大脑,AlphaGo跟最好的计算机围棋AI差不多强,但当使用这些综合手段,就可能到达职业人类选手水平。

(AlphaGo的能力变化与MCTS的插件是否使用有关。)

工程优化:分布式计算,网络计算机去提升MCTS速度,但这些都没有改变基础算法。这些算法部中分精确,部分近似。在特别情况下,AlphaGo通过更强的计算能力变的更强,但计算单元的提升率随着性能变强而减缓。

优势和劣势

我认为AlphaGo在小规模战术上会非常厉害。它知道通过很多位置和类型找到人类最好的下法,所以不会在给定小范围的战术条件下犯明显错误。

但是,AlphaGo有个弱点在全局判断上。它看到棋盘式通过5*5金字塔似的过滤,这样对于集成战术小块变成战略整体上带来麻烦,同样道理,图片分类神经网络往往对包含一个东西和另一个的搞不清。比如说围棋在角落上一个定式造成一个墙或者引征,这会剧烈改变另一个角上的位置估值。

就像其他的基于MCTS的AI, AlphaGo对于需要很深入阅读才能解决的大势判断上,还是麻烦重重的,比如说大龙生死劫。AlphaGo 对一些故意看起来正常的局也会失去判断,天元开盘或者少见的定式,因为很多训练是基于人类的棋局库。

我还是很期待看到AlphaGo和李世石9段的对决!我预测是:如果李使用定式,就像跟其他职业棋手的对决,他可能会输,但如果他让AlphaGo陷入到不熟悉情形下,他可能就赢。

本文讲解完毕,希望对大家有所帮助。

本文链接地址:https://www.jiuchutong.com/zhishi/3149.html 转载请保留说明!

上一篇:尼康d90价格(尼康d90)(尼康d90百度百科)

下一篇:oppok3换屏教程(oppok3)(oppok3拆机换屏图解)

  • 转角处的花香(转角花房)

    转角处的花香(转角花房)

  • 智能卡服务未启动(智能卡未启用)

    智能卡服务未启动(智能卡未启用)

  • 用微视发的朋友圈别人看不到(微视发的朋友圈为什么打不开)

    用微视发的朋友圈别人看不到(微视发的朋友圈为什么打不开)

  • 手机屏幕变蓝色是什么原因(手机屏幕变蓝色并慢慢扩大)

    手机屏幕变蓝色是什么原因(手机屏幕变蓝色并慢慢扩大)

  • 群成员超过200人怎么设置(群成员超过200人怎么办)

    群成员超过200人怎么设置(群成员超过200人怎么办)

  • sdm450是什么处理器(sdm460是什么处理器)

    sdm450是什么处理器(sdm460是什么处理器)

  • 索尼摄像机怎么导出视频(索尼摄像机怎么看回放)

    索尼摄像机怎么导出视频(索尼摄像机怎么看回放)

  • 手机收不到4g网络是什么原因(手机突然收不到4g网络)

    手机收不到4g网络是什么原因(手机突然收不到4g网络)

  • 华为watchgt2和荣耀magicwatch2区别(华为watchgt2和荣耀gspro的区别)

    华为watchgt2和荣耀magicwatch2区别(华为watchgt2和荣耀gspro的区别)

  • qq等级加速包有什么好处(qq等级加速包有图标吗)

    qq等级加速包有什么好处(qq等级加速包有图标吗)

  • ipad新款pro什么时候上市(ipad pro什么型号)

    ipad新款pro什么时候上市(ipad pro什么型号)

  • 快手里面的关注页是啥意思(快手里面的关注怎么全部删除)

    快手里面的关注页是啥意思(快手里面的关注怎么全部删除)

  • 电脑怎么创建一个新的用户(电脑怎么创建一个新的文档)

    电脑怎么创建一个新的用户(电脑怎么创建一个新的文档)

  • 苹果系统更新后查找朋友还能用吗(苹果系统更新后怎么还原到原来的系统版本)

    苹果系统更新后查找朋友还能用吗(苹果系统更新后怎么还原到原来的系统版本)

  • 苹果xsmax有没有nfc功能(苹果xsmax现在多少钱)

    苹果xsmax有没有nfc功能(苹果xsmax现在多少钱)

  • 华为荣耀20pro防水吗(荣耀20防窥屏怎么设置)

    华为荣耀20pro防水吗(荣耀20防窥屏怎么设置)

  • 抖音里加入购物车后在哪里看(抖音里加入购物车怎么找)

    抖音里加入购物车后在哪里看(抖音里加入购物车怎么找)

  • 怎么删除看一看记录(怎么删除看一看里我发的东西)

    怎么删除看一看记录(怎么删除看一看里我发的东西)

  • 怎么看自己的运动轨迹(怎么看自己的运动地图轨迹?)

    怎么看自己的运动轨迹(怎么看自己的运动地图轨迹?)

  • 华为怎么取手机卡(华为怎么取手机卡出来)

    华为怎么取手机卡(华为怎么取手机卡出来)

  • 快手活跃度在哪里看(快手上面活跃度有什么用)

    快手活跃度在哪里看(快手上面活跃度有什么用)

  • ftpcount命令  显示当前登录FTP的用户人数(ftp port命令)

    ftpcount命令 显示当前登录FTP的用户人数(ftp port命令)

  • 帝国CMS实现反馈信息内容发送到邮箱的方法(帝国cms工作流)

    帝国CMS实现反馈信息内容发送到邮箱的方法(帝国cms工作流)

  • 核定征收个体户个人经营所得税税率
  • 小规模纳税人预缴税款怎么填申报表
  • 交通补贴算工资收入吗
  • 代扣代缴个税对企业所得税的影响
  • 季度申报后还要年度申报吗
  • 收回次月作废的发票需要做账吗
  • 住宿费专用发票税率是多少
  • 盈利能力分析对企业发展的意义
  • 外出经营预缴税
  • 到账的钱还能退回去吗
  • 企业的期间费用包括什么
  • 企业劳务发票怎么开,税率是多少
  • 不得抵扣的进项税额怎么处理
  • 清算时公司亏损预交所得税能退吗
  • 开票满500万一定会升一般纳税人吗
  • 当月计提当月缴纳的增值税还用结转吗
  • 劳务费单位没有代扣怎么办
  • 租金怎么来计算个税
  • bios如何解除电脑密码
  • 委托代销售应确认什么
  • 笔记本电脑的触摸板怎么用右键
  • wd discovery怎么安装
  • 操作系统的内存映射
  • win10粘贴复制无效
  • 正常开机进不去系统
  • 核定征收的企业怎么交所得税
  • 支付以前年度增值税怎么做账
  • springboot整合了哪些框架
  • ESP32-CAM AI THINKER 引脚排列:GPIO 用法说明
  • 高新技术企业的申报条件包括以下哪些
  • 库存现金被盗会怎么样
  • mac phpstudy
  • 未分配利润为负的原因
  • 钢管扣件租赁公司社会实践报告怎么写范文
  • yii2实现根据时间搜索的方法
  • php curl_exec
  • 差额征税怎么交税
  • 实缴注册资本印花税如何缴纳
  • 出口退税哪些税不退
  • 利润表年报本期金额填什么
  • 个人综合所得汇算申报流程
  • 去年多计提的工资今年怎么冲
  • mysql5.6允许远程连接
  • python命令行进度条
  • 工伤在门诊的收据能报销吗
  • 临时工工资计入什么费用
  • 暂估入库的库存商品转成本吗
  • 怎么对外投资
  • 应付账款一直挂在账上会有问题吗
  • 提取保险责任准备金怎么计算
  • 公司借款给个人400万合法吗
  • 房地产开发打桩
  • 增值税留抵退税最新政策
  • 某劳务派遣公司与某传媒公司签订
  • 应收账款是否算负债
  • 收到的专票必须当月认证吗
  • 会计里面权益是什么
  • 敬老院的会计科目
  • Win10怎么设置高性能
  • xp系统无法打开网页怎么解决
  • linux临时目录一般存在哪个文件夹
  • linux忘记root密码怎么办
  • 电脑系统怎么设置字体大小
  • win8更新设置
  • mac上安装
  • scrfs.exe - scrfs是什么进程 有什么用
  • 文件夹windows
  • NGUI字体图集导致Label文字破碎的BUG以及解决方案
  • jquery虚拟dom
  • opengl快速入门
  • Linux中删除文件夹的正确方式
  • js内存条
  • 批处理加延时
  • 常用的批处理文件
  • cmd替换文件命令
  • vue用户权限解决方案
  • 电子税务局改版
  • 顺德中学校徽图片大全1998年
  • 税务有问题会罚多少钱?
  • 如果我是科学家我会发明什么
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号