阿尔法狗之父揭秘 未来的AlphaGo不用人教就会下棋了?
- 编辑:蘑菇
还记得那个打遍天下无敌手的AlphaGo吗?还记得那个把李世石柯洁这些围棋大牛虐的不要不要的阿尔法狗吗?近日,AlphaGo或要重出江湖了,就在昨天,阿尔法狗之父就公布了进化后的最强版AlphaGo,究竟又有多厉害呢?
伦敦当地时间10月18日18:00(北京时间19日01:00),谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ,代号AlphaGo Zero。
新版本的AlphaGo究竟有多厉害?打败李世石的AlphaGo用了3000万盘比赛作为训练数据,AlphaGo Zero用了490万盘比赛数据。经过3天的训练,AlphaGo Zero就以100:0的比分完胜对阵李世石的那版AlphaGo。
AlphaGo之父
DeepMind联合创始人兼CEO 、AlphaGo之父戴密斯·哈萨比斯(Demis Hassabis)和AlphaGo团队负责人大卫·席尔瓦(Dave Sliver) 等人同时在官方博客上发表文章,详解最强版本阿尔法狗是如何炼成的,与前代有何不同。
与学习大量人类棋谱起步的前代AlphaGo不同,AlphaGo Zero是从“婴儿般的白纸”开始,通过3天数百万盘自我对弈,走完了人类千年的围棋历史,并探索出了不少横空出世的招法。
哈萨比斯等人专文:《AlphaGo Zero:从零开始》
从语音识别、图像分类到基因和药物研究,人工智能发展迅速。这些专家系统,很多是借用海量人类经验和数据开发出来的。
AlphaGo之父
然而,在有些特定问题上,人类的知识要么过于昂贵,要么不靠谱,要么无法获得。因此,人工智能研究的一个长期目标就是跳过这一步,创造能在最有挑战性的领域,不用人类输入就达到超人水平的算法。我们发表在《自然》期刊上的最新论文,展示了实现该目标的关键一步。
论文介绍了首个战胜人类围棋冠军的电脑程序AlphaGo的最新进化版本:AlphaGo Zero。AlphaGo Zero更为强大,可以一争史上最强围棋手。
AlphaGo的前几代版本,一开始用上千盘人类业余和专业棋手的棋谱进行训练,学习如何下围棋。AlphaGo Zero则跳过了这个步骤,自我对弈学习下棋,完全从乱下开始。用这种方法,它很快超过了人类水平,对阵此前战胜人类冠军李世石的前代AlphaGo取得了100连胜。
AlphaGo Zero之所以能当自己的老师,是用了一种叫强化学习的新模式。系统从一个对围棋一无所知的神经网络开始,将该神经网络和一个强力搜索算法结合,自我对弈。在对弈过程中,神经网络不断调整、升级,预测每一步落子和最终的胜利者。
升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero,如此往复循环。每过一轮,系统的表现就提高了一点点,自我对弈的质量也提高了一点点。神经网络越来越准确,AlphaGo Zero的版本也越来越强。
这种技术比此前所有版本的AlphaGo都更为强大。这是因为,它不再受到人类知识的限制,而能够从婴儿般的白纸状态,直接向世界上最强大的棋手——AlphaGo本身学起。
人工智能
AlphaGo Zero相较前代还有几点明显的差别:
首先,AlphaGo Zero仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。
其次,AlphaGo Zero仅用了单一的神经网络。在此前的版本中,AlphaGo用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。
第三,AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本依靠的是其高质量的神经网络来评估下棋的局势。
所有这些差异,都提高了系统的表现,使其更为普适。不过,是算法上的变化使得系统更为强大和高效。
AlphaGo
仅仅自我对弈3天后,AlphaGo Zero就以100:0完胜了此前击败世界冠军李世石的AlphaGo版本。自我对弈40天后,AlphaGo Zero变得更为强大,超过了此前击败当今第一人柯洁的“大师”版AlphaGo。
通过数百万次自我对弈,AlphaGo从零开始掌握了围棋,在短短几天内就积累起了人类几千年才有的知识。AlphaGo Zero也发现了新的知识,发展出打破常规的策略和新招,与它在对战李世石和柯洁时创造的那些交相辉映,却又更胜一筹。
这些创造性的时刻给了我们信心:人工智能会成为人类智慧的增强器,帮助我们解决人类正在面临的一些严峻挑战。
尽管才刚刚发展起来,AlphaGo Zero已经走出了通向上述目标的关键一步。如果类似的技术可以应用在其他结构性问题,比如蛋白质折叠、减少能耗和寻找新材料上,就能创造出有益于社会的突破。
最强版AlphaGo只用三天就可以掌握人类千年以来对围棋的研究,听起来是不是真的有点太可怕了。从此前的大师版AlphaGo对阵围棋第一人柯洁的比赛就已经让我们吃惊,看来这样的最强版AlphaGo未来是不是已经不用人教就会下围棋了呢?
下一篇 >
24小时热文 换一换

强东玥公主风写真曝光
最近,一组关于强东玥公主风写真曝光。在写真中我们可以看到强东玥身穿公主风的白色纱裙相当的漂亮,当然在过程中强东玥的笑容才是最迷人的,你们是不是喜欢这样的强东玥呢?
-
中国十大国际超模榜单公布
最近,福布斯公布了中国十大国际超模排行,在这个名单当中,有名副其实的,一定也有你觉得有质疑的。今天就一起来看看这十大中国国际超模,都是哪十个。
-
盘点素颜好看的女明星
最近,吴昕素颜出镜将大家化妆,而大家也发现,吴昕素颜真的还挺不错的。大家都清楚,化妆跟素颜一定会有差别。在纯素颜的情况下,吴昕还能是这个样子的,也是很棒了。而在娱乐圈中,还有很多素颜也很好看的女明星。今天,就一起来盘点一下娱乐圈中那些素颜好
-
盘点娱乐圈明星子女小名
知道了谢娜双胞胎小公主的小名之后,也是觉得很可爱的。娱乐圈中一些明星给孩子取小名,也已经成为一种潮流了,那么娱乐圈中还有哪些有趣的明星孩子的小名呢?
-
盘点五一旅游最佳去处
五一就要到了,在五一来临之际,不知道你们有没有旅行的计划呢?三天的小长假,其实已经够你出去短途玩一趟了。那么五一有哪些好去处呢?今天就来盘点五一旅游最佳去处。这些有山有海,希望你能玩得尽兴!
-
如果有人说你脸大
在这个看脸的时代,如果有人说你脸大你要如何回应?或许是因为讽刺你脸皮比较厚,或许是你的脸真的比较大。总之被人调侃脸大,是不是内心一万个不爽?
-
公婆买房要给女儿留房间
最近杭州的一名网友在网上发文,表示自己的公婆买房要给女儿留房间,对此这个儿媳列出了自己的几大看法
-
上课偷拍老师被发现
最近,不少朋友都沉浸在回顾当年青涩校园时光的回忆中,每个人的校园时代总有那么一个长发飘飘的初恋,一个两肋插刀的哥们儿,当然最重要的是还有一个无比逗比的老师。
-
朋友圈点赞最高的神回复
要说这朋友圈也是一个人的社交圈,对于有些朋友来说也同样是个幽默圈。当你一本正经发了条朋友圈,却被脑路大开的朋友玩坏后是什么情景。
-
国庆节手抄报
十一国庆长假来临,2016马年国庆节手抄报内容可以写什么内容呢?国庆节手抄报内容可以有简介、诗歌、古诗和名言警句,当这些资料都找好以后,国庆节手抄报版面要如何排版呢?这里有关于国庆节手抄报图片大全,不妨参考看看。
-
中秋节手抄报资料
农历八月十五中秋节是个团圆的节日,这一天中秋节吃月饼,赏月,送礼物。而很多学生需要绘制中秋节手抄报,那么关于中秋节手抄报有什么内容吗?我们一起来看看中秋节手抄报资料及版面设计。
-
教师节礼物
老师有责任向学生传授知识,他们的勤恳付出,只为了学生能够拥有一个好的将来。今天又是一年一度的教师节,一声老师,幸苦了,一束鲜花,一张贺卡都能够表达对老师的感激。但送礼物是有讲究的,教师节送什么花,教师节送什么礼物好,是一件头疼事情。那么,教师节礼物如何送的有价值有意义呢?
-
七夕情人节礼物
情人节又是虐待单身狗的日子,中国传统节日——七夕情人节到了,你为亲爱的她准备了什么礼物了吗?玫瑰巧克力首饰虽然盛满了爱的心意,但却是老掉牙的套路,没有丝毫创意。那么,什么是最有创意的七夕情人节礼物呢?都看过来吧!