AlphaGo终极版本亮相,再次震惊全人类!

36小时前,在西半球的英国伦敦,沉寂了5个月的AlphaGo(由谷歌人工智能团队开发的一款围棋人工智能程序,其主要工作原理是“深度学习”)再次登上世界顶级科学杂志——《Nature》。与以往不同的是,这次亮相的是阿尔法家族的终极版本——AlphaGo Zero。

AlphaGo 的荣耀战绩

区别于之前的阿尔法家族成员(AlphaGo此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练),AlphaGo Zero不需要棋谱和人类数据,只靠自己从空白状态学起,自由随意地在棋盘上下棋,然后进行自我博弈摸索出每一步棋的走法。

换成大白话就是没有人类这个老师教,没有棋谱练习题去测试,只能靠自己总结。

一个懂得自我学习、不断进化的程序有多厉害,看它的成绩单就知道了:

刚开始,AlphaGo Zero 除了基本规则以外,没有任何关于围棋的基础知识,偶尔还会犯些错误。

接着它花了 3 个小时入门了围棋,水平变得和人类初学者一样,低级错误不太会犯了。

19 个小时以后,AlphaGo Zero 学会了一些进阶技巧,例如死活,打劫,先占边角这些人类棋手总结出来的 “ 套路 ”。

在第 70 个小时,AlphaGo Zero 开始以超越人类的水平下围棋,掌握N种套路,多点布局。

第3天,AlphaGo Zero 完胜 AlphaGo Lee(当初击败14届围棋世界冠军李世石的 AlphaGo 版本),战绩是 100 : 0!

第 21 天,AlphaGo Zero 的排位分数和 AlphaGo Master 差不多了,要知道 AlphaGo Master 在今年以 3 比 0 击败过当时的世界第一柯洁。

第 40 天, AlphaGo Zero 压倒性战胜了 AlphaGo Master,胜率达到 90%,成为了世界第一的 “ 围棋手 ”。

凭借如此傲人的战绩和强大的自学能力,AlphaGo Zero一出世就赢得世界的瞩目:

连柯洁都不得不发微博感叹,我们人类太多余了。

可能柯洁又想起5个月前自己被AlphaGo Master击败的日子吧。

2017年5月23日,AlphaGo与柯洁进行围棋对弈,最终柯洁负于AlphaGo,图为柯洁赛后擦眼泪。

AlphaGo 的学习秘密

想想以前的 AlphaGo 用了几千万局人类的棋谱去训练,最新的Alpha Zero 一开始只学会了围棋的基本规则,纯粹靠它自己和自己下,左右互搏。

AlphaGo Zero强化学习下的自我对弈

经过几天的训练,AlphaGo Zero完成了近5百万盘的自我博弈后,已经可以超越人类,并击败了此前所有版本的AlphaGo。

DeepMind团队在官方博客上称,Zero用更新后的神经网络和搜索算法重组,随着训练地加深,系统的表现一点一点地在进步。自我博弈的成绩也越来越好,同时,神经网络也变得更准确。

AlphaGo Zero 成长曲线,图片来源:DeepMind

AlphaGo Zero的表现,是人工智能技术进步的又一次完美展现。

现在大家都在讨论,人工智能如此不给我们人类面子(试想一下世界冠军李世石被AlphaGo Zero连赢100场的场景),以后让我们这些智慧生物怎么活。

如何应对Al时代

AlphaGo Zero已经称霸围棋界。未来我们或许能在其他领域见到AlphaGo 活跃的身影,如果通用算法诞生,那么许多科学问题也可以借助AI 的力量来解决,甚至是代替人类的很多工作。

创新工场创始人李开复认为:AI将渗透到每一个行业、每一个工作,它会在十年之内改变、颠覆、取代50%的人,它会把我们做事的方法统统改变过来,比互联网来的更快、影响力更大。

李开复30年前就参与人工智能开发

“如果不想自己在未来被机器取代,就是去选机器难以做到的事情,那些要求专属于人类的洞察力、创造力和抽象思维的工作。”他说。

换言之,想要在未来立足,你要至少懂一些人工智能的相关技术,人工智能本质是计算机科学的分支,如果你有编程基础和“编程思维”,再加上我们人类独有的抽象思考能力,就能驯服机器,立于不败之地。

也许有的人对人工智能大潮感觉不强烈,但是谁又能保证人工智能不会在未来颠覆我们的生活呢?


登录或注册后发布评论