1.下围棋,为何电脑不如人?
2.电脑为何下不过围棋高手?
3.在国际象棋领域,电脑已经可以战胜人脑,那么围棋领域电脑还差多远
4.“阿法狗”因败而获世界排名,世界冠军柯洁:约吗
下围棋,为何电脑不如人?
不过,英国《卫报》日前刊文指出,“摩尔定律”(电脑速度每18个月提高一倍)依旧有效,但人类还可以在一项棋盘游戏上称雄——围棋。该报称,曾有人悬赏100万美元征集电脑程序以击败围棋职业选手,迄今为止,还没有一个程序能接近于完成这项任务。围棋规则简单易学,玩起来却是钻研越深越觉得精深莫测。世界上有数百位职业围棋选手,主要在中日韩3国。即使是最好的计算机程序,也只能达到一个普通欧洲俱乐部选手的水平,远逊于职业围棋选手,正如同普通网球俱乐部选手不可与参加温布尔登公开赛的高手同日而语。围棋棋子以非常复杂的方式影响彼此的价值,某一个子的价值取决于与周围棋子的关系而并不仅仅取决于其本身。围棋在任何点都可能走出不好的下法,但是因为下围棋时间长,一盘棋双方通常要走200多手,所以很难看得出一手不好的棋是否会在棋局发展中产生影响。此外,围棋存在视觉因素,没人能将围棋的视觉因素很好地编入程序中。高手会因为“棋形”难看而不采用某个下法,也会考虑一片棋对棋局其他部分的“轻重缓急”的影响。按照电脑专家的粗略估计,围棋电脑程序的计算速度仅为象棋程序的百分之一。每下一手要比象棋多4倍的变化,所以要想让围棋电脑程序达到象棋电脑程序的水平,需要比象棋电脑强1027倍的电脑。按照“摩尔定律”,人类或许能在22世纪开发出能够战胜人脑的电脑围棋手。
电脑为何下不过围棋高手?
我是Facebook的智能围棋darkforest的负责人和第一作者。现在我们最新的darkfmcts3 在KGS上有5段,和目前最好的软件相当,让四子与一位韩国的职业六段一胜一负。收到的评论都是说“下得非常像人”,大局观强,屡见好手,当然偶尔也犯低级错误。
我们用了DCNN(深度卷积神经网络)进行模式匹配再加MCTS(树)搜索的办法。DCNN其实要比简单的开局库或者搜索引擎要厉害得多,在看过十几万局棋之后,它会有比较强的泛化能力,或者通俗地说是举一反三的能力。围棋虽说是“千古无同局”,但在局部及开局还是有很多相似或者相同的模式会反复出现,DCNN能够抓住这些模式并且在实战中灵活运用。完全不用搜索的DCNN挂在KGS上就有3段的水平,这是非常让人吃惊的,甚至比我们通过搜索能达到5段更让人吃惊,我们只在这个项目上花了五个月的时间,若是用传统方法来做这个模式识别,估计耗时几年1k都不一定上得了。
单单拿游戏的状态个数去比较它们的难度,是不准确的。有很多状态空间广阔但是易解的例子。比如状态空间的估值函数很平滑,用一个简单的函数就容易拟合,在这种情况下即使状态数目是无穷大,问题也不难。
让计算机投篮,出手的方向、速度、篮球的旋转,每个变量都是连续的,因而有无限可能,但是计算机试几次之后很快就能找到最优解。又比如状态空间存在可以用数学表达的全局结构,这样用贪心法或者动态规划也可以很快地解决,其难度和状态个数就无关。
比如说棋盘上放些黑子作障碍物,要求白子从左上角走到右下角,哪怕是千路万路棋盘,尽管可能的路径有指数条,一个最短路径搜索也就可以搞定了。
围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。这两点加起来,迫使目前计算机只能用穷举法并且因此进展缓慢。但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的。这些规律远远不是几条简单公式所能概括,但所需的信息量还是要比状态空间本身的数目要少得多(得多)。现在的深度学习能在大量对局中找到这样的一些规律,但仍然没有人脑厉害。这一方面说明我们现在算法的局限性,另一方面它还有巨大的发展空间。
一句话,穷举状态并不是最终目标,就算以后超超级计算机能做到这一点,也不能说解决了人工智能。只有找到能学出规律的学习算法,才是解决问题的根本手段。像NP-hard的问题也是如此,不太可能会在多项式时间内被一个简单算法解决,也不太可能需要超级计算机穷举解决,而是会被过去的大量经验加上适当搜索解决。这个方向最近开始有一些文章了,我觉得这是个有趣的方向。
大家都知道创造是需要素材的,从机器学习的角度来说,素材就是给自己大脑的训练样本,在从这些样本中抽取别人不曾抽取到的共同点,找到潜在的联系及局限性,创造力就会自然而然地产生。
现在机器不如人的地方就是它抽取的效率太低,需要大量的样本,而人脑在过去经验加上更有效算法的基础上,只要几个样本就可以做到。如何让计算机也做到这一点?我们还需要进一步的研究。
■作者:田渊栋,美国卡耐基梅隆大学机器人系博士
(来源:《科技生活》周刊)
本文来自:《科技生活》周刊
在国际象棋领域,电脑已经可以战胜人脑,那么围棋领域电脑还差多远
深蓝 1997年,美国IBM公司的“深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫。“深蓝”的运算能力当时在全球超级计算机中居第259位,每秒可运算2亿步。 比赛中,第二局的完败让卡斯帕罗夫深受打击,他的斗志和体力在随后3局被拖垮,在决胜局中仅19步就宣布放弃。IBM拒绝了卡斯帕罗夫的再战请求,拆卸了“深蓝”。卡斯帕罗夫虽然后来多次挑战电脑战平,却无法找“深蓝”“复仇”,留下永久的遗憾。 浪潮天梭 2006年,“浪潮杯”首届中国象棋人机大战中,5位中国象棋特级大师最终败在超级计算机浪潮天梭手下。中国人发明的这项充满东方智慧的模拟战争游戏,被中国超级计算机独占鳌头。 值得一提的是,浪潮天梭在比赛中,同时迎战柳大华、张强、汪洋、徐天红、朴风波5位大师。在2局制的博弈中,浪潮天梭以平均每步棋27秒的速度,每步66万亿次的棋位分析与检索能力,最终以11:9的总比分险胜。 从那场比赛开始,象棋软件蓬勃发展,人类棋手逐渐难以与之抗衡。 沃森 2011年,“深蓝”的同门师弟“沃森”在美国老牌智力问答节目《危险边缘》中挑战两位人类冠军。《危险边缘》以答案的形式给出线索,如“小时候砍了樱桃树”,选手需要以问题作答,如“是乔治·华盛顿吗”。“沃森”可以在3秒内检索数百万条信息并以人类语言输出答案,还能分析题目线索中的微妙含义、讽刺口吻及谜语等。“沃森”还能根据比赛奖金的数额、自己比对手落后或领先的情况、自己擅长的题目领域来选择是否要抢答某一个问题。 “沃森”最终轻松战胜两位人类冠军,展示出的自然语言理解能力一直是人工智能界的重点课题。 阿尔法围棋 今年1月,美国谷歌公司旗下的人工智能公司“深度思维”在《自然》杂志上报告说,该公司研发的“阿尔法围棋”人工智能程序去年10月以5:0战胜欧洲围棋冠军樊麾,这是人工智能程序首次在不让子的情况下战胜人类围棋选手。 “阿尔法围棋”的核心系统属于时下最火的基于神经网络的深度学习:模拟人脑神经网络,通过大量数据分析学习了3000万步的职业棋手棋谱,再通过增强学习的方法自我博弈,寻找比基础棋谱更多的打点来击败人类。“阿尔法围棋”通过策略网络和价值网络来决定棋路,不去计算每一步的可能性,颇有人类棋手“我感觉这样会赢”的味道。 这四场令人记忆犹新的人机大战均以计算机获胜而落幕
“阿法狗”因败而获世界排名,世界冠军柯洁:约吗
一场围棋人机大战2016年3月15日收官,李世石的戏份还没完,眼瞅着要被柯洁抢走。3月14日阿法狗程序员在个人社交平台向柯洁发出了非正式约战,而柯洁早已多次发微博,表达和阿法狗一战的愿望。只是这场人与程序员眉来眼去的约架,还有诸多现实的门槛需要翻越。
阿法狗世界排名第四
虽然在第四盘比赛中输给了李世石,但AlphaGo却意外得到了另一个收获——世界排名。比排名更重要的是,阿法狗在与李世石的较量中,赢得了棋手们的尊重。
世界职业围棋排名网站GoRatings.org将阿法狗(AlphaGo)放在世界第四,仅次于中国柯洁、韩国朴永训以及日本井山裕太。自从2015年10月至2016年3月,阿法狗以8胜1负的战绩,正式进入世界职业围棋选手排名。
排名高,水平高,还不知疲倦,这让阿法狗成了棋手们期待的对决目标。柯洁、古力甚至聂卫平,都表达了希望切磋的愿望。古力甚至直言,如果能与AlphaGo对弈一段时间,自己的实力将得到很大提升。
比赛没完被抢戏
目前除了李世石,要论阿法狗的下一个“测试员”,呼声最高的也许就是柯洁。
别看正在进行的人机大战中,李世石还是主角,阿法狗设计公司DeepMind的研发工程师拉里亚·哈德塞尔(Raia?Hadesell)已把目光投向另一个超级棋手。3月14日她在Facebook上公开表示,“AlphaGo现在可以有正式排名了。(谢谢输给你,李世石,如果一直赢棋就不能被排名算法统计)。现在AlphaGo积分是3533分,排名世界第四。柯洁,准备好了吗?”
翻看拉里亚的社交平台,发现她早已关注了柯洁的微博。此前柯洁在李世石首盘落败后发表“虽然阿法狗能赢李世石,但它赢不了我”之后,拉里亚还将微博原文转发在她的社交平台上。
约战柯洁无实质性进展
虽然双方都在社交平台上眉来眼去,但目前这场约战仍只是设想。无论柯洁方面,还是DeepMind团队都表示,没有实质性进展。
此前,谷歌联合创始人、谷歌总裁谢尔盖·布林在回答是否会紧接着向柯洁发出挑战时表示,相关事宜全权由DeepMind团队决定。不过AlphaGo的开发负责人、DeepMind创始人哈撒比斯表示,下一步有可能挑战中国围棋选手柯洁,但并无实质性动作。考虑到谷歌目前在中国大陆并未恢复业务,类似的约战还真只能停留在口头了。
柯洁也明确表示,自己并未接到过任何关于AlphaGo约战的信息,他只是在微博上婉转表示:谷歌不直接挑战我,作为国人你懂的!
人类抓紧“算计”阿法狗
阿法狗也许最近还没法来到中国大陆,和中国职业棋手过招,但也并不妨碍棋手们对人机大战的棋谱进行研究、消化和吸收,为可能到来的人机大战做准备。
正在进行的第3届“百灵杯”世界围棋公开赛预选赛上,对电脑颇有研究的罗洗河九段在对阵等级分排名第三的周睿羊九段时,就被评价是采用了类似AlphaGo流的招法战胜周睿羊,爆出不小的冷门。
对于机器的棋路是否值得学习,柯洁有不同看法。“又能长多少呢?”对机器下围棋的未来,柯洁依然不看好。他目前的目标,是多找出些阿法狗的BUG(缺陷):“我们必须承认AlphaGo拥有超一流的实力。不过,李世石3月15日赢了它之后让我的信心也更足了,综合李世石对阿法狗的胜率以及我对李世石的胜率,我想我对阿法狗的胜率大概在六到七成。”