AlphaGo下个月再次挑战人类选手,这一次是柯洁

标签:谷歌医疗技术项目人工智能

访客:12079  发表于:2017-04-11 09:57:50

AlphaGo下个月再次挑战人类选手,这一次是柯洁

谷歌在中国棋院召开发布会,宣布5月23日-27日在乌镇主办“中国乌镇·围棋峰会”,届时AlphaGo将再度与柯洁等为代表的中国顶尖棋手进行围棋对弈。

除了备受瞩目的AlphaGo与世界排名第一的柯洁的三番棋对弈之外,本次峰会还将举办配对赛和团队赛,配对赛中,两位棋手将分别与AlphaGo组队,挑战棋手如何理解AlphaGo独特风格并与之合作;在团体赛中,将由五位中国顶尖棋手合作,建立棋手“神经网络”,降低心里因素的影响,从而做出更加客观的判断。

距离去年AlphaGo 战胜李世石,已经过去了1年多的时间。在五局三胜制的比赛中,AlphaGo连胜三局提前2轮赢得了比赛,虽然李世石最终赢得了一局比赛,挽回了颜面,但是AlphaGo展现出了无懈可击的强大,让人印象深刻。

然而,当时对弈的只是AlphaGo的1.0版本,本次与职业围棋九段选手柯洁对战的是AlphaGo的2.0版本,它采用了新的算法模型。

而在去年12月29日开始,它还曾经化名Master在围棋网站上轮番挑战中日韩围棋棋手,其中包括了聂卫平、朴廷桓、井山裕太等知名高手,并在1月3日晚间赢了柯洁,最终以60场不败的战绩结束了非正式的测试。

AlphaGo是谷歌DeepMind团队开发的一款围棋人工智能程序。据DeepMind介绍,1.0版本的AlphaGo是“深度学习”人类棋谱得出围棋手数的估值,AlphaGo1.0所走招法其实并没有脱离人类的理解,而且也是人类棋手曾下过的棋。如果AlphaGo1.0完善到极致,就意味着得出了接近完美的围棋手数估值函数。

2.0版本AlphaGo利用这个估值函数自我对局和“深度学习”,不再受人类棋谱的局限,下出真正属于“人工智能”的围棋。

AlphaGo主本身主要由以下部分组成:

走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋;

快速走子(Fast rollout),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋网络快1000倍;

估值网络(Value Network),给定当前局面,估计是白胜还是黑胜;

蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这三个部分连起来,形成一个完整的系统。

根据AlphaGo研究者DavidSilver的解释,AlphaGo的策略是围棋巨大无比的搜索空间压缩到可控的范围之内。

在AlphaGo两种不同的神经网络中,“策略网络”的作用是预测下一步,并用来将搜索范围缩小至最有可能硬起的那些步骤;“价值网络”则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。

在之前,腾讯AI Lab团队也推出了自己的围棋人工智能“绝艺”,不但赢得了世界围棋AI冠军,也在后续的比赛中战胜了人类棋手。而根据绝艺团队的介绍,绝艺的算法也是基于AlphaGo的策略网络和价值网络两大核心。

而且,会下围棋的AlphaGo也只是DeepMind研究的人工智能项目之一。作为谷歌的顶尖技术团队,其更大的目标是在智能助手、医疗和机器人这样的领域取得进展,另外,尽管AlphaGo只是针对围棋开发的系统,但其原理可以被应用到现实问题中。

(作者:钛媒体编辑张霖)

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");