体育热点

刘知青:AlphaGo有弱点 古力:柯洁要放手一搏

字号+ 作者: 来源: 2017-05-17

刘知青:AlphaGo有弱点 古力:柯洁要放手一搏,古力围棋决赛视频讲解,韩国棋手评价古力,李世石与古力十番围棋,alphago战胜李世石,李世石和古力谁厉害

  刘知青:AlphaGo有弱点 古力:柯洁要放手一搏

  刘知青

  5月16日,北邮教授刘知青在厦门大学翔安校区图书馆举行“围棋与人工智能”讲座,介绍人工智能围棋中的深度卷积神经网络机器学习方法,讨论人工智能机器学习的应用,展望柯洁与AlphaGo的人机大战,表示AlphaGo肯定存在问题,为柯洁加油,期待他能找出AlphaGo的弱点。

  刘知青表示,即使AlphaGo与柯洁对决的版本进步很多,但仍存在致命弱点。在与李世石对决之前,我就和大多数人观点不一样,认为李世石会输。这次大家都不看好柯洁,但我就持不同看法,以子之矛攻子之盾,AlphaGo自己与自己下棋,肯定有一方会输。我们也在训练人工智能网络,认为问题是存在的。柯洁应该也知道对手有弱点。我有信心看到柯洁给AlphaGo很大压力,希望能暴露出AlphaGo的问题。如《荀子·儒效》所说的百闻不如一见:不闻不若闻之,闻之不若见之,见之不若知之,知之不若行之,学至于行之而止矣。AlphaGo人工智能也是这么做的。

  乌镇围棋峰会后,谷歌DeepMind团队应该会披露更多信息,目前我们仅能通过一年前战胜李世石的版本所披露的信息来分析,与柯洁对决的版本一定有更多提升。围棋对于计算机主要有两大技术困难,落子选点和形势判断。AlphaGo核心技术突破包括:使用深度学习卷积神经网络理解围棋的落子选点与形势判断;结合蒙特卡洛树搜索技术进行博弈树的搜索以选择双方最佳落子变化。

  AlphaGo以策略网络用于围棋落子选点:给定围棋盘面作为输入,策略网络输出落子选点的概率分布。以数学函数方式模拟人的大脑神经元构建,AlphaGo的中间层用了13个卷积神经网络层构建,而最前沿的人工智能在中间层用了多达150层来计算。策略网络通过3000万围棋落子样例数据,使用有监督机器学习算法所训练。AlphaGo论文透露训练这3000万样例用了三星期,最近公布使用新方法极大提高了训练速度。

  AlphaGo以价值网络用于围棋形势判断:给定围棋盘面作为输入,价值网络输出胜率的估计。价值网络由13个卷积神经网络层所构建,通过3000万盘围棋对弈样例数据,使用增强型机器学习算法所训练。

  1959年Arthur Samuel曾说,Gives “computers the ability to leearn without being explicitly programmed,” 让计算机自己去学习。机器学习是人工智能最前沿的研究方法,人工智能的研究经历了从“推理”到“知识”再到“学习”的发展过程。机器学习已广泛应用于诸多领域:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等。AlphaGo采用的就是有监督机器学习(Supervised learning)。

  展望未来,机器智能高速发展。机器学习将促使机器智能以指数级发展,会产生更多新型智能形态,会在不同智能形态上达到前所未见水平。人类与机器将更紧密结合在一起,机器会为人类提供更强大的智能支持。人类为机器智能的进步提供驱动力。未来机器是否具有自我驱动力,将是彻底改变未来场景的未知数。

  随后的提问环节,有学生询问,AlphaGo也会自我对局,从输棋中不断进步,如何以子之矛攻子之盾?

  刘知青:围棋理论上存在最优解的话,无论AlphaGo多强大,都还未达到那个程度。以子之矛攻子之盾,总是会有一方要输的,我有直觉,因做过研究,所以人工智能肯定是存在问题的。要为柯洁加油,检验出这个问题。

  问:AlphaGo、绝艺、DeepZenGo的棋风不同是什么原因?

  黄子忠:从我这个棋迷来看,三个软件的投入不一样,不是一个级别。

  刘知青:子忠说的很对。绝艺投入非常多,而谷歌收购DeepMind投入更多。三者技术路线一样,但技术差别可以很大,比如都选用15万盘数据,但可能选择的数据参数不同,到最后实践过程中会有巨大差别。

  问:最近德州扑克人工智能也打败了人类牌手,与AlphaGo孰优孰劣?

  刘知青:相当于苹果和梨的比较。德州扑克与围棋都是局部有限级的内容,围棋是全部信息公开,德州扑克是不完全信息公开,但也有概率分布,能知道牌的总数,不可能有5张A,可以通过数学模型和蒙特卡洛树搜索来解决。智能有不同的智能,不必直接比较。AlphaGo使用神经网络识别围棋图像,是有广泛应用意义,比如今后识别心电图图像,所以我更看好围棋AlphaGo。

  问:AlphaGo如应用到象棋,是否能强过现有象棋软件?

  刘知青:本质上涉及到围棋与象棋的不同。象棋几乎是逻辑判断游戏,比如我目标就是最终的将军。围棋不仅是逻辑,很大方面是形象思维过程,识别图片的好坏,这在象棋方面非常弱。下围棋与下象棋时,人类大脑活动扫描出来是很不一样。神经网络帮助我们从形象思维方面来识别围棋,如直接将AlphaGo应用到象棋,发挥可能反而不如现有象棋软件。智能有不同形态,人工智能不是万能的,现在的人工智能强在图像识别。

  问:有个识别颜色的人工智能软件,但似乎只在肤色方面非常敏感?

  刘知青:不太熟悉这个人工智能软件,不过很有可能是在训练时,对人类肤色比较敏感,其他颜色的数据训练没那么多。另外,就是卷积数据核方面可能对人类肤色参数设置不同。可能今后还需要在神经网络方面调整数据集。AlphaGo在围棋某些方面可能更敏感,有些方面可能会弱一些,这就有可能是AlphaGo的弱点所在。

  (李新舟)

  古力:AlphaGo的弱点在计算 柯洁要放手一搏

  刘知青:AlphaGo有弱点 古力:柯洁要放手一搏

  古力

  2017年4月,谷歌DeepMind宣布AlphaGo重出江湖,将在5月在中国乌镇与现世界围棋第一人柯洁展开三番棋较量。新浪就此相关话题采访了世界冠军古力(采访于早些时候)。

  新浪:前段时间master获得60连胜,您和它交手了3盘。请您谈谈这3盘的感受?

  古力:前2盘不知道master的实力到底如何,觉得自己下的不是很好,在不知不觉中就输掉了。第三盘觉得自己非常用心,下了不常用的宇宙流的一个局面,结果没有想到被它很轻松的消了,感觉毫无机会。看这棋觉得还是激战的地方片少一点,可能在大局观方面比我们要厉害不少。30秒一步人的思维可能局限于中间的10几步,大局想的可能没有master那么清楚。

  新浪:在历史上有很多棋手都取得了很长的连胜,比如李昌镐取得了40几连胜,李世石,还有就是当年龙飞虎的事件在网上引起了一定的热议。那么和AlphaGo取得60胜的意义差别在哪里?


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章