专访 | 王小川:人机围棋对弈是一次启蒙运动

机器之心 2016-03-11

2016年3月10日,谷歌人工智能AlphaGo又一次击败李世石引爆全球热议,搜狗CEO王小川接受混沌研习社邀请,进行了《从AlphaGo与李世石围棋之战解读人工智能未来》的直播授课。作为人工智能领域专家,王小川曾在近两月前就在知乎发文预测AlphaGo将完胜人类顶级棋手,而目前2:0的战果,也进一步印证了他的判断。


面对代表人类最高智能的围棋,AlphaGo的强劲表现令科技界为之振奋,也令围棋界“谈狗色变”。AlphaGo为何能“进化”到如此境界?AlphaGo的胜利对于人类发展进程意味着什么?王小川一一为大家拨开迷雾。




以下内容根据王小川演讲内容整理:


深度学习+增强学习让机器开始变得有“直觉”


人和机器对弈的时候靠的是棋感。人类思考有两个面向:一是下一步我该怎么走,哪个方向是好的,而不是从棋盘的300多个位置里做选择,这是人的智力思考;二是走了几步之后,这个局面对我有利还是更不利?这样的事情在以前用计算机去解决时尝试过很多规则,怎么用程序去描述如何走是更好的。象棋相对比较容易。丢了一只车扣几分,你能够把别人的后吃掉是几分,是有一套比较接近于真实局面的计算公式,所以能够知道下棋时这几个子这么走。


但在更加复杂的围棋里是做不到的,于是深度学习方法出现了。深度学习有两个突破:一是语音的识别,二是图像的处理。语音和图像相对更多是靠人的感觉去做判断的,比如波形,用程序去描述还是非常难的。但有了深度学习能力之后,机器不是简单地去做搜索,而开始进入到人最擅长的直觉和棋感——在棋盘里不用去搜就知道这步棋到底好不好,该往哪里走。Google就把3000万步棋局输入到深度网络里。于是机器获得了两种能力:一是在当前棋局下一步怎么走,概率分布就可以计算出来,不用搜索方式做;二是走了这步后能判断出棋局赢面大还是输面大。


深度学习的方法,指导机器不仅有了学习能力,而且有了围棋选手的棋感。机器不仅在搜索上比人类强大太多,棋感上也开始超过人。这时,机器的计算力就可以体现出巨大的优势,这是机器战胜人的第一个原理。


再一个方法,Google用了增强学习的方法,学了3000万步棋之后,这个机器开始自己和自己下,把人类历史数据看完之后,就像金庸小说里老顽童,自己左右互搏,开始和自己玩游戏。一旦下输之后就会想我为什么下输这盘棋?怎样做改进?增强学习使得人工智能的发展呈现加速度。


深度学习的应用已经在影响技术领域


以人脸识别为例,每个人的脸长什么样子,用程序去描述是非常困难的,而深度学习方法的出现,使得在数学模型建立之后,只要把人脸的照片放进去,告诉计算机,这张照片对应的名字是什么,在经过大量数据处理之后,机器就开始自动提取特征,把复杂的图片最后抽象成机器智能懂得的特征。


这样的技术突破,让人类对于语音和图像的理解有了极大提升。几年前研发语音的人是找不到工作的,因为这个技术不实用。但经过几年后语音相关的工作变得非常吃香,因为到今天为止机器对语音的识别能力已经开始接近于人。


之后的领域是图像处理,有个国际比赛叫做Image Net,主要是考核图像识别准确率,每年提升零点几大概就能形成一篇很著名的论文。深度学习方法的出现,使得图像处理得到了迅速提升,一次就提升了好几个点,震惊了世界学术圈。以前语音处理、图像处理大家觉得是不可能的事情,现在突然间都已经完成,这也是促成Google转向围棋对弈的契机——一个围棋的棋盘是19×19,就像一幅图像一样在机器里做训练,但又更难。


目前搜狗在人工智能领域已经做了非常多的事情,只要有大数据,我们就能够在靠人找规则有困难的地方找到机会。目前,搜狗在语音识别、图像处理、网页排序、商业广告体系里都开始大量使用深度学习的方法。比如,以前一个季度相关技术的准确率能够提升一个点或零点几个点,但机器深度学习后可以促成三个点的提升,就能让我们的服务系统有相当大的改进。所以,未来机器会有很多取代人的机会,比如看手相、疾病诊断等,这些领域也正在有越来越多的人涉足。


战胜人类顶级棋手后,Google会干啥?


接下来的对弈结果,可能Google一点面子不给赢五局,也可能会给点面子输一到两局。我的预测是:Google会赢,一旦赢了就会收手,解散团队,这个团队会做更加有意义的事情,比如进入医疗领域。


这个事件非常轰动,昨天全球有10多亿人次在观看比赛。这样一次对弈,会让所有人得到洗礼。这是个启蒙运动,受伤的是一些专业选手,但会激励两群人:第一是程序员,第二是IT创业人士。我们相信机器智能可以到来,一旦从业者信念突破的话会变得更加快,服务型机器人会逐步参与到医疗、烹饪、教育等领域,大家会开始建立这样的思考方式。这样的启蒙运动对于人工智能成长来讲是非常有帮助的事,也让大家看到到底人工智能是什么,帮助大家很好的理解。


所以,未来的世界已经不仅是讲“互联网+”,而是到了我们与机器为舞、为伴的世界。这是李世石和AlphaGo对弈里可以看到的未来。


本站仅按申请收录文章,版权归原作者所有
如若侵权,请联系本站删除
觉得不错,分享给更多人看到