百年清华

王小川:AlphaGo的幕后与思考

2016-06-12 | 来源 大数据文摘 |

王小川,搜狗公司CEO,前搜狐高级副总裁、首席技术官。1994年王小川用吴文俊消元法,首次在微型机下完成初等几何命题的全部证明。1996年王小川代表中国队参加第8届国际信息学奥林匹克竞赛(IOI),获得金牌,后为中国队教练。2015年,王小川以“群体智能支撑的互联网技术及应用”科技成果获得北京市科学技术奖一等奖;获得了科技北京百名领军人才、推动“北京创造”的10大科技人物奖、以及北京市劳动模范称号。此前王小川还入选了2014年北京市高层次创新创业人才计划,并获得了2014年安永中国新兴企业家奖等多个奖项。2016年王小川代表搜狗捐赠清华大学1.8亿元成立“天工智能计算研究院”,共同致力于人工智能前沿技术的研究。王小川先生毕业于清华大学计算机专业,拥有工学学士、工学硕士,以及EMBA学位。

6月6日,清华大学计算机系校友、搜狗公司CEO王小川于清华人工智能论坛上做了题为《AlphaGo的幕后与思考》的演讲,论述了在Alphago人机大战背后的故事,这场大战有着怎样的意义,以及人工智能研究和产业的碰撞。

演讲全文如下:

今天我更多想给大家分享我背后看到的关于有趣人性的东西。之前的嘉宾们讲了很多学术,学术跟企业的碰撞,最后讲一个交接点,一个大的趋势以外,还有一个人在里面扮演什么样的角色,找到自己的定位。所以我今天选了这么一个题目。这个题目中间第一件事情就是4:1的比分,每个人都已经看到了,而我对它的理解,先用一个词,它是一个学术与市场营销的完美的结合,特别是在东方,全中国人我估计95%都知道这样一场比赛,而且彻底颠覆了我们对技术、对人工智能的理解。

但是为什么这么说呢?我先用一个词,Google背后的心机。Google在今年1月份在《自然》杂志上发表了这个事,是跟樊麾打一场比赛,比赛前跟樊麾签了一个协议,我跟你比赛结果不管是输是赢,你不能对外透露任何细节,就是不能跟外面讲,是保密的,这是他干的一件事情,为什么他这么干呢?很有意思,论文发出来的时候,如果假设提前告诉了公众说先不发论文,我先跟樊麾比了一场,真正有多大学术的高度?可能没感觉,看到樊麾比赛的人会知道有学术意义,如果光看论文,大多数是没有感觉的,但是跟大众讲说我们智能赢了这个人,所以Google这个团队心思之缜密,不仅是在做研究的这群人,一下子把这个事情推到特别大的高度。

另外他们为什么选樊麾?事后诸葛再看这个事情,如果他选一个职业选手,但是是一个没有世界冠军的头衔的,我们觉得挺LOW,跟以前一样,以前好多程序都是偏业余的,感觉不好。一来给大众一个感觉,找了一个世界冠军,一个欧洲冠军,挺高的头衔,但是对专业选手而言,仅有二段,不算高手。我觉得既把眼球吸引到了,但是反过来又留下了给大家的想象和争论的空间。所以之前在1月份看到很多很多的文章在讲这个程序,其实离围棋还是很远的,这是之前的理解。

比赛之前大家是什么心态呢?比如聂卫平讲,说是觉得计算机一点机会都没有,不可克服的问题,认为机器能够下棋是没有判断力的表现,讲得很愤怒,甚至还有中国队的围棋总教练俞斌,他是在围棋界里面计算机学得最好的,在80年代就自己写下围棋的计算机程序,得到很多认可。

我认为机器是一点机会没有的,因为我认为计算机有它不可克服的问题,人和电脑相比,100%是人赢。我想在这里面能够看到人性当中脆弱的一面,每个人都有,每个人生病的时候都有自己的压迫,别人说你特蠢,微软这个东西做得特烂,大家都不开心,每个人都有自己的自尊心在里面,这件事一定会把一部分人放在我们自己的历史舞台的对立面里面去,围棋选手今天很不幸,在下棋上有这样的问题。

计算机的问题怎么讲?比如李开复讲认为AlphaGo比较悬,但是未来能赢,IT界的人不会说机器干不过人,他自己的存在感就没有了。但是通常都认为机器没有这么快,以后会赢得。这次这样一个比赛,大多数搞技术的人都没有感觉到这个事情发生有这样的速度。我很有幸,在2月份的样子,我在知乎上发帖子,说这次AlphaGo会完胜,满足了张钹院士讲的三个条件,第一,我提出了问题,我看到了下棋,人工智能在下棋上是一个重大的事,好多人觉得没有这个问题存在,没有想这个方向。第二个我看到它会赢,第三个,我知根知底知道为什么会赢,我认真地读了论文,找了下围棋的人请教,我斗胆发了这样一篇文章,是有勇气的,最后也被验证成功了,理想跟现实之间差别是很大的,对于这样一个技术趋势里面,我觉得我是有判断,但是市场股价没办法思考。

比赛前到比赛后就是七八天时间,给AlphaGo取了一个新的名字,叫“阿老师”,我们特别希望中国有人做出这样的阿老师来,把它当老师看。之前不是,之前觉得一无是处。我还很尊重他,他愿意脱帽子给机器致敬。网友叫它“狗狗”,给了很好听的名字。这里面反映的什么事?

在比赛前、比赛后,我们对机器的理解里面产生了巨大的变化,我们开始接受它,开始把它拟人化,而且比分很巧妙,4:1,如果赢五局可能就不好了,不是围棋选手被灭了,是人类被灭的感觉。带来人和人平等的关系开始建立,印刷术建立之后,我们开始探讨人和人之间的关系。后来我查史料,文艺复兴这样一个运动,它其实是从封建社会到资本主义社会之间的一个分水岭。咱们中国现在还没经历这个运动,所以有一点点问题。但是AlphaGo之后,我觉得今天带来我们重新的思考,就是机器和人的关系,去思考这个事情,有专家会讲机器还不行,但是有人讲机器以后会颠覆人类,我们开始思考这个问题,以前认为机器就是机器,拔电源就行了。诊断报告是机器给做的,说你这个人有什么问题,看片子看得怎么样,找专家、找人。但是在今天照片子之后,机器给你诊断效果可能是比人更准的。我有一个朋友,也是清华的一个同学,他就是做CT看片子的,做乳腺看片子,他说大多数医生看片子准确率是40%,他现在到70%,已经高很多了。我们今天接受机器在里面能做很多的判断。这是我们巨大的一个心理上的变化,我把它称为“第二次人类自己的运动”。

对于机器智能,大家讲了很多了,有各种专业的方法,包括怎么定义人工智能,我们做产品的时候,就是想机器怎么能在里面做决策、做识别,目的还是希望能够做决策。从做决策这件事情里面就分了三个层次。

第一层,将传统方法交给机器。第二层,将答案交给机器记忆学习。第三层,将目标给机器自我学习。

这是我自己的理解,也是跟AlphaGo脉络一致的,其实最早的专家系统就是第一个,我们把规则交给机器,我们不管提符号主义,我们就把是把计算机世界变成一个逻辑,告诉机器,这是原来的阶段。但是这个阶段里面重大的问题,如果我们自己会做,但是我们没法去教机器,我们不知道怎么描述的时候,这个机器就不灵了,而且教出来的徒弟永远是比人弱的,这是不够的地方。甚至我们在做一些学习系统,我们也要尝试告诉机器怎么去描绘一个实物,比如说做人脸模型,王小川长成这样,大家都认识,但是要描述出来,比如说脸很圆,这个事情也比较不靠谱。因此我们发现我们没法告诉机器,有了深度学习的方法以后我们确实解决了一个问题,就是只告诉机器答案,我们给他的数据越原始越好,这件事情会使得程序员、工程师更容易应对专业的问题。因为它可以减少自己的专业背景,不用讲说我要去懂人,或者我要像医生一样懂得这个片子怎么看,他是拿数据训练的。所以在这样一个深度学习或者是人工智能发展过程中间,由于深度学习本身带来了好处,技术人员更容易进入到专业领域里面破解题目,但是这是技术本身。但是对公司而言,公司的领头人一定是对行业理解比较深刻,对行业应用的时候必须很懂,这是我们讲的第二个侧面,我不用给机器方法,我给机器答案,机器自己找方法。

AlphaGo代表一个趋势,我之前跟微软也在聊这方面,既不给你一个规则,也不给你一个答案,我把自己变成一个判断者,就像下围棋一样,围棋之前训练的时候,前三盘棋是把人之前的走棋方法告诉机器,机器就是跟人处于类似的状态。之后是机器人自己下,我也不知道哪个棋好不好,但是下完之后,人告诉机器这个结果是好还是不好的。人工智能又得到一个新的法门,答案都不需要知道,变得更加省事。

最近有一个消息应该是比较靠谱的,AlphaGo在今年内会跟柯洁打一场比赛,我跑去看了很多评论,以前是一边倒觉得人会赢,今天一边倒觉得机器会赢。在座的各位觉得柯洁会赢的有吗?还有是吧?这是缺乏判断力的表现。但是我会猜想Google会干什么新的事,不是简单地下棋。我有一个猜想,我认为这一次跟柯洁比赛的AlphaGo是没有经过那三千万盘棋学习的,因为之前是从KGS里面拿了人六段到九段的走棋,让机器在里面学习,这是跟李世石打比赛用到的。但是跟柯洁比赛我认为是新的,就是两个从来没有学习过的机器,然后告诉你赢了、你输了,什么都不会的机器训练一个下棋的规则来,跟柯洁比,如果是所料的这样就会非常好看,因为以前的机器是仿人的,甚至我们判断机器走棋走得好不好都是我们的经验去判断它。下棋的时候,头两局机器赢了,人输了,媒体的报道说法是中盘逆转,为什么叫中盘逆转?是因为前一半里面专家态度就是机器走得特别臭,走到一半的时候,发现机器越到中局的时候越好了。这个时候就觉得机器是翻转局面了。但是后来数据统计,包括Google自己说的,其实不是,在他们的视野里面,机器一直是领先的,只是以人的眼光觉得机器走得很差,以机器的眼光,它自己走得挺好的。

所以我们对机器的理解是有限的,因此如果机器根本没跟人学过完全自己的经验,这次就会有很多新的方法出来。比如慕容复中原的武功学会,然后再去修炼,突然来一个西域的,或者没有跟中国比赛过的,没有学过围棋打法的,我们会遇到这样的一个问题。因此我内心中,是否用这个程序参加比赛是我的猜想但是Google尝试不用人训练机器,我蛮佩服的。就好像再重演一次人类的进化史。

我们会好奇哪些职业会被取代,倒过来讲就是哪些行业是创业的机会?其实下围棋的程序,如果把程序突然间跟AlphGo说,对不起,我们改点规则,我们把棋盘放成21×21,放大两个,机器肯定就不会下棋了,但是李世石一定会下。所以机器能做的事情是非常非常有限的。如果说这种题目非常地清晰,就像下围棋一样的,输入的信息就局限在有限的输入里面,在有限的输入下,有规则清晰的输出,在这种情况里面,机器都会把人给取代。所以任务的确定性高,输入的信息封闭有边界,输出答案是标准可评价的。为什么呢?棋手已经有了,或者医生、司机、股票的高频交易,像这种情况下输入的信息非常有限,在信息非常有限的情况,机器就把人给应了,因此这里面是机会。难被取代的行业,像创造性的东西,画家、作家、科研,因为你这样一个思考的问题是没有一个边界的,对机器而言,今天是完全找不到机会去努力的。分析一下哪个行业让机器更有机会参与,让人做哪些行业。

技术人员而言,今天发现自己不再是代表人的一方,而是代表让机器更加聪明,能够提高机器的效率,能够看到更广阔的前景,尤其是做搜索的公司,做人工智能好像更有优势,为什么?因为有很多的数据,比如像芮勇讲的要做数据的时候,搜索摩托车,找图片,没找到就不会点击了,用户的点击都会反过来给图片做标签。更多的是搜索引擎本身就在做初步的人工智能。因为我们看到给你一个关键词你要理解想要什么,随后能够给它十条答案。我在理解里面,人工智能就是底层的基本理念,完全是一致的。

今天我们看到Google往前走的时候,已经开始提更多的理念,他们已经开始在讲说已经从移动时代走向人工智能的时代。乔布斯也想得很明白,在走之前说机器能够在未来学会回答问题,或者接受你的指令去做事。机器里面是这样一个辅助的角色,但是很不幸,苹果的技术能力不够,或者是时代没有到,理念很好。

微软题的一个概念也是做这个事。当然现在很多了,包括Google、亚马逊,大家都开始让人跟机器以自然语言做沟通,机器服从于人,帮你回答问题,或者是帮你做一些控制命令。这是整个大的背景。我自己也觉得今天我们提互联网已经不提连接,一方面是文化创意产业,一方面是机器变得更聪明,因为有了数据以后,怎么选择这个连接,做判断就变得更关键。


相关新闻