百年清华

搜狗CEO王小川:AI如何帮助我们用语言连接世界

2018-10-31 | 来源 微信公号“DeepTech深科技” |

10 月 27 日,由《麻省理工科技评论》、DeepTech深科技联合主办的“全球科技青年论坛”在北京举行。论坛集结了海内外 30 余名顶尖科学家、企业家与研究者,为现场超过 600 名关注新兴科技、热爱科学事业的参会者开启了接触前沿领域专家的机会。

搜狗 CEO 王小川在会上发表了演讲,探讨了信息文明时代下的人与信息的关系,同时分享了搜狗在这方面的 AI 技术创新和应用。

以下为王小川在论坛中的精彩演讲,内容略有删改:

今天我讲的主题是信息文明到智能文明的一些思考,尤其是搜狗在其中会扮演什么样的角色。

一次又一次技术的重大突破带来了文明的跃迁,从农业文明到工业文明。随着计算机、光纤、互联网的发明,我们进入到了信息时代的信息文明。

80 年代末到 90 年代,我们非常重视电脑打字和输入法,因为只有中文能够被这个输入法信息化,我们才有机会进入到信息文明。搜狗协助了这样的中国信息化,实现了大家表达的突破。

人和信息之间的关系有很多的维度,其中一个是让人能够输出信息,这就是输入法。另一个维度是在互联网上获得信息,这方面最重要的产品就是搜索。所以搜狗在自己定义使命的时候,其实紧贴着信息文明的时代,让表达和搜索信息更简单。

这里有一个核心就是语言。其实在人类历史上,掌握一种语言就掌握了一种灵魂,全球有 7000 多种语言,只要你对语言有深刻的理解,你就理解了一种文化。而语言对计算机来说是非常有挑战的,在自然语言处理的信息科学里,有一句话叫“自然语言处理是人工智能皇冠上的明珠”,但它很难。当我们做输入法、搜索的时候,也需要大量地跟语言的处理打交道。

从机器文明向智能文明发展的时候,人工智能技术的突破,例如最新的翻译模型的演化,开始把翻译问题变得可解决。我们让表达和信息获取变得更简单,不仅可以做到中文,还可以做到跨语言的表达。我们也可以使用跨语言的引擎,输入中文,输出的是外文,或者输入中文查询全球信息,这就使得我们可以做跨语言的输入和搜索。

而在信息文明到智慧文明之间,我们在 AI 上的突破能够起到衔接的作用,未来走向智能文明之后,人是需要通过语言进行表达而连接这个世界的。

这里有两个词:自然交互、知识计算。这意味着我们希望以人的方式与机器交流。我们从人去适应机器,开始变成机器适应人。以前机器计算力不足,所以人需要去记忆编码,用了语言后这个过程就变得更加自然了。如今的手机也从以前的键盘鼠标走向了触屏,也变得越来越自然。因此在这个和语言相关的大方向里,人其实不是靠敲键去做的,而是靠听觉、视觉进行交流和沟通。

我们容易想到的方向就是语音识别,现在语音识别已经变得非常可用,但语音识别之外还有什么东西呢?除了让机器听懂人的表达之外,还要能以人能听懂的方式进行表达,里面涉及到声音、图像的合成,让人用听觉和视觉来获得信息。

而除了自然交互以外,还有一种领域叫知识计算,它不仅是在语言层面上通过语音图像进行表达,而是要在语言中间进行更抽象的计算。其实语言不像语音图像,它代表了我们对概念的掌握和推理。搜狗做这样的研究,特别大的优势是有场景来使用它们。

谈到输入法的未来,我们很容易想到语音输入,但这个是不够的。去年搜狗上市的时候,当天就收到了 3000 条祝福信息,这让人很难一一回复,因此也许真正智能的输入法不仅是用语音来输入,而应该让机器产生一定的理解能力,做辅助性的输入,这样的技术我们已经开始运用在一些较为垂直领域了。

谷歌曾在 I/O 开发者大会上展示过辅助人进行表达和对话的语音助手。这种辅助人进行表达和对话,意味着输入法不再只是一个打字工具,它会变成你的助理,不只是让你做一道填空题,而是把填空题变成选择题,来理解你的个性,最后你做选择。这样能极大地提升效率,特别是在客服、销售的这些领域里,能够把企业文化和他们的术语用到个人表达里提高工作效率。

另外,搜索到智能时代之后会有什么变化呢?我们现在说到的语音搜索其实还只是解决一个交互自然的问题,而事实上,目前搜索的重大发展方向是从搜索走向问答,我们以前习惯于搜索一个关键词,得到 10 条结果,但这是不自然的过程,这是人被迫适应机器不智能时候的一种方式。

今天更多的研究是在于,如何在你说一句话的时候,机器就能理解你的提问,同时这个机器在阅读网上数千个页面的时候,在页面中间产生阅读能力来寻找答案,从而把搜索从一个关键词引擎走向一个问答引擎。

在这个里面,我们已经做出一些实用的产品来。目前搜狗搜索已经能做到大概 20% 用户的提问搜索直接给出答案,而不是给 10 条的结果了,这也是今天搜索行业正在努力的方向。

在国际上,关于问答领域的研究也成为了人工智能中语言方向的重要研究之一。从一个信息文明向智能文明过渡的时候,我们让机器开始帮助人更好地进行沟通,我们称为自然交互,帮助建立智能,并开始做知识的计算。

所以在这种情况下,最终我们可以看到这样一个 AI 能力:以语言为核心,开始具有与人沟通、能听懂、会表达的能力,以及开始处理人的信息和互联网的信息,能开始理解你的概念,做推理,成为个人助理,这在行业当中叫 VPA(虚拟个人助理)。

这就是 AI 时代里面,从信息文明到智能文明过渡的重点方向,这也是搜狗努力的方向,我们有很好的技术能力和使用场景来支持这种业务的发展。


相关新闻