百年清华

旷视6号员工范浩强:高二开始实习,“兼职”读姚班,25岁在CVPR斩获第四个世界第一

2019-08-13 | 郭一璞 | 来源 公号“量子位”2019年7月8日 |

初来乍到,这个人说话容易让人觉得“狂”。

“我们将比赛结果提交上去,果不其然,是第一名的成绩。”当他说出这句话的时候,表情没有一丝波澜,仿佛一切顺理成章。

他说的是AI顶会CVPR上的一项挑战赛结果,全球巨头都有参与,AI高手均同场竞技,第一名并不容易。

但如果你知道“他”叫范浩强。

一切就非常稀疏平常。

谁是范浩强?

当初那个奥赛金牌、保送清华姚班、高二加入旷视成为6号员工的天才少年,人称小强,一度是AI界的江湖传说。

曾经,他是国际信息学奥赛(IOI)金牌获奖者,保送清华姚班,高二便受唐文斌邀请加入旷视创业,在半工半读的情况下保持姚班第一名的成绩,在大一军训时期就完成了一篇ICCV论文,一个让清华特奖得主陈立杰都感到智商被碾压的男人。

而如今,他已经是旷视研究院带领70人团队的算法总监了,带着一群平均年龄比自己大得多的研究员们,在图像算法、团队培养、商业化等各方面披荆斩棘,达成突破,研究领域涵盖人脸与指纹安全,移动端影像算法,AI计算摄影。

巨大光环之下,范浩强倒毫无自视甚高之意,打趣的说自己“本科毕业,两年工作经验,在贵司也就这样吧”。

正如清华计算机系常被称作“贵系”,这里的“贵司”当然也是指的旷视。

靠商用算法拿到学术界冠军

在范浩强的带领下,今年的CVPRNTIRE真实图像降噪挑战赛,旷视以绝对优势的运行时间和最终结果拿到了Raw-RGB组的冠军。

“图像降噪其实也是一件挺神奇的事情。” 介绍起这个被称作“超画质”的技术,范浩强如同在描述一件压箱底的宝贝。

这个技术,能够将手机拍到的充满噪点的图片:

变成和人眼看上去的效果一致,完美无瑕的样子:

而这个在学术界刚刚拿到冠军的降噪算法,范浩强团队从去年春天开始,做到去年10月完成,目前在产业界已经实现产品化,并开始商用,旷视多家客户都在自家的手机上用到了这个算法。

相比之下,拿到冠军反而是顺便的事。

范浩强说:“我们的工作当然也是基于学术界已有的基础,目前我们取得了新的进展,自然也要回馈给研究社区,以便能够让技术进一步向前发展。”

手机图像降噪算法是范浩强近几年最为得意的成果,而在此之前的本科时期,他已经在人脸识别、人脸检测方向带领团队为旷视拿下三个顶会级比赛的世界第一了。

在寝室里改变世界

回想起刚刚加入旷视的2012年,人脸识别在业界还是“不靠谱的事”,不少业界名人都认为,人脸识别这件事不可能靠机器自动完成,必须依赖人类的眼睛才能实现。

但还是个高二学生的范浩强却觉得,只有做“不靠谱的事”,才有意思,才有发展的空间。他就是怀着这样的心态,成了旷视第一个“Rer”(Researcher,算法研究员)。

就这样,人脸识别这件“不靠谱”的事情一做就是七年。

高中毕业之后,范浩强进入了清华天才辈出的姚期智班,开始了他的大学生涯。

在姚班的学习状态,范浩强自己说是“part time student, full time intern”,兼职读本科,全职实习生,一半时间在学习,一半时间在工作,就这样,还在四年间保持姚班第一的成绩。

而他的第一篇顶会论文,正是在大一军训期间完成的,从没写过论文的他一次投稿后,收到了这样的评价:

It isa shame that such a good method is not backed by a solid paper.

你方法这么好,文章写得这个德性,是一种耻辱。

然而最后,论文还是被ICCV接收。足以见得,在2013年,用神经网络做人脸识别是相当稀缺的东西。

也正是因为这篇论文,旷视拿下了ICCV 2013 300 Faces in-the-Wild Challenge人脸关键点定位的冠军,这也是旷视获得第一个技术评测世界冠军。

随后的2014年,又是大丰收的一年。范浩强先是为旷视拿下世界权威人脸检测公开评测集FDDB(Face Detection Dataset and Benchmark)人脸检测赛项的第一名。

之后,又拿下了互联网图像人脸识别竞赛LFW(Labeled Faces in the Wild)的第一名。

这项冠军来的并不容易,创业早期的旷视条件艰苦,在研究人脸识别的时候,连GPU集群都没有,范浩强独自一人在学校寝室,在从外部云服务租来的集群上训练,终于拿下了LFW(Labeled Faces in the Wild)竞赛的第一名。

正在他春风得意的时候,印奇发来一封邮件,强烈要求“不要在寝室里改变世界了,下周一务必来公司一趟”。

一年内两个冠军,加上2013年的ICCV,三个世界第一,让旷视在计算机视觉领域一举成名,原本“不靠谱”的人脸识别,也逐渐成为现实,应用在了各类机构、场景,以及千万人的手机上。

“信仰流”leader

除了研究成果不断夺冠,在范浩强读本科的这几年,旷视也处于高速发展阶段,各种产品都开始在行业内大放异彩,也成功自研了深度学习框架Brain++。

而在资本层面,范浩强在清华读书期间,旷视也不断受到创新工场、蚂蚁金服、启明创投等多家机构的青睐,迅速从A轮发展到C轮(如今已到D轮),成为行业领军的独角兽。

正是在这样飞速发展的背景之下,范浩强没有和大多数姚班同学那样继续深造,而是直接追随人脸识别浪潮,成为了旷视全职员工。

对范浩强本人来说,从实习高中生,到全职研究员,旷视也逐渐从初创公司走向行业独角兽。

“高中觉得这是个玩的东西,是个game;本科觉得是个job;毕业后觉得是个mission。在AI的商业化应用之路上,前方已经没有别人,现在轮到我们这群人来继续推动它的发展。”

而这期间,从参与旷视的建立,到完成人脸识别的一系列工作,拿下第一桶金,成为准备影响人类科技树的人,范浩强不仅拥有了“想做的事都能做成”的信心,更具备了一种使命感。

“连旷视这样的公司都被外界称作‘行业头部企业’,由此可见整个行业都需要继续被拯救。”范浩强无不戏谑地说。“以AI为代表的智能化技术将深刻的影响未来产业的格局,时代的浪潮已经把我们推到了这里,担子虽重,但是已经是到了想上也得上,不想上也得上的时候了。”

而听到范浩强这样一个毕业两年的年轻人讲述这些宏愿的时候,你会觉得他是这个时代的风云人物,有一种舍我其谁的英雄气概。不同于那个被多番吹捧少年天才,现在的他身上流露着一种历史使命感,配上插科打诨的脱口秀式表达,会觉得仿佛在会见一个影视剧里才有的形象丰满的人物。

也正是在他毕业后的这几年,旷视本身再度突破,由“Face++旷视”升级为“MEGVII旷视”,围绕核心AI技术原创深度学习框架Brain++,为个人设备大脑、城市大脑和供应链大脑三大核心应用场景赋能,推进人工智能及物联网技术与实体经济加速融合,实现前沿科技规模化商业落地。

在这样的发展进程下,生于1994年的范浩强已经是旷视这家明星公司旗下旷视研究院带70人团队的算法总监了。

这位旷视最年轻的总监,手下却尽是年龄比自己大的同事,范浩强想了想,才想起了一位实习生是年纪比自己小的。

并且因为“保送即创业”,范浩强虽然从没给自己写过求职简历,却经常需要看别人的简历,面试候选人。

甚至有一次,他还不得不帮一位比自己年长十岁的候选人解答一下“人生遇到焦虑该怎么办”。

在对团队的态度上,范浩强自称“信仰流”leader,给组员以自信,“使你相信你能做到”,和组员一起走下去。

“Leader分几种,有的是Manager,就是管你的,有些就是跟你一起走的,我成长中遇到的基本都是后者,包括孙剑在内。”

在组员们看来,他们或许觉得范浩强名声在外,是心目中的偶像;或许觉得是身边的好友,会夜里睡不着觉跑来聊天;或许觉得是一起成长的伙伴,可以一起相互帮助走下去。

而对组员们,范浩强希望能“至少以小强为baseline(基线)”,具有一个人能把一个方向的事情做好的能力。

给范浩强以希望的,是旷视研究院强大的研发力量:数百人的团队,85%来自国内Top10高校,70个以上的奥赛金牌,前途不可限量。

实践派研究者

至于范浩强自己在技术上的“秘诀”,恐怕要用他一直在提的一句话来概括,那就是:

Engineering is magic

来源于马斯克的一条推特。


提及大一的landmark论文,范浩强总结的经验是:Engineering is magic。

“很多事情也没什么神奇的,就是你把所有环节都做对了,就做了一个别人之前没做到的事情。人脸识别发展至今有魔法么?没有任何魔法,现在翻出1990年的paper肯定能找出很多本质一样的东西出来,但就是在你做的过程中,各个环节里面都有一些应该做对的事情。”

手机图像降噪也一样。

“Engineeringis magic,想出这些点并不难,关键是要真的一张一张去亲眼多看实验数据。”

而现在,范浩强对engineering有了更高的要求,更宏大的目标。

他说,目前自己的一块工作重心是实现算法生产的工业化体系,让数据、新算法、训练体系、测试、评估这几个部分高效有机的在一起运行,今天给需求,明天给模型,“这是我们的目标,这条路并不平坦,还在努力过程中。”

另外,则是要回答AI有什么用的终极问题,涉及业务方向、应用场景的选择,并进行商业化。

“在中国做商业化的AI其实是个崭新的命题,欧美很多做得很好的算法公司一做就能活20年,因为有着成熟完善的商业竞争环境和严格的知识产权制度,国内这方面就会差很多。要走中国特色商业化之路很难,但不妨碍我们把它做出来。现在我们做的工作是让商业化的环境变好,使得那些读完博再出来创业的同学有更好的环境。”

而engineering的能力,范浩强也希望能“迁移学习”到其他同学身上去,“旷视需要至少100个小强”。

而思考这些问题的,只是一位25岁的小哥哥,自带一种身为领袖人物的、与年龄不相符的责任感。

演脱口秀,吸别人的猫

除了工作的时候是个大神,范浩强的另一个人设则是段子手,自称“脱口秀演员里最会写代码的,码农里最会脱口秀的”。早年,旷视每一届年会范浩强都会上台表演脱口秀。

不过,常在河边走,总有会翻车的时候。有一年旷视人数暴增,台上的他愣是忘了词。

到了第二年年会,前来指导的专业演员看了之后,评价说:“看了你去年的录像,觉得很坚强。”

在专业演员的指导下,范浩强终于学会了如何镇得住过千人的大场面。

范浩强的另一个爱好则是猫。但因为害怕养死,他选择做一名“云吸猫”爱好者。

毕竟,范浩强自称“0~24点都可能在工作”,恐怕是没有时间铲屎的。

因此,他甚至连招聘都在想,可以优先招家里有猫的同学,这样可以方便的借机撸猫。

One More Thing

最后,范浩强给想要从事AI技术的年轻人一条忠告:

弄斧要去班门,做AI要去专业公司。

他曾经作为面试官向候选人提问如何完成一类产品,候选人反复论证,认为产品无法完成,因为需要的样本量太大。

但这类产品在旷视已经商业化了。有赖于旷视Data++的功劳,数据的标注和管理都不是问题。

“这个数量的样本,直接去Data++提需求啊”范浩强说,“当你没有见过一个以非常高的效率做AI的团队和公司体系的样子的时候,你是想象不到你能做到什么的。”

对于旷视而言,整个旷视研究院有多个像范浩强团队这样的研发大组,有众多集天分与努力于一身的技术人才,正是AI界的“班门”,最当“弄斧”于此。

而这一点,在任何领域都是适用的。


相关新闻