百年清华

清华听障博士用AI赋能信息无障碍

2019-05-30 | 陈璐 | 来源 《中国青年报》2019年05月28日 |

姚登峰,男,湖北天门人,1979年11月生,现任北京联合大学副教授、硕士生导师。2002 年毕业于湖北民族学院计算机科学与技术专业获学士学位,2006 年毕业于北京大学软件工程专业获硕士学位,2016年毕业于清华大学语言学及应用语言学专业获博士学位。

姚登峰(2012级博,中文系)

姚登峰是一位听障人士,但他在逆境中不断地创造传奇,获得了北京大学硕士、清华大学博士学位,现在是北京联合大学的副教授、硕士生导师。去年12月,他和另外两位清华博士一起创业。

他来自湖北天门,1岁时双耳失聪,却以优异成绩完成各阶段学业。作为全球首位人工智能聋人博士,姚登峰的博士课题是手语认知与计算,致力解决聋人与健全人的信息沟通问题。在李德毅院士的点拨下,姚登峰团队将手语计算研究扩展到行为语言计算研究,即理解全人类的行为语言。为了将最新科技成果转化为科技产品,他创业成立行语科技,成为一家行为语言整体解决方案的提供商,公司自主研发的行为语言计算技术,在理解除了语音语言之外的整个人类多样化行为方面,居于世界领先水平。

5月25日,在清华大学校长杯创新挑战赛中,行语科技脱颖而出,获得由众多顶级投资人和专家评出的企业创新奖。

面对坎坷“生气不如争气”

姚登峰从小就以残疾身体奔跑在人生马拉松赛场。他1岁时因为感冒发烧导致听力极重度损失,从此坠入了一片静寂的无声世界。

当时医生的判断是训练没有效果,但他的母亲没有放弃,日复一日对他进行听语康复训练。没有助听器,母亲就在他耳边大声“喊话”,彼此摸着对方的喉咙感觉声音的震动来发音,渐渐登峰学会说话和交流。上学后,他无法听到老师讲课的完整信息,自己就通过大量的阅读和自学来弥补,以顽强的毅力克服了求学中的种种困难和阻碍,他的成绩可以考入重点大学,却因耳聋被拒录,几经周折被录取到一所二本大学。

“生气不如争气!”姚登峰面对挫折激发斗志,更加努力证明自己不比健全人差。2003年他通过全国统考,以专业第一名的成绩考上了北大研究生,并以全优的成绩毕业。也正是在北大读研期间,他第一次接触到信息无障碍。“大部分人认为信息障碍只存在于残障人士之间,其实健全人也会有老的时候,也会有听不到声音、看不到东西的时候,也会有特殊场景下遇到信息障碍的时候。信息无障碍是全人类的事情”。

他在信息无障碍领域做了大量开创性的工作,也发现了手语背后计算领域的一片空白地带,为此他2012年考入清华大学在职攻读博士学位,希望用手语认知和计算技术,让有声世界的口语族与无声世界的手语族能够自由沟通。

在清华读博期间,在数以万计的代码编写和实验论证之后,2016年姚登峰团队在国际上首次提出手语计算的认知架构,一举解决了手语计算困扰多年的底层像素特征与逻辑语义输出的断层,汇合手势分词实验的数据宝库,手语计算的理论、技术与认知支撑首次形成了完整闭环。

身穿学位服的姚登峰在清华大学校园

担任中国人工智能学会理事长、北京联合大学机器人学院院长的李德毅院士,有一次点拨姚登峰:在自然语言交流效果中,有声语言占7%,语音音调占38%,面部表情、肢体语言及手势等行为语言占55%。过去30年来AI只关注占比45%的讲话内容的理解,但对于占比55%的表情、手势、肢体等行为语言并未关注。

姚登峰博士毕业后在手语计算的基础上,开始尝试破解行为语言的深层奥秘,由于两者本身在面部、手势、肢体的聚合感知上架构相通,再加上团队伙伴不懈地探索和研究,仅仅两年便在这一领域取得了突破性进展,2017年姚登峰被推荐为北京市卓越青年科学家。

调研发现各行各业都有行为语言计算需求

行为语言是从运算智能到达感知智能、认知智能重要的途径,基于动态影像的行为识别是AI的最前沿领域,全球科技巨头都在积极寻找刚需解决方案。

阿布都克力木、哈里旦木两位博士和姚登峰是从事小语种计算研究的清华同学,他们常常在一起讨论前沿科技,在一次次探讨中敏锐地认识到,如果对人类行为语言进行全方位无感识别与计算输出,机器智能便能理解各种行为语义并做出善解人意的反馈。这将是由传统运算智能上升至感知智能和认知智能的重要核心,并可以延伸出更多跨行业有价值的产品和服务。

2018年,姚登峰团队在湖北进行了智能领域的无人驾驶无感识别的实验,通过一周的数据采集,该技术在0~100米范围内可以准确在人群中识别出交警,识别率达到95%;在识别交警准确的8套手势时,识别率达到90%。这证明该技术已达商用标准,他们顺利拿到了国家知识产权证书。

一次,姚登峰与创业伙伴做市场调研,在一所监狱考察时发现其引入了最先进的监控系统,仅一个监控室安装了几十个显示器,对应500个房间外加各类场所通道。但负责这500个房间的状况监控的干警,每天轮班连续看显示器,人极度疲劳,监控效果也很难面面俱到。

如果有了行为语言智慧监控系统,就可以通过人工智能自动发现是否有违规行为,能够及时把违规动作等截图上传到监控室,让就近狱警及时干预,提高管理运行效率和安全防范水平。

团队在市场调查中得知很多场景、场合都需要应用行为语言计算,比如在照顾老人时,识别出老人是否摔倒;在跑步、游泳等体育运动时,识别动作是否标准;在炼油厂等敏感区域,识别出抽烟、没有戴安全帽等不安全行为……各行业的需求对接让团队意识到行为语言计算技术确实可以帮助很多人,使大家增添了开发贴近市场需求产品的紧迫感。

国内团队多在语音识别、图像识别、可穿戴设备识别方面下功夫,但是在行为语言计算方向上,姚登峰认为,未来世界行为语言计算是不需要任何设备的,识别是无感的,希望用超前的无感识别技术改变人类的生活,让技术尽快转化为应用产品。

在接受中国青年报·中青在线专访时,尽管姚登峰能听懂提问,但他还是打开手机语音识别软件,用标准普通话流畅地回答每一个问题。

姚登峰明白,创业是对一个人综合实力的考验,生活节奏“不断在加快加快再加快”,也不断地解决一个又一个难题。

行语科技在创办3个月后,国际某工业巨头主动寻求行语科技投资控股且计划在后续B、C轮融资时引入顶级平台资源。但因随后而来的经济危机搁浅了该计划。

紧接着,行语科技在部署炼油厂监控系统时,发现单体技术跟理想应用还存在着不少距离,很多场景应用不光是行为识别的问题,还需要结合图像识别的技术,比如抽烟动作最好结合识别香烟形状。这涉及底层技术架构的调整,否则就很难通过客户严苛的测试,此时研发主力程序员又因出国被迫退出。困难一个接一个,只能靠创始成员自己顶上,加班加点完成任务。

据了解,目前行语科技的团队有10多人,已与国内一线科创平台签署战略合作,落地智慧监狱和工业场景,同时在南京、杭州等地都有项目落地。


相关新闻

  • 032022.08

    90后清华博士为AI“杀毒”,砌起安全墙

    成立3年,融资4轮,金额总计数亿元,专攻算法攻防、隐私计算、深伪检测,为AI“杀毒”。掌管着这家估值数十亿人民币AI初创企业的,是个典型理工科气质的90后清华AI博士。90后西安人田天(2009级计算机)从小痴迷计算机,凭借高中物理竞赛全国金奖保送清华计算机系,一路念到博士,2018年7月出了校门就加入浩浩荡荡的创业大军,做“真正的AI”。他创办的北京瑞莱智慧科技有限公司要做第三代人工智能,为AI安全发展保驾护航。瑞莱...

  • 012019.07

    2019全球AI文创大赛正式启动,AI科技赋能新文创

    6月25日下午,2019全球AI文创大赛(GAAC)在清华大学举行启动仪式。清华大学校务委员会副主任、清华校友总会副会长、2019全球AI文创大赛组委....

  • 182020.08

    清华学子休学创业,用AI黑科技拯救餐桌浪费:获近千万融资

    “以科技创新、让AI助力,是我们这一代青年科技人为解决食物浪费问题提供的解决思路。”柳济琛这样介绍他的“光盘打卡”项目。

  • 112021.03

    清华校友总会AI大数据专业委员会

    清华校友总会AI大数据专业委员会一、基本介绍清华校友总会AI大数据专业委员会,以下简称“专委会”,是在清华校友总会指导下,由从事AI大数据产业链条上相关行业的清华校友自愿组成的非营利性组织。专委会为非独立法人,由清华校友总会统一管理。专委会秉承清华大学“自强不息、厚德载物”的校训,“行胜于言”的校风,以“开放包容,平等互助,协同创新,振业兴邦”为宗旨;坚持团结校友力量,聚焦行业前沿,助推行业发展,以构...

  • 022020.11

    让人文为科技赋能,用科技点亮人文之光|2020清华文创论坛成功举办

    10月31日,2020清华文创论坛在清华大学成功举办。本届论坛以“文化科技融合与当代文创发展”为主题,聚焦文化科技融合的前沿进展与未来趋势,邀请国内外....

  • 142023.01

    90后清华博士的内蒙古印象:海阔凭鱼跃 天高任鸟飞

    展长振是北京人,清华大学读博期间一直从事新型碳材料在储能领域的应用研究,很希望有一天自己研究成果能够生根发芽,实现产业化落地。经过恩师康飞宇的推荐,博士毕业后来到了内蒙古石墨(烯)新材料创新中心任创新中心总经理。“选择材料专业,是兴趣使然,感觉材料专业是最贯穿科学与生活的学科,能够贯穿世界的微观结构与宏观性能。”

  • 262022.10

    杨元辰:从清华到IMF,清华五道口助我走上国际舞台

    杨元辰,清华大学外文系学士,清华大学五道口金融学院2014级金融硕士、2016级金融学博士,目前在国际货币基金组织担任经济学家。

  • 292022.04

    旷视,AI 让世界更美好

    如果您无法在线浏览此 PDF 文件,则可以下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览 或下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览 或下载此 PDF 文

  • 222021.09

    “清华人”小程序

    “清华人”微信小程序是清华校友总会推出的面向校友的移动端应用,于2019年6月上线,截至2022年9底,已有12万余名校友完成校友身份认证。“清华人”小程序现可为在清华大学接受过全日制普通高等教育的学历学位校友及出站博士后校友提供下列专属服务:u校友身份认证u电子校友卡申领u校友及校友组织信息检索及联络u活动报名(校友活动中心)u信息上传及发布(校友资讯中心)u回馈母校u校友邮箱自助服务u校友期刊订阅u校庆报到u校...

  • 092021.10

    黄鼎隆:AI赋能产业经济 建设“人工智能大湾区”

    黄鼎隆,1981 年生,籍贯广东河源。1984 年随父母来到深圳,曾就读于中英街幼儿园、沙头角小学、深圳中学,1999 年考上清华大学,2003 年保送攻读清华大学人机交互与人因工程博士研究生,师从美国工程院院士 Gavriel Salvendy 教授,发表国际著作和学术论文十多篇,中美发明专利二十余项。曾就职于谷歌、微软、腾讯和 TripAdvisor,2014 年创办深圳码隆科技有限公司,同年获得深创赛冠军。2016 年当选深圳“十大创客”之首;201...