新闻中心

八〇后“超算导师”付昊桓:超算软件研发更需“愚公移山”精神

2020-06-03 | 李超 秦悦 | 来源 《中国青年报》2020年06月03日 |

这段时间,国家超级计算无锡中心副主任付昊桓一直关注着疫情药物的筛选。如果有合适的软件应用,将会对超级计算机筛选过程提供强大助力。

“超级计算机为解决工程和科学中的重大难题而生。”付昊桓说,超级计算机不只是比速度,更是比应用。

“神威·太湖之光”团队在国际范围的首次亮相,是2016年6月21日德国法兰克福的国际超算大会(ISC)上。

在付昊桓介绍系统技术细节的大会报告之后,数以千计的国际同行频繁穿梭于几平方米的神威展台,以至于会展结束时,展台的地毯都翘了起来。

“神威·太湖之光”虽荣登“全球超级计算机500强”榜首,但西方国家对中国“纯国产”超级计算机“神威”的威力还持怀疑态度。

半年后,在美国盐城湖举办的世界超算大会(SC)上,国际超算应用领域的最高奖“戈登贝尔奖”揭晓。当时,全球共计6个超算研究项目入选“戈登贝尔奖”提名,其中3个项目来自中国。付昊桓参与的“千万核可扩展大气动力学全隐式模拟”最终摘得桂冠。这是自1987年“戈登贝尔奖”设立以来,中国科研团队首次获奖。

第二年,付昊桓主持的两个项目——“非线性地震模拟”和“全球气候模式的高性能模拟”项目又入围了“戈登贝尔奖”,占当年入围项目的2/3。其中,“非线性地震模拟”再次获奖,蝉联“戈登贝尔奖”。

作为一名80后,付昊桓在本科、硕士、博士阶段攻读的都是计算机科学,在博士后阶段,他突然转向研究地球物理。后来,他回到清华大学地球系统科学系任教。

如此选择,源于他攻读博士学位期间与一位地球物理领域研究者的合作。他们的暑期研究项目虽然只进行了一两个月,但最终成果受到广泛关注,最后被来自意大利的石油公司应用到生产中。

交叉学科的魅力,一下子吸引了付昊桓。原本打算毕业后进入产业界的他再次选择科研。

“刚开始进行交叉学科研究有些痛苦,需要一段时间的磨合期。”他说,他学计算机专业,其他教师研究地球物理、气象气候等地球科学。起初,双方讲专业术语,互相都听不懂。“但时间久了,我们就能感受到学科之间的互相碰撞,产生了火花。”

“其实超级计算机本身就是一个跨学科平台。”付昊桓说,超级计算机是由各个不同科学领域的科学家用户用来解决“宇宙的起源”“黑洞的形成”“全球的气候变化”等超级问题的一个交叉平台:上层是用户和应用,中层是算法,下层是超算架构。

“这和跨学科、跨机构的研究团队是一样的,只有上下都贯穿起来,才能系统性地解决问题。”付昊桓将这种跨学科合作研究,概括为“和而不同”。“和,即合作的心态;不同,即不同的学科、不同的能力、不同的理解。不同学科的融合,才会自然产生更强的创新能力。”

2015年底,付昊桓被任命为国家超级计算无锡中心副主任。而他与“神威·太湖之光”的缘分早在当年夏天就已开始。

当时正值“神威·太湖之光”超级计算机研制与组装的关键时期,付昊桓带领来自清华大学和北京师范大学的20多名师生来到无锡,以用户的身份,基于正在建设中的“神威·太湖之光”进行全球气候模式软件的研发。

研发初期,超算中心的基础设施尚不完备,仅有的几台空调只能用来给机器降温,以保证机器的运行。他们每天都要在蒸笼一样的环境中,从早到晚地做程序开发和测试。无奈之下,他们买来10多个落地大电扇。尽管如此,每天结束工作,他们每个人都像洗了“汗水澡”,全身湿透。

基于“神威·太湖之光”这样世界领先的超算平台进行软件应用研发,对于付昊桓来说是个弥足珍贵的机会。特别是冲击“戈登贝尔奖”的项目中,有难得的机会用神威系统上千万的计算核心来进行突破性的探索和尝试。

为了争分夺秒地进行项目测试,付昊桓和其他成员都几乎开启了“7×24”的工作模式,大家交替休息,在有限的测试窗口保证计算任务持续运转。

更大的挑战则来自软件的生态。由于神威采用的是全国产的新型片上融合异构芯片,原有的基于x86架构设计的大量科学及工程计算软件,无法直接在神威上高效运行。

作为付昊桓在清华大学带的第一个博士生,甘霖说,正常的应用也就几千到几万行代码,而他们当时面对的地球系统模式代码是近百万行。这些是各国气候学家在过去几十年里积累下来的对大气、海洋、陆面、海冰等各个圈层变化机制的理解,每个人写代码的风格不同。为此,他们需要逐步进行代码的转换、移植乃至重新设计,最后为“神威·太湖之光”超级计算机所用,这是个“愚公移山”的过程。

从2015到现在,他们团队持续工作,该项目仍在不断更新。超算大会主席表示,他们所做的工作让人无法想象,这个工作如此繁重,他们却有如此的信心和耐心。

2017年,他们的应用精确模拟了2005年8月发生在美国的卡特里娜飓风,成为当年全球入围“戈登贝尔奖”的3个应用之一。

此后,他们进一步与国家气象局以及新能源企业展开深入合作,提供业务支持。付昊桓最大的心愿就是,在国产超算硬件的基础上,推动国产软件生态的可持续发展,服务更多的用户,解决更多的实际应用难题。


相关新闻

  • 132020.05

    “中国青年五四奖章”获得者付昊桓:做软件,让中国超算真正“跑”起来

    连续两次获得国际超算应用领域最高奖——“戈登•贝尔”奖,担任国家超级计算无锡中心副主任、清华大学地学系长聘教授,获得FPL国际会议25年来....

  • 242016.06

    清华运营的“神威•太湖之光”荣膺世界超算冠军

    6月20日,在德国法兰克福举行的国际超算大会发布超级计算机TOP500榜单,中国“神威·太湖之光”计算机系统首次亮相,一举夺冠。

  • 222021.02

    清华学生超算团队获国际大学生超级计算机竞赛SC20 总冠军

    清华学生超算团队获国际大学生超级计算机竞赛SC20 总冠军

  • 092018.03

    吴立新院士:中国超算:百亿亿次的卫冕考问

    “要尽快启动E级超算整机系统建设,距离2020年的建设目标只有两年多的时间了。”3月6日,全国人大代表、青岛海洋科学与技术国家实验室主任吴立新院士在接....

  • 102018.12

    廖湘科院士的超算梦

    廖湘科与“银河”结缘始于在清华大学读书时,在班主任的印象里,廖湘科属于那种不声不响、学习成绩好、有想法的学生。

  • 202018.07

    这位清华毕业的85后算法工程师,为“运动健身”编算法

    这两年,算法工程师这一行挺吃香。他们敲击着键盘,编写着代码,在各个新兴领域大显身手。而要说哪个最有前途,取决于他在为谁编写“算法”。

  • 162021.06

    我校1位教师8位校友当选2020年度国际计算机学会杰出科学家

    12月16日,国际计算机协会(ACM)公布了2020年度杰出科学家名单,全球共有64名杰出计算机科学家获此殊荣,我校1位教师8位校友榜上有名。他们是:我校计算机系副教授崔鹏(2005级博,计算机),研究兴趣包括大数据环境下的因果推理与稳定预测、网络表征学习等。加拿大圣弗朗西斯泽维尔大学教授杨天若(1987级计算机),研究范围包括并行和分布式计算、嵌入式和普适性计算。加拿大麦吉尔大学教授刘学(1992级数学;1996级硕,自动化),研究领域包括人工智能/机器学习理论及其应用、大数据、互联网和云计算等。美国天普大学教授王昱(1993级本、1998级硕,计算机),研究兴趣包括无线网络、智能感知、移动计算与算法设计等。通用汽车全球研发中心高级研究员白帆(1994级自动化),研究领域包括车载网络与移动建模等。香港城市大学教授陈名华(1994级本、1999级硕,电子),研究兴趣包括在线优化和算法、能源系统(如智能电网和节能数据中心)、智能交通系统等。IBM Almaden研究中心首席研究员李蕴瑶(1995级自动化),主要从事自然语言处理、数据库、人机交互等相关的跨学科领域研究。美国伊利诺伊大学香槟分校副教授童行行(1998级本、2002级硕,自动化),研究领域包括大规模数据挖掘和机器学习(尤其是图形和多媒体数据)等。澳大利亚纽卡斯尔大学副教授张洪宇(2006—2014教,软件学院),研究领域是通过利用从软件数据中挖掘的知识来提高软件质量和生产率。

  • 152023.05

    大师梁启超

    如果您无法在线浏览此 PDF 文件,则可以下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览 或下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览 或下载此 PDF 文

  • 072020.12

    全国劳模李双双:不断攻克超声成像研发难题

    从普通工程师到广东省高级工程师,再到地方级领军人才和杰出工程师,10多年来,李双双带领团队主导弹性成像等多项超声前沿技术的研发,申请国内外专利74项,完成荣获市、省、国家科技奖“大满贯”,为我国医疗事业作出重大贡献,成为广大劳动群众和科技工作者的优秀代表。

  • 102021.09

    “超级学霸”陆品燕:打造全球华人理论计算机学者的共同家园

    上海财经大学陆品燕教授与他“全球化”的科研团队,用五年时间组建了一流的理论计算机科学研究中心(ITCS),培养了大量国际化人才。陆品燕本人也拿到华人数学领域的最高荣誉,2019年摘获被誉为"华人菲尔兹奖"的ICCM数学奖银奖。他担任五个重要国际学术会议的程序委员会主席,在国际学术界代表中国科学家发出声音。“积土成山,风雨兴焉;积水成渊,蛟龙生焉。现在,世界和中国又逢百年未有...