百年清华

廖湘科院士的超算梦

2018-12-10 | 文字/顾莹 刘于蓝 图片/何书远 胡骏 | 来源 微信公号“国防科大” |

他,是“天河一号”超级计算机项目总指挥、常务副总设计师,“天河二号”超级计算机项目总指挥、总设计师。他,曾荣获国家科技进步奖、军队科技奖、中国青年科技奖等多项奖励。 2015年,他被增选为中国工程院院士。为了实现中国超算梦,35年来,他孜孜不倦、开拓创新。他与团队的努力,让天河之光更加灿烂。

他,就是国防科大计算机学院院长廖湘科院士。

7月22日,由国防科大牵头研制的“天河三号E级原型机系统”在国家超级计算天津中心部署完成并顺利通过该项目课题验收,将逐步进入开放应用阶段,这标志着我国高性能计算已开始向百亿亿次级的“E级”超算迈进。

从天津赶回来的廖湘科不顾旅途劳累,一回到学校便直奔工程例会现场,对他来讲,摘取超级计算机的下一顶“皇冠”是一项时不我待、只争朝夕的任务。天河一号、天河二号正是在他分秒必争、从容不迫的指挥下,一次又一次问鼎世界超算最高峰。

“我就是冲着‘银河’去的”

廖湘科与“银河”结缘始于在清华大学读书时,在班主任的印象里,廖湘科属于那种不声不响、学习成绩好、有想法的学生。

1983年下半年,廖湘科正在读大三,我国首台“银河”亿次超级计算机在国防科技大学诞生,中国成为继美国、日本等国之后,能够独立设计和制造超级计算机的国家。这一消息让廖湘科兴奋不已,他和几位同学决定南下长沙,去亲眼看一看创造了历史的机器是什么样子。到达长沙后,他们受到国防科技大学计算机系几位专家的热情接待,在大开眼界的同时,廖湘科更坚定了自己的专业选择,“一定要像这群银河人一样,打破国外的技术封锁,改变我国在技术领域的落后局面!”

本科毕业后廖湘科报考国防科技大学攻读硕士研究生,用他的自己的话说:“我就是冲着‘银河’去的!”从“银河II”起,廖湘科就与巨型机一起成长,参与了后续各代机器的全部研制过程,从一个普通的程序员一步步成长为今天巨型机事业的总指挥。

“没有最快,只有更快”

投身巨型机事业之后,廖湘科一遍遍研读相关技术资料,不断熟悉巨型机软硬件的基本结构和工作原理,积累了几十万字的学习资料。善于思考和认真负责的廖湘科在项目中经常扮演出谋划策的“师傅”角色,同事们有什么解决不了的问题都会第一时间去找“廖师傅”,久而久之“廖师傅”就成了他的代号,一声“廖师傅”饱含了同事们对他的敬重和信任。

在“天河一号”系统的研制中,廖湘科作为副总设计师,协助制定系统的总体技术方案、技术路线和设计指导原则,并具体负责组织和实施,其责任和难度可想而知。廖湘科瞄准国际前沿技术,大量收集查阅资料,那段时间,他整天泡在机房里,经常是早晨第一个来,晚上最后一个离开,机房俨然成为他的第二个家,廖湘科打趣道:“对我来说工作就像玩游戏,是会上瘾的”。

经过反复试验,廖湘科提出了当时国际领先的虚拟化网络计算支撑技术和多层次的大规模系统RAS技术方案,有效提高了系统的易用性和可靠性,实现了我国自主研制超级计算机能力从百万亿次到千万亿次的跨越。2010年11月,国际TOP500组织认定“天河一号”超级计算机系统排名世界第一,使我国一举超越美国,成为拥有世界最快超级计算机的国家。

短暂的喜悦过后,廖湘科又开始了紧张的工作,他早已将目标瞄准了运算速度更快的亿亿次超级计算机系统——天河二号。他说:“从银河到天河,三十年的经验告诉我们,在超算这个领域,没有最快,只有更快,我们没有‘歇口气’的时间”。

在研制过程中,遭遇了一个制约瓶颈——各中央处理器之间协同计算效率低,廖湘科创新性地提出了使用新的编程模型和通信协议等方法,解决了这一国际难题。这个研究成果,取得Linpack测试和HPCG测试均排名世界第一的成就,还获得了国家科技进步特等奖。2013年6月起,天河二号连续6次摘取世界超算桂冠,标志着我国超级计算机研制达到世界领先水平,习主席专门对天河二号研制成功作出重要批示。

比运算速度更重要的是超级计算机的应用。廖湘科瞄准了国家创新驱动发展和军民融合发展的战略机遇,充分发挥超级计算对其他学科的支撑作用,抢先布局国家超级计算中心,天河一号、天河二号作为中心主机先后部署于天津、长沙、广州超算中心。天津超算中心建成伊始,应用推广并不顺利,廖湘科既当“总指挥”,又当“推销员”,主动与用户沟通,帮助用户快速理解应用模式,建立用户所需的应用运行环境。到目前为止,天河超级计算机已经为国内外1000多家用户提供高性能计算和云计算服务。

“攻克核心关键技术离不开创新”

对于计算机基础软件,有人曾做出这样的比喻:如果把计算机硬件比作一个人的躯干,那么基础软件就是人的思想。基础软件的主要作用是管理、调度和控制计算机上的各种资源,为各类应用软件提供开发、部署、管理环境,尤其是操作系统,它是计算机系统中的核心软件。操作系统核心技术长期被国外垄断,长此以往,必将导致我国信息产业发展的被动局面,且存在严重的安全隐患。廖湘科为此深感焦虑:“只有自己掌握核心关键技术才能不受制于人,而攻克核心关键技术离不开创新。”

2002年,国家设立“863”软件重大专项,明确把操作系统作为软件重大专项的主要研究方向,并把麒麟操作系统作为重点,由廖湘科担任“银河麒麟”操作系统的总设计师。廖湘科带领团队决定采用基于FreeBSD和Linux开源操作系统进行军用增强的技术路线,由此开始了十多年的持续攻关,提出了基于可扩展密码服务框架的三态安全操作系统结构等方案,研制出国内安全等级最高的麒麟操作系统,打破国外B级以上安全操作系统技术的严格封锁,成为我军唯一选型的军用通用操作系统,成功应用于航天测发控、电网调度等关键领域。

“我们要充分发挥超级计算对整个IT产业的辐射带动作用!”廖湘科似乎总是喜欢盯着远处看。在他的谋篇布局下,计算机学院逐步形成了覆盖信息技术重要领域的高性能计算、自主可控信息系统核心支撑、信息安全与网络战和新兴交叉学科等4个技术群,产生银河/天河超级计算机、飞腾CPU/DSP、银河玉衡路由器和麒麟操作系统等为代表的科研成果,在国家和军队网络信息体系建设和各类武器装备研制中得到规模化应用,实现国家军队信息系统关键领域的核心器件国产化替代,成为国家信息安全和军队武器装备自主可控建设的重要基石。

“我们要站得更高、走得更远”

2009年4月担任计算机学院院长后,廖湘科深感责任重大,他一边心系工程攻关,一边为学院的发展建设殚精竭虑。他还力所能及地解决大家的实际困难,保证每位同志全身心地投入工作。而他自己的爱人却只是计算机工厂的普通职工,从来没得到过“特殊关照”。

日常行政公务本就繁忙,为了保证项目质量和工程进度,廖湘科常常加班熬夜,长期高强度的工作使他的身体健康“屡亮红灯”,但他却无暇顾及,连鼻腔内部出现问题都全然不知,直到已经严重影响呼吸,才到医院检查并进行手术。手术过后,医生郑重嘱咐他要注意休息不能奔波劳累,但为了项目进度,廖湘科刚出院便坚持乘坐飞机赶往外地的实验现场,结果一下飞机鼻子就流血不止,被送往当地医院急救。在经过简单的处理后,他又毅然投入到了紧张的实验测试过程中,确保了实验项目的顺利进行。

国防科大学子为天河制作的图片

对于廖湘科来说,登顶巅峰并不是创新的休止符,他曾说:“在研制‘银河-天河’系列巨型机时,我们并没有把十八般武艺都用上,我们的技术路线还有很大的发展空间,我们的队伍还有很大的创新潜力,我们一定要,也一定能站得更高、走得更远!”


相关新闻

  • 072018.05

    清华湖南校友庆祝母校建校107周年

    4月22日,“清华正芳华”湖南清华校友校庆活动在长沙•碧桂园凤凰酒店成功举办。来自长沙校友会、株洲校友会、湘潭校友会、湖南EMBA同学会的....

  • 262025.02

    “写进”《围城》的数学系主任

    1929年夏,钱锺书从无锡辅仁中学高中毕业,报考清华大学,国文和英文成绩特优,而数学只考了15分。数学无疑是对钱锺书最不友好的学科,那么钱锺书对数学以及数学家的态度又是如何呢?笔者从两部传记中,还真找到了曾与钱先生共事过的一位数学家……一孔庆茂在《钱锺书传》(江苏文艺出版社)和《钱锺书与杨绛》(凤凰出版社)各有一段几乎完全相同的文字:钱锺书在“国师”时,当时全校都有外语和第二外语课,按学校规定,这些...

  • 252009.05
  • 052012.11

    简讯目录1~29期(文纪俊整理)

    筹备西南联合大学北京校友会情况汇报 欢庆西南联大北京校友会成立 西南联合大学北京校友会第一届理事会理事名单及情况简介 第一届理事会第一次....

  • 182018.09

    廖湘科院士在计算机系建系60周年纪念大会上的发言

    回顾五年清华计算机系的学习经历和离开清华三十多年的工作历程,还是有许多感悟和大家分享。

  • 152023.02

    中国工程院院士廖湘科:加快推进AI规模化应用,尽早确立优势

    “人工智能技术的蓬勃发展为我国的数字化和智能化产业带来了前所未有的机遇,但在发展过程中也要注意推动AI技术与各行业的融合、创新等一些问题,尽早确立我国人工智能的整体性竞争优势。”在近日举行的2023北京人工智能产业创新发展大会上,中国工程院院士廖湘科(1980级计算机)为我国人工智能产业的发展提出了一些建议。大会现场廖湘科称,要鼓励和支持科研院所、龙头企业投入发展自主创新的芯片、开发框架等,有序建设国家...

  • 092018.03

    吴立新院士:中国超算:百亿亿次的卫冕考问

    “要尽快启动E级超算整机系统建设,距离2020年的建设目标只有两年多的时间了。”3月6日,全国人大代表、青岛海洋科学与技术国家实验室主任吴立新院士在接....

  • 302018.08

    廖湘科:壮美“天河”,守卫祖国 ——清华人的责任与担当

    正如清华计算机系一贯的传统,踏实做事,谦虚做人,廖湘科在这基础上更彰显着爱国的红和军中的绿。用学到的知识稳固国防,保卫壮美山河,是他一生的事业。

  • 162008.06

    姚期智院士科学大讲坛演讲“计算机科学在中国”

    【新闻中心讯】6月9日,世界著名计算机科学家、图灵奖获得者、清华大学教授姚期智院士在云南昆明西南联大70周年科学大讲坛上,发表了“计算机科学在中国”的主题演讲。

  • 132022.09

    计算机系举行李三立院士追思会

    2022年9月9日,在教师节来临之际,清华大学计算机系以线上线下相结合的方式举办了“李三立院士追思会”,深切缅怀李三立同志对我国计算机体系结构领域科研与高等教育事业做出的重要贡献,弘扬李三立同志严谨治学的精神。来自中国工程院、中国计算机学...