百年清华

廖湘科院士的超算梦

2018-12-10 | 文字/顾莹 刘于蓝 图片/何书远 胡骏 | 来源 微信公号“国防科大” |

他,是“天河一号”超级计算机项目总指挥、常务副总设计师,“天河二号”超级计算机项目总指挥、总设计师。他,曾荣获国家科技进步奖、军队科技奖、中国青年科技奖等多项奖励。 2015年,他被增选为中国工程院院士。为了实现中国超算梦,35年来,他孜孜不倦、开拓创新。他与团队的努力,让天河之光更加灿烂。

他,就是国防科大计算机学院院长廖湘科院士。

7月22日,由国防科大牵头研制的“天河三号E级原型机系统”在国家超级计算天津中心部署完成并顺利通过该项目课题验收,将逐步进入开放应用阶段,这标志着我国高性能计算已开始向百亿亿次级的“E级”超算迈进。

从天津赶回来的廖湘科不顾旅途劳累,一回到学校便直奔工程例会现场,对他来讲,摘取超级计算机的下一顶“皇冠”是一项时不我待、只争朝夕的任务。天河一号、天河二号正是在他分秒必争、从容不迫的指挥下,一次又一次问鼎世界超算最高峰。

“我就是冲着‘银河’去的”

廖湘科与“银河”结缘始于在清华大学读书时,在班主任的印象里,廖湘科属于那种不声不响、学习成绩好、有想法的学生。

1983年下半年,廖湘科正在读大三,我国首台“银河”亿次超级计算机在国防科技大学诞生,中国成为继美国、日本等国之后,能够独立设计和制造超级计算机的国家。这一消息让廖湘科兴奋不已,他和几位同学决定南下长沙,去亲眼看一看创造了历史的机器是什么样子。到达长沙后,他们受到国防科技大学计算机系几位专家的热情接待,在大开眼界的同时,廖湘科更坚定了自己的专业选择,“一定要像这群银河人一样,打破国外的技术封锁,改变我国在技术领域的落后局面!”

本科毕业后廖湘科报考国防科技大学攻读硕士研究生,用他的自己的话说:“我就是冲着‘银河’去的!”从“银河II”起,廖湘科就与巨型机一起成长,参与了后续各代机器的全部研制过程,从一个普通的程序员一步步成长为今天巨型机事业的总指挥。

“没有最快,只有更快”

投身巨型机事业之后,廖湘科一遍遍研读相关技术资料,不断熟悉巨型机软硬件的基本结构和工作原理,积累了几十万字的学习资料。善于思考和认真负责的廖湘科在项目中经常扮演出谋划策的“师傅”角色,同事们有什么解决不了的问题都会第一时间去找“廖师傅”,久而久之“廖师傅”就成了他的代号,一声“廖师傅”饱含了同事们对他的敬重和信任。

在“天河一号”系统的研制中,廖湘科作为副总设计师,协助制定系统的总体技术方案、技术路线和设计指导原则,并具体负责组织和实施,其责任和难度可想而知。廖湘科瞄准国际前沿技术,大量收集查阅资料,那段时间,他整天泡在机房里,经常是早晨第一个来,晚上最后一个离开,机房俨然成为他的第二个家,廖湘科打趣道:“对我来说工作就像玩游戏,是会上瘾的”。

经过反复试验,廖湘科提出了当时国际领先的虚拟化网络计算支撑技术和多层次的大规模系统RAS技术方案,有效提高了系统的易用性和可靠性,实现了我国自主研制超级计算机能力从百万亿次到千万亿次的跨越。2010年11月,国际TOP500组织认定“天河一号”超级计算机系统排名世界第一,使我国一举超越美国,成为拥有世界最快超级计算机的国家。

短暂的喜悦过后,廖湘科又开始了紧张的工作,他早已将目标瞄准了运算速度更快的亿亿次超级计算机系统——天河二号。他说:“从银河到天河,三十年的经验告诉我们,在超算这个领域,没有最快,只有更快,我们没有‘歇口气’的时间”。

在研制过程中,遭遇了一个制约瓶颈——各中央处理器之间协同计算效率低,廖湘科创新性地提出了使用新的编程模型和通信协议等方法,解决了这一国际难题。这个研究成果,取得Linpack测试和HPCG测试均排名世界第一的成就,还获得了国家科技进步特等奖。2013年6月起,天河二号连续6次摘取世界超算桂冠,标志着我国超级计算机研制达到世界领先水平,习主席专门对天河二号研制成功作出重要批示。

比运算速度更重要的是超级计算机的应用。廖湘科瞄准了国家创新驱动发展和军民融合发展的战略机遇,充分发挥超级计算对其他学科的支撑作用,抢先布局国家超级计算中心,天河一号、天河二号作为中心主机先后部署于天津、长沙、广州超算中心。天津超算中心建成伊始,应用推广并不顺利,廖湘科既当“总指挥”,又当“推销员”,主动与用户沟通,帮助用户快速理解应用模式,建立用户所需的应用运行环境。到目前为止,天河超级计算机已经为国内外1000多家用户提供高性能计算和云计算服务。

“攻克核心关键技术离不开创新”

对于计算机基础软件,有人曾做出这样的比喻:如果把计算机硬件比作一个人的躯干,那么基础软件就是人的思想。基础软件的主要作用是管理、调度和控制计算机上的各种资源,为各类应用软件提供开发、部署、管理环境,尤其是操作系统,它是计算机系统中的核心软件。操作系统核心技术长期被国外垄断,长此以往,必将导致我国信息产业发展的被动局面,且存在严重的安全隐患。廖湘科为此深感焦虑:“只有自己掌握核心关键技术才能不受制于人,而攻克核心关键技术离不开创新。”

2002年,国家设立“863”软件重大专项,明确把操作系统作为软件重大专项的主要研究方向,并把麒麟操作系统作为重点,由廖湘科担任“银河麒麟”操作系统的总设计师。廖湘科带领团队决定采用基于FreeBSD和Linux开源操作系统进行军用增强的技术路线,由此开始了十多年的持续攻关,提出了基于可扩展密码服务框架的三态安全操作系统结构等方案,研制出国内安全等级最高的麒麟操作系统,打破国外B级以上安全操作系统技术的严格封锁,成为我军唯一选型的军用通用操作系统,成功应用于航天测发控、电网调度等关键领域。

“我们要充分发挥超级计算对整个IT产业的辐射带动作用!”廖湘科似乎总是喜欢盯着远处看。在他的谋篇布局下,计算机学院逐步形成了覆盖信息技术重要领域的高性能计算、自主可控信息系统核心支撑、信息安全与网络战和新兴交叉学科等4个技术群,产生银河/天河超级计算机、飞腾CPU/DSP、银河玉衡路由器和麒麟操作系统等为代表的科研成果,在国家和军队网络信息体系建设和各类武器装备研制中得到规模化应用,实现国家军队信息系统关键领域的核心器件国产化替代,成为国家信息安全和军队武器装备自主可控建设的重要基石。

“我们要站得更高、走得更远”

2009年4月担任计算机学院院长后,廖湘科深感责任重大,他一边心系工程攻关,一边为学院的发展建设殚精竭虑。他还力所能及地解决大家的实际困难,保证每位同志全身心地投入工作。而他自己的爱人却只是计算机工厂的普通职工,从来没得到过“特殊关照”。

日常行政公务本就繁忙,为了保证项目质量和工程进度,廖湘科常常加班熬夜,长期高强度的工作使他的身体健康“屡亮红灯”,但他却无暇顾及,连鼻腔内部出现问题都全然不知,直到已经严重影响呼吸,才到医院检查并进行手术。手术过后,医生郑重嘱咐他要注意休息不能奔波劳累,但为了项目进度,廖湘科刚出院便坚持乘坐飞机赶往外地的实验现场,结果一下飞机鼻子就流血不止,被送往当地医院急救。在经过简单的处理后,他又毅然投入到了紧张的实验测试过程中,确保了实验项目的顺利进行。

国防科大学子为天河制作的图片

对于廖湘科来说,登顶巅峰并不是创新的休止符,他曾说:“在研制‘银河-天河’系列巨型机时,我们并没有把十八般武艺都用上,我们的技术路线还有很大的发展空间,我们的队伍还有很大的创新潜力,我们一定要,也一定能站得更高、走得更远!”


相关新闻