新闻中心

金怡濂:漫谈高性能计算机

2008-03-19 |

  计算机的出现一开始是计算弹道需要 提高运算速度是计算机发展中的永恒主题——

  2002,日本高性能计算机运行速度首次超过美国,这件事情在美国科技界产生了很大的影响,可以说无异于了晴天霹雳!

  高性能计算机一开始是为了计算弹道需要

  首先说说什么叫高性能计算机?我们这里所讲的高性能计算机,现在也称为超级计算机,或者叫巨型机,是指一个时期之内运算速度最快、性能最高的计算机,就是追求速度。

  应该说,提高计算机的运算速度是计算机发展中的永恒主题。第一台大型计算机开始就是要速度,因为当时计算弹道,人工算或者用手摇计算机来算来不及,跟不上战争的需要,所以就搞了计算机,一直到现在,仍然觉得计算机的速度还不够快。

  高性能计算机的研制能力和拥有量是国家综合实力的重要体现。1996年美国造成一台每秒钟运行1万亿次的计算机,当时居世界第一位,从此以后,美国人的计算机一直处于世界第一位。到了2002年日本造了一台机器,叫做地球模拟器,它的性能大大超过当时世界第一名的美国的白色选择

  美国“白色选择”每秒钟12.3万亿次,地球模拟器运行速度达到每秒钟40万亿次,比美国这台机器高了3倍还要多,这件事情在美国科技界产生了很大的影响,可以说是产生了晴天霹雳!美国在检讨问题之后认为,高性能计算机事关国家未来的命运。于是,政府机构、国会制订了一系列计划,要发展超级计算机的开发计划,这些计划催生了多台世界顶级计算机,其中有一台叫蓝色基因”,2004年底完成的,运算速度可达每秒280.6万亿次。这台机器完成了以后,美国重新夺回了世界第一的位置,居世界第一位保持至今。这些说明美国对超级计算机是非常重视,日本一超过,他马上要追赶。

  所谓风洞要做很大一桶子,鼓很强的风,模拟天空的气流,然后做一个飞机或者做飞机的翅膀放在里面,测量各个点的各种参数。现在,很多风洞实验而是拿计算机进行数值风洞模拟。

  国庆50周年阅兵天气预报要求精确到天安门地区

  计算机模拟已经成为理论和实践之外第三大科学研究方法,高科技领域科学和工程计算,离不开高性能计算机。

  下面就举些例子,首先讲天气预报,现在天气预报大部分数值化,叫数值天气预报。气象预报除了报道气象要准确,报的下雨就下雨,报的刮风就要刮风之外,还要求地理的精确度。你比如说1999年国庆50周年,北京9月份的天气变化很大,雨下得很多,阴雨连绵,一直到101号的凌晨还在下雨,中央非常非常担心,因为50周年大庆要阅兵,还有群众游行,还有很多外宾都到天安门广场的观礼台站着,下起雨来不得了。所以,当时的天气预报地理位置限制在天安门地区,还有几个机场,至于西三环下不下雨,外围下不下雨,我不管,就是这个地理精确度要比较高。当时国家气象中心用计算机做了很准确的预报:国庆活动开始的时候,天安门地区天空放晴,包括我们的飞机在天上的表演,都很成功地完成。

  航空航天领域,你比如说现在有数值风洞模拟。大家都知道,做飞机的物理实验靠风洞,所谓风洞要做很大一桶子,鼓很强的风,模拟天空的气流,然后做一个飞机或者做飞机的翅膀放在里面,测量各个点的各种参数,这就是做风洞实验。这样做很复杂的,代价也是很大的。现在,很多风洞实验不是在风洞里做,而是拿计算机进行数值风洞模拟。

  还有药物研究和设计,大概一个药要真正做成要用10年时间到12年时间,据美国人统计,做一种药需要3.5亿美元,现在用计算机来辅助药物研究,可以缩短药物研制周期,节省经费。计算机做什么呢?主要做筛选,就是从大量化合物库中,发现有药理合性的化合物———也就是在大量化合物中,先找出来对我们治这种病有药理合性的化合物找出来。过去是靠化学实验室,靠瓶瓶罐罐试验很花时间,现在主要靠计算机进行筛选,计算机筛选速度比较快,命中率也比较高,命中率大概可以到2%24%,而过去我们在实验室进行的筛选命中率只有0.01%,就是万分之一,甚至十万分之一。高性能计算机还广泛用于基因测序、核爆试验、石油勘探、飞机设计、汽车碰撞试验等各个高新技术研究领域,有了运算速度极快的高性能计算机的鼎力相助,人们可以大大节约人力和经济成本。

  国际上有一个很有名定律,叫摩尔定律,就是微电子计算机发展速度是18个月翻一番,或者说是四年加一个数量级。

  高性能计算机的原理是从流水线上吸取灵感

  我们现在认为,高性能计算机基本上经过三个阶段:第一个阶段是高性能计算机发展的萌芽阶段,1964年到1975;第二个阶段是向量机的鼎盛阶段,1976年到1990;第三个阶段大规模并行计算机蓬勃发展阶段,1990年以后。

  萌芽阶段从1964年开始,当然究竟从哪一年开始大家还有争议,我们选了1964,是因为这一年出现了每秒钟运行100次的CDC6600。在高性能计算机发展过程中有两台机器很重要,一个是70年代初,CDC公司造出了STAR-100这台向量机,1974年美国人又做成了一台叫ILLIAC-4V的并行机。

  什么叫向量机?为什么向量机有这么大的好处?我简单说一说。现在我们的计算机都是用流水线来进行的,所谓流水线就是把一个一个操作分阶段进行,比如说做加法,第一你要把小数点要对齐,第二你要加法,第三你要舍入,四舍五入,第四你得要把它规格化一下,这就跟造汽车有的装轱辘有的装门一个道理。

  流水线要快有一个很重要的要求,那就是产品要一致,比如说汽车流水线你要快,你就得做一样的汽车,你做奥迪A6就都得做奥迪A6。这样,如果我负责装轱辘,车一过来我就往上一装,一撬螺丝就赶快走人。假如说这个流水不一样,一会是奥迪,下边来了桑塔纳,我还得赶快看桑塔纳的轱辘在什么地方,找半天装上,再撬螺丝,那就慢了。

  计算机也是一样,要快,也要操作一致,你要做加法,大家都做加法,你不要一会做加法,一会做减法,一会又做什么逻辑什么操作,那计算机自然就得看,先看看是做加法还是减法,看好了以后,还得在相应的地方做调整,这个动作就大大迟缓。

  向量机,通过相同分量的统一操作,可以使计算机提高近一倍的速度。向量机的好处,就在于操作统一,你比如说我做向量加,那我这一百个向量都是做加法,这就大大加快了流水速度。

  什么叫并行机?这很容易理解,一台计算机放得不够,拿两台做,两台不够,十台一百台一千台一万台,甚至于十万台,大家一块做啊!当然,也不止大家一块做这么简单,计算机相互之间有联系,我做的数据也可能他要用,你做出的数据我要用,相互之间要沟通要有信息来往,有些数据要共享。这样一来,就得有任务分配,哪些事情你做,哪些事情他做。当然,这里面还有很多具体的问题,但道理却是这个道理,就是靠它的多来提高速度成为大规模并行计算机。一般说超过一百台就叫大规模并行计算机,当然这也不是定论。

  第二个阶段,向量机的鼎盛阶段19761990年。前面说了,向量机是CDC公司做的,这个工程师叫SimonCray,中国人翻克雷,他从CDC公司跳槽出来后自己成立了克雷公司,他用了三年时间就造出了Cray1,当时高性能计算机需求很旺盛,所以很快进入市场,后来他们又把几台向量机并联起来,做出CrayXMPCrayYMP,于是向量机就迅速发展起来。不仅是美国人造,日本的富士通、日立、日本电器这三大公司也纷纷造向量机,形成了向量机的鼎盛阶段。

  在这一阶段,向量机是高性能计算机的主流产品,应该占领了当时高性能计算机90%以上的市场。

  但是,进入90年代,向量机发展达到一定的技术极限,并且难以突破,向量机面临发展瓶颈。此时,3264位微机芯片先后面世,在这样的前提下,如何才能造出更快的高性能计算机就有很大的争议。争议的结果,Cray带了一部分人离开了Cray公司,成立了一个新的Cray公司,继续做向量机。虽然Cray3后来还是造出来,但由于价格各个方面的因素很难进入市场。剩下的那一部分人就开始做并行机,靠微处理芯片做并行机,1990年以后,进入了大规模并行机蓬勃发展的阶段。这时,大规模并行计算机已经成为高性能计算机主流产品。如今,高性能计算机基本上每四年提高一个数量级,也就是每四年加一个圈,或者说是每18个月翻一番。国际上有一个很有名定律,叫摩尔定律,就是微电子计算机发展速度是18个月翻一番,或者说是四年加一个数量级。

  美国能源部研制、IBM公司制造的蓝色基因是当今世界上最快的高性能计算机,运算速度可达每秒280.6万亿次。从1996年造出每秒运行一万亿次的计算机到现在2004年的每秒280.6万亿次,发展速度惊人。

  应该说,中国已经是可以制造和应用10万亿次以上高性能计算机的国家,但是其基础部件特别是芯片,CPU芯片,国内只有少数单位能够自主研制定制系统。

  小平同志说:“中国要四个现代化不能没有巨型机”

  关于世界高性能计算机的发展,有一个说法,虽然不一定准确,说美国是强势,日本是趋缓,中印是崛起。美国在高性能计算机领域的综合发展水平,依然是全球第一,全球前500台运行最快的计算机中大约50-60%是美国的。日本的超级计算机发展趋缓,为什么?因为在20016,在榜单上他有57,2007年时过6年在榜上只有23套。为什么中国和印度是日渐崛起呢?因为2001年两个国家还榜上无名,2007年中国有13,印度有8台。所以说美国强势,日本趋缓,中印崛起。

  1978年小平同志指出:“中国要四个现代化不能没有巨型机”,1983年现在的国防科技大学,研制完成了我国的第一台巨型机———银河1型向量机巨型机,速度是每秒1亿次。1986年国家并行计算机工程技术研究中心完成群机并行的方案,从此我们不仅有向量机而且有并行机。1991年中心完成了速度10亿次的、我们国家的第一台大型规模并行计算机,因为超过了100———超过100台我们就算大规模并行计算机。上个世纪90年代,并行中心的神威机研制完成,速度3840亿次,完成时是世界领先。如今,不管神威机,银河机都具有研制每秒几十万亿次巨型机的能力。

  现在,不光是这些研究所,我们的企业、我们的大学也参与了高性能计算机的研制,像联想集团搞的深腾,浪潮集团搞的TS-10000,还有深圳星盈集团,都在做并行机。我们很多大学,像清华大学、上海大学,南开大学都在做高性能计算机。应该说,中国已经是可以制造和应用10万亿次以上高性能计算机的国家,但是在技术上,国产机器主要是集群系统,其基础部件特别是芯片,CPU芯片主要引进国外产品,国内只有少数单位能够自主研制定制系统,这是我们国家的高性能计算机的一些情况。

  多核处理器成为主流,现在将近70%多是采用的双核,今后就用多核了四核的、八核的、十六核的、三十二核的、六十四核的,核越多并行度就越高。

  每秒运行千万亿次的计算机今明两年会出现

  最后说高性能计算机的发展趋势。

  预计2008年或者2009年世界上可能就会出现千万亿次的机器,再有一个趋势就是很明显,多核处理器成为主流。前面我们讲了两核,到现在将近70%多是采用的双核,今后就用多核了,两核已经不行了,四核的、八核的、十六核的、三十二核的、六十四核的,核越多并行度就越高。我们讲发展趋势,还得讲近期一些发展趋势。从总体上来讲,计算机到一定时候应该有一个革命性的发展,那么近期有没有呢?现在还有很多东西,像量子器件、超导开关、光开关,这些用来做光计算器应该说是有发展前景的技术,特别是量子器件构成的量子计算机,大家寄予很高的期望,但是目前距离实用阶段还有很大距离,有人说是10年之后的事情,有人说是20年之后的事情。在这些革命性措施办成之前,大规模并行计算机还需要进一步的发展。现在我们国家提出要建设创新型国家,我们不要做制造大国——什么东西我们都做但是版权都是别人,我们要做制造强国——我们自行设计、自行创新,我们应该抓住机遇,迎头赶上,我想我国是有能力在高性能计算机领域赶超世界先进的水平,推动科学研究与社会进步的。

  现场答问

  问:我是计算机方面研究生,现在的研究生特别浮躁,很少能像您这样子坐下来进行研究,您对这种现象有什么看法?

  答:哎呀,这是个很难的问题,因为你们这一代跟我们那一代不一样。我们从学校出来以后,当时是祖国需要你到哪儿去,你就到哪里去,让你做什么事情,你就做什么事情,当时让我做计算机,我就做计算机了,不像你们当时是自主择业,双向选择。我觉得现在这种体制是比较合理的,当然了,现在大家的价值观是不一样的,有人希望在科学研究上做一些事情,有些人希望能够赚更多的钱,我不好批判哪一种。但是我希望你们,不管哪种价值观,至少应该包含国家的利益、国家的需求在内,尽量为国家作出更大的贡献。

  问:上个世纪中期您参与了我国第一台大型计算机104机的研究,研究如此高端的计算机是不是会遇到很多的困难,您能否能给介绍一下104是一台什么样的计算机?

  答:104机是我们国家第一台大型电子管计算器,由中国自行研制,就在北京中关村现在计算机研究所那个大楼里做的。我们对这台机器很有感情,当时确实有很多、很多激动的回忆,比如说当时是叫做大集中,不管你是哪个单位哪个学校,先到计算所集中,造一台机器。那时候的人也都还是没有本位主义,把最好队伍都集中到一块,所以很快在1959年这个国庆节之前就造出了第一台104机。当然条件还是艰苦,那时候造计算机,你像做磁鼓,没有现成的,都是土法上马,老师傅用喷漆喷,拿烙铁一个一个焊出来的。你要焊得虚不虚,还得拿工具去刮啊敲啊撞啊来检验。但那时候大家心比较齐,都希望我们国家有高性能计算机。当时我们都住在计算机所北楼的五层,反正一醒就下到机房干活,没有什么八个小时之类,这是我们最怀念的一点。

  问:高性能计算机要发展成为我们日常用的电脑有可能吗?

  答:你这个问题是个很好的问题,现在高性能计算机,很多人都认为,尽管速度越来越高,但使用起来越来越困难,所以我们为什么最后说有一个编程墙的问题,就是不仅怀疑它的编程效率能不能提高,而且越来使用越困难。现在你真的要把这种大并机用的跟一台微机那么容易,实际上还很难办到,这在目前是我们的愿望。现在很多人,不仅包括自认为是外行的你,当然还不一定,很多同行,都已经提出这样的问题,都在研究这件事情。但另一方面,从业务需要量来讲,很多人又要求计算机不断加快,既然要快,比如说它的数量就越来越大,越来越大,使用就越来越困难,所以我就只能说你提的问题是很好的问题,是给我们一个巨大的鞭策,我们应该朝此而努力。

  问:是不是我们今天用的这些电脑,跟早期某些大型计算机相比,其实速度是不是已经……:快多了。像我们的104,大型计算机,一秒钟是一万次。现在的日常使用的电脑至少一亿次。

  金怡濂1951年毕业于清华大学电机系。2002年度国家最高科技奖获得者,中国工程院院士,高性能计算机领域著名专家,是我国巨型计算机事业的开拓者之一。半个世纪以来,金怡濂作为技术开发的主要负责人,先后提出多种类型、各个时期居国内领先或国际先进水平的大型、巨型计算机系统的设计思想和技术方案,并组织科技人员共同刻苦攻关,予以实现,取得了一系列创造性、突破性的成果,为我国高性能计算机赶超世界先进水平做出了卓越贡献。

(转自:北京青年报 2008312日)

相关新闻

  • 182024.09

    金怡濂:中国巨型计算机之父

    如果您无法在线浏览此 PDF 文件,则可以下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览 或下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览 或下载此 PDF 文

  • 302016.03

    计算机系分会

    2012年12月15日,计算机科学与技术系校友会(简称系友会)正式揭牌成立,同时设立了计算机系发展基金。

  • 232017.06

    清华校友总会计算机科学与技术系分会工作办法

    第一条 本会官方名称为:清华校友总会计算机科学与技术系分会(简称:清华计算机系校友会)。第二条 本会为清华大学计算机科学与技术系(以下简称“清华计算机系”)校友自愿组成的联合性团体,为全球性、非管理性...

  • 012019.04

    揭秘“中国超算之父”金怡濂:神威太湖之光问鼎世界冠军,他让世界看到了中国速度

    早在绝大部分中国人还不知计算机为何物时,金怡濂就参与了中国第一台大型电子计算机的研制。2003年2月,金怡濂在第三届国家科学技术奖励大会上获得了最高科....

  • 042016.03

    计算机系计85班

    计算机系计85班

  • 072018.12

    高朝发:计算机与传统服装产业的跨界碰撞

    计算机系1995级校友高朝发,跨界和创新,让他得以成为名副其实的“创一代”。

  • 262023.05

    计算机系举办“园丁计划”分享会

    4月30日上午,在清华大学112周年校庆期间,计算机系在东阶教室召开了“园丁计划”分享会。清华大学计算机系主任尹霞、副系主任刘洋,计算机系陈文光教授,国家信息中心信息化和产业发展部主任、计算机系2002级博士后单志广,中科院计算所教育处处长、计算机系2008级博士后王元卓等出席了分享会。80余位研究生、博士后、校友参加了分享会。会议由计算机系研究员许斌主持。许斌主持尹霞在致辞中欢迎各位园丁校友在112周年校庆返回...

  • 202023.06

    计算机系举办香港校友日活动

    紫荆同心,携手共进。6月17日,清华大学计算机系在中国香港特别行政区举办了专场校友日活动。1952级校友、香港清华同学会副会长宗家源,1980级计算机系校友、香港科技大学首席副校长郭毅可院士,计算机系党委原书记、深圳市清华大学校友会计算机系分会会长杨士强,计算机系主任、计算机系分会会长尹霞,计算机系党委副书记、计算机系分会秘书长刘知远,副系主任李国良,校友办公室主任许斌等出席活动,近40位在港校友相聚中环,...

  • 162024.05

    计算机系举办“园丁计划”活动

    4月27日上午,计算机系“园丁计划”活动在东主楼10区103会议室举办。计算机系主任尹霞、党委副书记赵颖,1980级校友、南开大学软件学院院长张玉志,1988级校友、清华大学计算机系教授邓俊辉,2018级博士校友、北京邮电大学特聘副研究员翟建旺,2018级博士校友、香港科技大学(广州)助理教授骆昱宇,以及2010级校友、清华大学智能产业研究院(AIR)助理研究员马为之出席了活动,40余位研究生、博士生、博士后参加了活动。活动由...

  • 302024.10

    计算机系举办杭州校友日活动

    10月26日晚,计算机系在长三角地区举办了杭州校友日活动。计算机系主任、清华校友总会计算机系分会会长尹霞,清华大学浙江校友会会长、杭州清华大学校友会会长、1989级校友胡雪钢,1973级校友杨士强老师,以及计算机系党委副书记赵颖等出席活动,40余位来自长三角地区的校友们参加了活动。活动由赵颖和系友基金办公室主任许斌共同主持。胡雪钢致辞胡雪钢学长作为“东道主”热情欢迎计算机系校友们来杭相聚,他在致辞中介绍了浙...