首页| 滚动| 国内| 国际| 军事| 社会| 财经| 产经| 房产| 金融| 证券| 汽车| I T| 能源| 港澳| 台湾| 华人| 侨网| 经纬
English| 图片| 视频| 直播| 娱乐| 体育| 文化| 健康| 生活| 葡萄酒| 微视界| 演出| 专题| 理论| 新媒体| 供稿

领跑世界的指挥员:记“天河一号”“副总设计师肖立权

2019年08月22日 10:19 来源:法制日报 参与互动 

  领跑世界的指挥员记“天河一号”“

  领跑世界的指挥员

  记“天河一号”“天河二号”副总设计师肖立权

  □ 本报记者   廉颖婷

  □ 本报通讯员 刘于蓝

  仲夏时节,湘江之畔的国防科技大学已进入暑期。校园里人影稀疏,不复往日热闹。

  矗立在东北方向的天河大楼里,机房内长达数十米的机箱整齐排列着,指示灯明暗交错,高速运转的机箱发出低沉的嗡嗡声。这就是我国六度称雄全球超级计算机500强榜单,让中国速度震惊世界的“天河二号”。

  此时,“天河二号”副总设计师、国防科技大学计算机学院计算机研究所所长肖立权,正带领着团队攻关新一代高性能计算机。正是他们,吹响了向新的中国速度发起冲锋的集结号。

  无惧挑战解决技术难题

  1997年,肖立权博士毕业留校后,成为国防科技大学计算机学院计算机研究所的一名科研人员。从那时起,他就与巨型机一起成长,参与了“银河”“天河”高性能计算机多代机型的研制,从一名普通的科研人员,一步步成长为今天国防科技大学超级计算机团队的核心骨干。

  “走别人没走过的路太难,但我喜欢挑战。”这是肖立权在接受采访时常挂在嘴边的一句话。

  上个世纪末,大规模计算机系统中通常采用的电互联技术传输速率低,且易受干扰,极大影响了系统的稳定性,成为我国研制千万亿次级超级计算机路上的一块绊脚石。

  如何搬开这块绊脚石?用光互联替代电互联是最优解,于是,研究所将这一任务交给了肖立权。

  这是一条别人没有走过的路,注定充满了荆棘和坎坷。

  2003年受领任务后,肖立权立即将科研准星瞄向了这一技术难题。然而,按照自己思路做出来的系统根本跑不起来。

  哪里出了问题?

  那个夏天,肖立权满脑子都在问为什么。就连午休闭上眼睛,他脑海里都是屏幕上滚动的实验数据。

  “没法睡,去实验室。”肖立权翻身而起,穿好衣服就往实验室跑。

  架起示波器、逻辑分析仪,他全神贯注地观察着,生怕一眨眼就错过了关键数据。

  解决的思路一次次提出,却又一次次被推翻。

  某天,正在做实验的肖立权突然冒出一个想法:是不是数据传输有问题?灵光乍现后,他找到了解决问题的钥匙,随即逆向思维反推,最终找到症结所在。

  这一刻,我国光互联技术在大规模计算机系统中得到有效验证,为后续这一技术在超级计算机系统中的应用奠定了坚实基础。

  此后,肖立权马不停蹄,瞄准这一技术领域,拿下了一个又一个拦路虎,解决了光互联替代电互联的系列技术难题,成功研制出我国首台采用光互联技术的并行计算机互联通信系统。传输速率从原有的400Mbps一路飙升为10Gbps,实现数量级飞跃。

  艰难闯关问鼎世界桂冠

  2010年11月,“天河一号”凭借优异性能登上世界超级计算机500强榜首,中国超级计算机首次问鼎世界桂冠,五星红旗飘扬世界之巅。

  2013年6月,“天河二号”以峰值运算速度每秒5.49亿亿次,持续计算速度每秒3.39亿亿次,轻松摘得世界超级计算机500强桂冠,我国超级计算机研制达到世界领先水平。习近平主席专门对“天河二号”研制成功作出重要批示。

  2013年11月,“天河二号”蝉联世界超级计算机500强榜首;

  2015年11月,“天河二号”六次问鼎世界超级计算机500强,中国速度继续领跑世界。

  作为“天河一号”“天河二号”的副总设计师,这些耀眼成绩的背后,是肖立权瞄准世界高性能计算机技术前沿,不懈探索创新的丰硕成果。

  高速互联通信是决定大规模并行计算机系统实用效率的关键,美国对中国严格封锁高速互联技术转让。当时,“天河一号”在国内首次创新性地采用了CPU+GPU异构融合体系架构,其内部数万个CPU和GPU需要通过互联通信系统实现信息交换,难度可想而知,组织并全面负责互联通信系统自主设计研制任务的肖立权倍感压力。

  寒来暑往,他不仅协助制定系统的总体技术方案、技术路线和设计指导原则,而且经常泡在试验一线,从原理验证到工程实践,一个环节都不放过。团队在他的带领下,开展关键技术、核心技术攻关,迅速打响了一场没有硝烟的战斗,成功将“天河一号”送上世界超级计算机第一的宝座。

  在大家眼里,肖立权是名副其实的拼命三郎。可用他自己的话说,和地下银河团队那些为了银河事业而牺牲奉献的先辈先烈相比,这算不了什么。

  自主创新攻克世界难题

  短暂的喜悦过后,肖立权又开始了紧张的工作,他早已将目标瞄准了运算速度更快的亿亿次超级计算机系统——“天河二号”。

  在原有基础上,他带领团队进行封闭攻关,“天河二号”高速互联通信系统性能得到提升,是当时国际商用互联系统的两倍。它可以把上万颗微处理器联系起来,共同解决同一个计算问题,解决了高效互联中微处理器越多效能越低的世界难题。

  研制“天河二号”期间,由于时间紧任务重,在接近1000天的研制周期中,肖立权只在两个春节各休息了3天。

  对于肖立权来说,这就是他的战场,他既要当项目指挥者,又要做一线战斗员。

  攻关关键期,肖立权带领所在团队采取三班倒方式夜以继日进行奋战,自己每天连续工作十几个小时以上,身体屡亮黄灯却无暇顾及。

  在这条自主创新的道路上,肖立权带领项目组在校外进行了长达一年的封闭设计工作,自主研制出互联通信系统最核心的两块芯片:路由器和网络接口。

  一台超级计算机系统好比一个大城市,互联通信系统就是城市的公路网,路由器就是立交桥,网络接口就是主干道出入口。一个城市公路网市政设施建设得再好,立交桥和主干道出入口不设计好,城市交通依然拥挤不堪。

  依靠自主创新,掌握了属于自己的核心关键技术,这是“天河二号”在发展迅猛、竞争激烈的世界超级计算机领域长时间保持领先地位的主要原因。

  正如国际TOP500主要撰稿人杰克·唐加拉所说:“中国自主研发了内部互联技术,这是买不来的,这是他们基于芯片、路由器及自主生产的交换器开发出来的。”

  “我们参加世界排名并不仅仅是为了第一。世界超算500强榜单其实是一个交流平台,只有在国际上有了声誉,别人才愿意和我们交流。”肖立权深知,只有自立自强,掌握自主核心关键技术,才能在国际上掌握发言权,让世界听到来自中国的声音,让中国更好的了解国际前沿发展趋势。

  作为计算机研究所领导,肖立权始终把人才培养作为科学研究的重中之重。在所内实施青年骨干培养计划,制定优秀人才个性化培养方案,让10多名年轻博士担任分系统设计师,组织一线骨干留学考察。

  目前,这个所入选国家和军队人才培养工程对象等高奖项的有38人次,平均年龄不到40岁。

  担任博士生导师和硕士生导师以来,肖立权累计指导博士生8名,硕士生15名。根据学生不同兴趣和爱好,在高性能计算机体系结构、高速互联网络结构、光互联与交换、深亚微米ASIC设计等方面,他以自身积累的深厚理论基础和丰富的实践经验为基础,引导学生广泛参与工程实践活动,在实践中培养学生的创新和科研攻关能力。

  眼下的这个暑假,对肖立权来说并不存在,他正忙着带领团队全力投入到新一代高性能计算机的研制攻关中。

  肖立权的目标,是摘取超级计算机的下一顶皇冠。

  图为肖立权(中)与团队科研工作者交流“天河二号”相关技术点。  欧阳登轶 摄

【编辑:梁静】

>国内新闻精选:

本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
[网上传播视听节目许可证(0106168)] [京ICP证040655号] [京公网安备:110102003042-1] [京ICP备05004340号-1] 总机:86-10-87826688

Copyright ©1999-2024 chinanews.com. All Rights Reserved