超級計算機背后的年輕人:“中國超算團”SC15奪冠


  當運行了48小時的計算機關機時,裘捷中鬆了一口氣。“應該是前三。”這個21歲的中國小伙子既有信心又不太確定,畢竟這一次,他和小伙伴參加的大賽稱得上“全球最頂尖”。

  結果,當地時間11月19日,在美國得克薩斯州國際大學生超級計算機競賽(SC15)頒獎現場,來自清華大學的超算團隊,捧回了冠軍獎牌。

  “不僅是頒發一枚獎章……它為這個行業未來幾年的發展定下了目標,也是對中青年研究者最好的激勵。”美國阿拉貢國家實驗室一位高級計算機專家為獲獎者致辭。

  在此之前,這支由清華大學計算機科學與技術系大三、大四學生組成的團隊,已經摘得了世界大學生超級計算機領域另兩項大賽的頭名。

  集齊“超算三大賽事”冠軍的小伙子們平均年齡還不到21歲,就連他們的指導老師,也是一位5年前才博士畢業的年輕人。

  我們搭建的其實就是簡易版的天河二號

  在清華大學東主樓一間裝飾簡單的會議室裡,南征北戰的世界冠軍們坐在桌邊。他們面前的桌子凌亂不堪,堆著線材、硬盤、音響和一台游戲機。幾瓶喝了一半的礦泉水隨意地丟在桌面上。

  裘捷中是隊長。從今年5月SC15公布題目到11月大賽結束,有些隊員已經忙活了150多天。

  這位隊長看起來並不善於交流。他圓圓的臉龐上稚氣未脫,手裡來回捏著一隻橄欖球玩具。聽見不感興趣的話題,他就打開筆記本電腦,在鍵盤上敲擊一番。

  隻有提起超級計算機,他才會放下手中的玩具,挺直身板兒,有時還激動地邊比劃邊說。

  即使在新概念層出不窮的IT領域,也沒什麼能比得上蘊藏著巨大前景的超級計算機。

  不久前,人們剛被世界上運算速度最快的 “天河二號”震撼,今年8月,美國總統奧巴馬就發布行政命令,要求在2025年建成世界上第一台百億億級超級計算機——每秒100億億次計算,遠超過天河二號的每秒5.49億億次。

  美國《商業周刊》網站曾發表文章稱:“在過去的10年裡,中國和美國一直在爭奪超級計算機的領先地位。而這一趨勢似乎仍在繼續。”

  越來越多的年輕人被“卷“進這場“競賽”中。

  剛剛結束的SC15是一年一度美國超級計算年會的一部分。目前,這項創辦於1988年的盛會是世界上規模和影響力最大的。從2000年開始,大學生參與成了年會上的固定項目,“許多美國的傳統強隊都會參加。”

  “這對我們這個行業很重要。”本屆超算年會主席杰克·柯恩表示。

  除此之外,團隊的指導老師、清華大學計算機系助理研究員翟季冬告訴中國青年報記者,被冠以世界或國際之名的三大超級計算機競賽,分別在亞洲、歐洲和美國舉行,除了SC,還有由亞洲發起主辦的世界大學生超級計算機競賽(ASC)和歐洲的國際大學生超算競賽(ISC)。

  在踏上美國之旅前,清華大學這支隊伍拿了三屆ASC冠軍和兩屆ISC冠軍。在5月18日舉行的ASC比賽中,他們挑戰的題目涉及國際大科學工程平方公裡陣列望遠鏡(SKA)的數據處理軟件。

  SKA是全球最大的“大數據”項目,其中最復雜的過程之一就是數據處理。在超算領域,這被稱為“宇宙級難題”。科學家希望通過那些參賽者的年輕大腦,對這一難題進行優化。

  “簡單地說,我們搭建的就是個簡易版的天河二號。”超算團隊的成員之一王邈說,“當然要簡陋得多。”

  讓程序跑得更快,也是為人類研究、對抗疾病做了一點貢獻

  沒人說得清,首次參加SC15的決定是怎麼作出的。裘捷中只是輕描淡寫地回憶,老師當時說“今年可以試試這個比賽”。

  在指導教師翟季冬看來,這些本科生有著豐富的國際交流經驗,除了顯眼的黑頭發,他們和其他國家同齡人沒什麼區別。

  比賽現場設在頂級的會議中心,年輕人穿著簡單的T恤衫,脖子上挂著U型枕頭,頭也不抬地在電腦前忙碌。從學術機構或公司趕來參會的業內人士,有時會在那些放置著各種外套和線纜的桌子前駐足,好奇地詢問他們搭建的簡易超級計算機如何運行。

  夜深人靜時,人群從會場離開,隻有點亮的屏幕和嗡嗡作響的機器陪伴這些“刷夜”的年輕人。

  今年夏天,SC15組委會公布了比賽的5個應用程序,內容涵蓋天氣預測、量子力學、生物基因以及人口流動等多個實際應用問題。賽前,參賽選手要優化每一個程序。在比賽現場,誰的程序在保証結果准確的前提下跑得最快,就有可能獲得高分。

  “普遍意義上來說,超算是由成千上萬台高性能計算機通過高速互聯網絡組成的大規模計算機集群。”超算團隊隊員卓有為介紹,“對於研究超算的人來說,怎麼樣讓機器跑得更快,怎麼樣更省能源,本身就是他們的目標。”

  對於這些本科生來說,從氣候到生物,幾乎都是全新的領域。在開始敲代碼之前,他們不得不先去請教其他專業的同學或老師。

  在參加比賽的6人中,隊員梁俊邦分到的題目是模擬計算傳染病傳播的過程。他“吃飯也想,睡覺也想,實在不行就打幾個小時游戲再接著想”,最終找到已被廣泛運用的程序中的一個運算瓶頸,突破之后,“加速10%左右”。

  “這讓人類對疾病的了解更加深刻了。我們讓程序跑得更快,也是為人類研究和對抗疾病做出了一點貢獻吧。”梁俊邦說。

  在另一名成員魯逸沁看來,“這個團隊沒有系統的學習過程,能力不可能靠老師一步步教,第一是興趣,第二是專業基礎,第三就是自覺自學。”

  雖然大學裡才正式開始學習計算機,但從高中甚至初中開始,以0和1為基礎的代碼就把這群男生迷得神魂顛倒。

  高中時,梁俊邦曾把稀奇古怪的代碼輸入電腦,“召喚”出一句“Hello World”(世界你好),那高興勁兒他至今難忘。

  2012年隊伍剛成立時,主要是高性能計算研究所的學生報名參加,后來,人漸漸多了。

  “我們都是到宿舍拉人!”隊長裘捷中說,“標准就是在學有余力的前提下看誰更靠譜。”

  《高性能計算導論》課,幾乎是這些本科生在學業中能夠接觸到的關於超級計算機的全部知識,剩下不少內容都要靠互聯網提供。

  有些人加入這個團隊,是因為聽說“他們很厲害”,但真正加入之后,才發現“根本聽不懂討論”。

  找同學詢問、泡圖書館、看論文……隊員們幾乎把所有課余時間都用來儲備專業知識。每周大家都會聚在一起討論。

  熬夜是“家常便飯”,但對於這些90后男孩兒來說“不算啥”。在他們看來,超算設備昂貴,自己能用一用,就“挺有意思挺牛掰”。

  參加比賽是一個挑戰自我的過程,但更重要的是成長

  直到走進賽場,負責設備搭建的王邈才算開了眼界——其他國家不僅都帶有備用設備,在超級計算機的浮點性能方面,“我們也並不佔優勢”。

  更讓人緊張的是,由於贊助商的原因,距離比賽不到24個小時,團隊才拿到連接8台機器的網絡通信系統。而對於超級計算機比賽來說,程序必須聯機運行調試,才能達到最優效果。

  翟季冬起初並沒有想到,在比賽現場,這些小伙子表現異常出色。

  為了使比賽公平,主辦方要求參賽隊員搭建的超級計算機總功率不能超過3120瓦。帶著各種先進機器的超算團隊,必須在保証程序運行盡可能快的同時,想辦法限制功耗。

  “我發現我們團隊的功率幾乎一直都貼著警戒線。”翟季冬回憶,“這就要求隊員一方面對程序非常熟悉,知道何時會出現使用機器的高峰,另一方面知道有效的指令,降低機器功率。”

  比賽要求所有指導老師離場,但由於沒有切斷網絡,場外求助其實並不難。翟季冬幾次試圖問學生們有什麼困難時,都被回絕了。

  “沒有誰比我們更了解這些機器。”他們至今自信滿滿。

  在比賽現場,每支隊伍頭頂都有一盞警報燈,當機器超過額定功率時會進行提示。並沒有人因此緊張,監控程序運行的間隙,來自世界各地的年輕人跨越主辦方架在不同隊伍之間的欄杆,從編程心得到美食旅游,什麼都聊。

  按照比賽規則,機器要保持48小時不停運轉,6個人就輪流值班看著機器,監控硬件的王邈幾乎兩天兩夜沒回賓館,困了就往沙發上一躺,餓了就啃兩口會場提供的漢堡,以至於后來“一聞到那股味道就惡心”。

  比賽接近尾聲時,一台機器的內存條壞了,可直到修好,王邈才給老師發短信,告訴他機器壞了,緊接著發了一條“但是我已經搞定”。

  “這些斬獲大獎的同學,都有自己的夢想並執著實現它們。”在最近的一次學校活動中,清華大學校長邱勇說,“參加比賽是一個挑戰自我的過程,但更重要的是過程中的成長與收獲。”

  如今,曾經在領獎台上把獎牌奮力舉起的隊長馬上就要變成計算機系的直博生,相比於下一次超算大賽,他更關心的是“博士期間的工作和研究”。對於其他同學來說,超算也並不是他們繼續學習的方向。一回到學校,這些年輕人又迅速地被畢業論文、實習、出國申請等事務包圍。

  但他們依然清楚記得比賽的點滴和得知獲獎的那一刻。一群小伙子不顧會場的安靜,突然大叫起來,還特意搓了一頓得州烤肉作為慶祝。他們也沒有忘記,回國后隊長還欠他們一次慶功宴,至今沒來得及組織。




回最頂