衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
(相關資料圖)
“第一次,高校擁有了和科技巨頭一樣的計算能力。”
說這句話的人是中國工程院院士、阿里云創始人王堅。
他口中讓高校計算能力倍增的,是復旦大學剛剛發布的云上科研智算平臺。
名為 CFFF (Computing for the Future at Fudan) ,由復旦、阿里云、中國電信等共同打造,以公共云模式提供超千卡并行智能計算,支持千億參數的大模型訓練。
這是目前國內高校最大的云上科研智算平臺——67年前,我國第一架電子計算機 (復旦601型電子積分機,1956年) 誕生在復旦;67年后,復旦再次走在前列。
目前,首個基于CFFF平臺訓練的科學大模型成果已經對外正式發布, 45億參數的中短期天氣預報大模型可一日訓完 。
組成CFFF平臺的兩個計算集群,一個名為“近思”一號,一個名為“切問”一號。
兩個名字都從復旦校訓“博學而篤志,切問而近思”中采擷而來。
發布會上,首屆世界科學智能大賽也正式啟動,設置5大前沿研究賽道,賽題基于CFFF平臺而來,目的是推動科學大模型落地。
CFFF是什么?
CFFF平臺,全稱Computing for the Future at Fudan。
這個名字被王堅解讀為“計算,因為在復旦而創造了未來”。
兩個計算集群共同組成了CFFF平臺——
一個是面向高精尖研究的專用高性能計算集群 “近思”一號 ,部署部署在復旦江灣校區;
另一個是面向多學科融合創新的AI for Science智能計算集群 “切問”一號 ,托管在1500公里外的內蒙古阿里云烏蘭察布數據中心。
兩者分隔千里,但同聲相應。
復旦大學浩清教授、人工智能創新與產業研究院院長漆遠對CFFF平臺做了進一步介紹。
據他講述,基于百G高速數據傳輸網、阿里云大規模異構算力融合調度技術、分級存儲技術、AI與大數據一體化技術,兩個計算集群練成了一臺真正意義上的“超級計算機”。
何以見得?
最直觀的表現,復旦大學四校區的所有實驗設備都能高速接入CFFF平臺,做到異構算力統一管理,計算任務統一調度,滿足不同應用場景下的科學智能研究與應用需求。
此外,CFFF平臺還擁有 國內高校最大規模的多級數據冷熱分層存儲集群 ,解決了海量科研數據無法長期備份的痛點,并支持云上高速傳輸。
舉個例子,以往PB級科研數據從復旦校內傳到西部數據中心需要兩周,如今當天就能完成。
有賴于公共云模式,跑在CFFF平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。
同時,CFFF平臺可實現年平均PUE小于1.2,每年節省總電力超過2000兆瓦時,年均節碳量達1500噸。
可以說是非常低碳了。
復旦校方透露道,CFFF平臺從開始建設的第一天起,就收到來自復旦不同院系的多種研究需求,如生命科學、大氣科學、材料科學領域,以及金融系統分析等社會科學研究領域。
平臺上的云原生與低代碼工程化AI開發平臺,進一步降低了AI與科研融合的門檻。
目前,CFFF平臺上的第一個科研成果已經誕生,并正式對外發布。
成果是 45億參數量的中短期天氣預報大模型 ,來自復旦人工智能創新與產業研究院李昊團隊。
在公開數據集上,該模型預測效果首次達到業界公認的ECMWF (歐洲中期天氣預報中心) 集合平均水平,并將 預測速度從原來的小時級縮短到了3秒內 。
而這樣一個45億參數的大模型,在CFFF平臺上完成訓練, 用時只需1天 。
中國科學院院士、復旦大學校長金力在現場提到:
CFFF設計成了開放的體系,我們非常歡迎產學研創新以及校企合作。但是從另一點來說,CFFF的建立表面上來看是解決算力問題,實際上不完全是。
它還必須解決兩件事情, 一是 “讓原來不會用AI工具的人,去用最好的AI工具”, 二是 “讓原來不懂AI的人去懂AI”。
7名院士擔任顧問,大賽7月25日開賽
“當前,AIforScience成為熱點領域。”金力將CFFF稱為復旦推動基礎研究范式變革中的關鍵利器,“AI與科學的融合發展,開拓了科研的新范式。”
CFFF平臺啟動儀式現場, 首屆世界科學智能大賽 也宣布啟動。
從現場獲悉,大賽由復旦聯合阿里云天池平臺、中國電信、中國信通院云大所等舉辦。
面向全球開放,擬邀請全球五大洲數千支隊伍參賽,選手不限國籍年齡,高校、科研機構、企業、個人均可自由組隊。
包括金力 (生命科學家) 、王堅 (云計算專家) 在內, 共有7名院士擔任本次大賽的顧問 。
共設置5大賽道,分別是生命科學、大氣科學、材料科學、流體力學、量子化學,賽題基于CFFF平臺設計。
其中, 生命科學賽道 ,以生物學年齡評價與老年病風險預測為賽題,通過測量和分析生物體內特定指標或生理過程的狀態,評估個體的生理年齡和健康狀況。
大賽為參賽者開放了近萬樣本的個體甲基化數據以及其年齡、性別及老年病患病信息,期望參賽者能夠基于甲基化測量對健康個體的年齡給出準確的預測。
而 材料科學賽道 ,以MOF材料的預測合成為切入點,探求計算成本更低、更高效、更精確的求解方法。
大賽整理了大量文獻等,形成了1500種MOF材料的合成條件數據集,期待參賽選手基于此建立預測模型,準確地預測MOF材料的合成條件。
賽程顯示,7月25日大賽初賽開啟,9月底,各賽道分批開啟復賽。
遴選出的優秀隊伍將在11月進行線下答辯,角逐最終名次。
大賽設置100萬元的獎金池,各賽道冠軍獎金10萬元。
所有進入復賽的選手都將獲得CFFF平臺算力免費支持。此外,阿里云也將提供了ML平臺PAI的免費試用,及算力產品計算資源。
大賽網站: https://tianchi.aliyun.com/2023CFFFPrize
— 完 —
量子位 QbitAI · 頭條號簽
關注我們,第一時間獲知前沿科技動態
關鍵詞: