小代君說
近日,浙江之江實驗室在杭州舉行021科學基礎模型創新合作大會,首次全面展示021科學基礎模型及系列領域科學模型研發進展。
據悉,021模型構筑形成跨學科知識、跨領域推理、跨語言理解(覆蓋204種語言)三大基石,具備出色的科學推理能力,能夠深入分析、推導、驗證多類科學問題。
“語言所表達的維度,遠遠低于科學所需表達的維度。”之江實驗室科學模型總體部技術總師薛貴榮認為,科學數據涵蓋時間、空間、能量等多個維度,是對復雜物理系統演變規律的高維表征。為解決科學問題,科學界需要突破語言空間的局限,研發科學基礎模型,構建“科學空間+語言空間”于一體的更高維空間,建立跨學科數據之間的深層連接,變革科學研究范式。
對此,之江實驗室研發團隊探索將科學數據和文本語料編碼到統一的高維空間,讓模型能夠識別、處理科學數據,認識并解決復雜科學問題。經過近萬次實驗,團隊形成了模型訓練框架,包括預訓練、后訓練、強化學習等,并完成了2360億參數規模的021科學基礎模型訓練。
目前,021模型已服務地球科學、天文學、生命科學、材料科學等多個領域,成為打破學科邊界、激發創新思維的“科研伙伴”。








